Documento 13 Groceries Dataset

Usando el dataset con nombre Groceries72 que se encuentra en el CV, contesta a las siguientes preguntas:

library(arules)

groc <- read.transactions("datasets/Groceries72", header = FALSE)

Extrae las reglas de asociación con soporte 0.001 y confianza 0.6. Introduce el número de reglas obtenidas.

r1 <- apriori(groc, parameter=list(support=0.001, confidence=0.6))
## Apriori
## 
## Parameter specification:
##  confidence minval smax arem  aval originalSupport maxtime support minlen
##         0.6    0.1    1 none FALSE            TRUE       5   0.001      1
##  maxlen target   ext
##      10  rules FALSE
## 
## Algorithmic control:
##  filter tree heap memopt load sort verbose
##     0.1 TRUE TRUE  FALSE TRUE    2    TRUE
## 
## Absolute minimum support count: 7 
## 
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[169 item(s), 7081 transaction(s)] done [0.00s].
## sorting and recoding items ... [154 item(s)] done [0.00s].
## creating transaction tree ... done [0.00s].
## checking subsets of size 1 2 3 4 5 6 done [0.02s].
## writing ... [3182 rule(s)] done [0.00s].
## creating S4 object  ... done [0.00s].
r1
## set of 3182 rules

¿Qué confianza tiene la regla número 657?

inspect(r1[657])
##     lhs                        rhs              support confidence     lift count
## [1] {fruit/vegetable juice,                                                      
##      ham,                                                                        
##      processed cheese}      => {whole milk} 0.001271007        0.9 3.520939     9
quality(r1[657])$confidence
## [1] 0.9

Si ordenas las reglas por confianza, introduce los atributos de la parte izquierda (sin comillas ni llaves, un SOLO espacio en blanco separando dos atributos).

rules.ord <- sort(r1, by="confidence")

Filtra las reglas con confianza mayor que 0.7 y las guardas en una variable rules2. Ordena estas reglas por lift e introduce el soporte de la primera regla (la más importante teniendo en cuenta el lift).

rules2 <- subset(r1, subset = (confidence > 0.7))
rules2 <- sort(rules2, by="lift")
inspect(rules2[1])
##     lhs                     rhs          support confidence    lift count
## [1] {hard cheese,                                                        
##      whipped/sour cream,                                                 
##      whole milk,                                                         
##      yogurt}             => {butter} 0.001129784  0.8888889 16.3912     8
quality(rules2[1])$support
## [1] 0.001129784