Documento 13 Groceries Dataset
Usando el dataset con nombre Groceries72 que se encuentra en el CV, contesta a las siguientes preguntas:
Extrae las reglas de asociación con soporte 0.001 y confianza 0.6. Introduce el número de reglas obtenidas.
## Apriori
##
## Parameter specification:
## confidence minval smax arem aval originalSupport maxtime support minlen
## 0.6 0.1 1 none FALSE TRUE 5 0.001 1
## maxlen target ext
## 10 rules FALSE
##
## Algorithmic control:
## filter tree heap memopt load sort verbose
## 0.1 TRUE TRUE FALSE TRUE 2 TRUE
##
## Absolute minimum support count: 7
##
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[169 item(s), 7081 transaction(s)] done [0.00s].
## sorting and recoding items ... [154 item(s)] done [0.00s].
## creating transaction tree ... done [0.00s].
## checking subsets of size 1 2 3 4 5 6 done [0.02s].
## writing ... [3182 rule(s)] done [0.00s].
## creating S4 object ... done [0.00s].
## set of 3182 rules
¿Qué confianza tiene la regla número 657?
## lhs rhs support confidence lift count
## [1] {fruit/vegetable juice,
## ham,
## processed cheese} => {whole milk} 0.001271007 0.9 3.520939 9
## [1] 0.9
Si ordenas las reglas por confianza, introduce los atributos de la parte izquierda (sin comillas ni llaves, un SOLO espacio en blanco separando dos atributos).
Filtra las reglas con confianza mayor que 0.7 y las guardas en una variable rules2. Ordena estas reglas por lift e introduce el soporte de la primera regla (la más importante teniendo en cuenta el lift).
rules2 <- subset(r1, subset = (confidence > 0.7))
rules2 <- sort(rules2, by="lift")
inspect(rules2[1])
## lhs rhs support confidence lift count
## [1] {hard cheese,
## whipped/sour cream,
## whole milk,
## yogurt} => {butter} 0.001129784 0.8888889 16.3912 8
## [1] 0.001129784