SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
Aprendizaje de Reglas para un
        SR contextual



                          Blanca A. Vargas Govea
                     blanca.vargas@cenidet.edu.mx
              Grupo de Sistemas de Recomendación
                                          cenidet
                                    Feb 16, 2012
Contenido


                          Surfeous
  1     Antecedentes
                          Evaluación

  2     Metodología para el aprendizaje de reglas


  3     Selección de atributos


  4     Preparación de datos

                                                2
Surfeous: prototipo de SR
       usuario              enfoque contextual   [1]




   buscando restaurante


   enfoque social
      opiniones




                                                 3
     ratings y tags
Surfeous: modelos de contexto
        formalidad                        latitud     dirección        ciudad
  transportación        presupuesto
                                         país       fax      alcohol
fumador        alcohol     cocina
                                                    cocina        zona-fumar
  ambiente                  interés      ZIP
               latitud
                                                                   servicios
 edad
           usuario           pago          costo
                                                      item
   hijos                                                            teléfono
           estatura           peso       ambiente         horas
longitud
                                                                    estado
                                         tipo-de-pago
personalidad         estado-civil

             religión                    días       estacionamiento
                         accesibilidad
  ocupación                               accesibilidad            franquicia
                 color-favorito
                                                          formalidad
                                                                             4
Evaluación: metodología



         Básica
                          Popularidad ítem

                          Usuarios con más ratings
          Por grupos
                          Usuarios con menos ratings

                          Distribución usuario-ítem

         Selección de atributos

                                                      5
Evaluación: resultados

     0.4
original
                social
                         0.335
                                 fusión
                                          0.278
                                                  contexto
                                                             0.133
atributos-sel            0.335            0.327              0.133
 0.35                                                                           La evaluación
    0.3                                                                         más baja se
 0.25                                                                           obtiene en el
                                                                     social     enfoque
    0.2
                                                                     fusión     contextual
 0.15
                                                                     contexto
    0.1

 0.05

        0
                   original               atributos-sel                                       6
¿Por qué es bajo? ¿Qué ocurre con las reglas?

 ¿Sobreajuste?
      Si
         es roja, redonda, de 5cm de 
         diámetro
         y es jaspeada en el 20% de su
          superficie 
      entonces 
         es una manzana

 ¿Demasiado generales?
      Si
         es roja
      entonces 
         es una manzana
                                                7
Ejemplo de reglas




                    8
¿Entonces?



 Se necesita un conjunto de reglas que describa
 los datos sin sobre-ajuste ni extrema
 generalización




             Aprendizaje de Reglas

                                                  9
Metodología

                                 modelo del usuario
         Selección de
                                 modelo del ítem
         atributos
                                 con ambos modelos


         Preparación de datos para el aprendizaje
               Análisis del estado actual de las reglas

         Aprendizaje automático usando ILP


         Prueba de reglas aprendidas

                                                          10
Selección de atributos




                         11
¿Para qué sirve?
                                           [2]
                   Mejorar el desempeño
                   predictivo


                   Construir modelos más
  Selección de     eficientes
    atributos

                   Mejorar el entendimiento
                   de los modelos
                                           12
Selección de atributos: proceso
                          forward/backward
                          búsqueda: hill-climbing, best-first,...
   Generación de
    sub-conjuntos     sub-conjunto                  chi-cuadrada, ganan-
                                                    cia de información,
                                       Métrica      clasificador, consisten-
                    Evaluación de
                                                   cia
                    sub-conjuntos     filtro/wrapper

          no


                                        si
                       Criterio                   Validación de
                        de paro                     resultados
         Umbral
         No. de atributos seleccionados                                13
         Que no mejore la evaluación
Las Vegas Filter: criterio de inconsistencia
                                               [3]
               Conteo de inconsistencia

               IC s ( A)=S ( A)−max S k ( A)
                                     k




               Valor de inconsistencia

                          ∑ A∈S IC S ( A)
               IR( S )=
                               ∣S∣

                                               14
Ejemplo


          área   costo   franquicia   fumar   Rating A Rating B
     1       i   bajo        n          s        0        0
     2       i   bajo        n          s        1        0
     3       i   bajo        n          s        2        0
     4       i   bajo        n          s        1        1
     5       i   alto        n         n         0        1
     6       i   alto        n         n         1        1
     7       i   alto        n         n         2        1
     8       e   alto        s         n         1        1
     9       e   bajo        n         n         1        1
     10      e   bajo        n          s        2        2
                                                                  15
Ejemplo


 Sub-conjunto A                         Sub-conjunto B
 Instancias iguales: 1,2,3,4            Instancias iguales: 1,2,3,4
 n=4, clases=0,1,2,1                    n=4, clases=0,0,0,1
 clase frecuente=1 (2 instancias)       clase frecuente=0 (3 instancias)
 Conteo de inconsistencia (IC): 4-2=2   Conteo de inconsistencia (IC): 4-3=1

 Instancias iguales: 5,6,7              Instancias iguales: 5,6,7
 N=3, clases= 0,1,2                     N=3, clases= 1,1,1
 clase frecuente=1 (1 instancia)        clase frecuente=1 (3 instancias)
 Conteo de inconsistencia (IC): 3-1=2   Conteo de inconsistencia (IC): 3-3=0

 Valor de Inconsistencia:               Valor de Inconsistencia:
 (2+2)/10 = 4/10 = 0.4                  (1+0)/10 = 1/10 = 0.1

                                                                           16
Descripción de los datos: Surfeous

                              1,160
         130
                            ratings
     restaurantes
                                          138
                                        usuarios
       0,1,2
    valores de
      rating
                                           8.41
                        115
                                      ratings/usuario
                    restaurantes
                    con 1 rating
                                                        17
¿Cómo se hizo?

 Selección de atributos para:                           [4]

     Modelo del usuario

     Modelo del servicio

     Modelo del usuario + Modelo del servicio




                                                        18
                 http://www.cs.waikato.ac.nz/ml/weka/
Preparación de datos
                       user­cuisine       user­payment
  usuario

user­profile




 Clase                  user­attributes




                                                         19
Preparación de datos

          Para el modelo de servicio se efectuó
          un proceso similar.

                            Selección de
  usuario
                              atributos



                            Selección de
   ítem                       atributos



   usuario                  Selección de
      +                       atributos

    ítem
                                                  20
Cada archivo es la entrada a WEKA




                                    21
WEKA




       22
WEKA




       23
Resultados
  usuario                                   ítem
  interés   edad                            tipo-de-pago      horas
                    cocina
  color-favorito                                       días
                     80.95%                                   86.96%



            usuario + ítem

             edad     religión    alcohol   zona-fumar    horas

             color-favorito      interés     alcohol     cocina

             formalidad          cocina
                                                         75.00%
                                                                       24
Preparación de datos




                       25
Preparación de datos para el aprendizaje

 Objetivos



 Obtener los elementos necesarios para el aprendizaje
 automático: reglas prototipo, conocimiento del dominio e
 instancias aterrizadas.


 Preparar una plataforma de prueba de reglas.




                                                            26
Preparación de datos para el aprendizaje
                           <regla nombre="fumatrue1">
                                  <antecedente>Restaurant(?r) ^ 
 Reglas                           IDPlace(?r,?id) 
                           ^....</antecedente>
 Formato RDF                      <consecuente>
                           sqwrl:selectDistinct(?id)</consecuente>
                                  <tipo>2</tipo>
                              </regla>

                           usuariofuma(Restaurant,User):­
 Predicados                   atom_chars(Msg,"Regla1n"),
 Prolog                       write(Msg),
                              permiteFumar(Restaurant,"section"),
                              esFumador(User,true).

                           permiteFumar(Item,Algo)
 Extracción de             tieneFormalidad(Item,Algo)
 literales (condiciones)   ofreceServicio(Item,Algo)
                           sirveAlimento(Item,Algo)
                           esFranquicia(Item,Algo)

 Instanciar las            esFumador("AAAM",false).
                           esFumador("aguilar",false).
 condiciones con los       esFumador("agusperez",false).
                                                                27
 valores de atributos
Preparación de datos para el aprendizaje

   Ya se tiene
   Plataforma para prueba de reglas

   Predicados correspondientes a atributos (condiciones)


   En proceso
   Análisis de las reglas originales

        Reglas muy generales, producen varios resultados
        por tipo de regla (fumador, estudiante, …)

                                                           28
Lo que sigue

                                 modelo del usuario
         Selección de
                                 modelo del ítem
         atributos
                                 con ambos modelos


         Preparación de datos para el aprendizaje
               Análisis del estado actual de las reglas

         Aprendizaje automático usando ILP


         Prueba de reglas aprendidas

                                                          29
Referencias

 [1] R. Ponce-Medellín, Búsquedas contextuales de servicios basados en
 localización en un entorno de web social. 2010.



 [2] I. Guyon and A. Elisseeff, “An introduction to variable and feature selection,”
 Journal of Machine Learning Research, vol. 3, pp. 1157–1182, Mar. 2003.


 [3] H. Liu and R. Setiono, “A probabilistic approach to feature selection - A
 filter solution,” in 13th International Conference on Machine Learning, 1996,
 pp. 319–327.


 [4] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten,
 “The WEKA data mining software: an update,” SIGKDD Explorations Newsletter,
 vol. 11, no. 1, pp. 10–18, Nov. 2009.
                                                                                 30
Gracias
blanca.vargas@cenidet.edu.mx
        @blancavg




                               31

Más contenido relacionado

Similar a Aprendizaje de Reglas para un SR contextual

Sistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónSistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónBlanca Alicia Vargas Govea
 
Sistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileSistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileMontserrat Peralta
 
Sistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileSistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileMontserrat Peralta
 
Tendencias Recientes en Data Mining
Tendencias Recientes en Data MiningTendencias Recientes en Data Mining
Tendencias Recientes en Data MiningDMC Perú
 
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...[PIRAmIDE] Representación de la información para el diseño de un sistema lige...
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...Josué Freelance
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Memorias Aranda webCast Gestión de conocimiento
Memorias Aranda webCast Gestión de conocimientoMemorias Aranda webCast Gestión de conocimiento
Memorias Aranda webCast Gestión de conocimientoAranda Software
 
Anexo III segunda parte del manual de Ordenamiento Ecológico
Anexo III segunda parte del manual de Ordenamiento EcológicoAnexo III segunda parte del manual de Ordenamiento Ecológico
Anexo III segunda parte del manual de Ordenamiento EcológicoCarlos Cáceres
 

Similar a Aprendizaje de Reglas para un SR contextual (10)

Sistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónSistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluación
 
Sistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileSistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de Chile
 
Sistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de ChileSistemas de Recomendación el Contexto Educacional de Chile
Sistemas de Recomendación el Contexto Educacional de Chile
 
Tendencias Recientes en Data Mining
Tendencias Recientes en Data MiningTendencias Recientes en Data Mining
Tendencias Recientes en Data Mining
 
Feature Selection
Feature SelectionFeature Selection
Feature Selection
 
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...[PIRAmIDE] Representación de la información para el diseño de un sistema lige...
[PIRAmIDE] Representación de la información para el diseño de un sistema lige...
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Investigacion de mercado v.2010
Investigacion de mercado v.2010Investigacion de mercado v.2010
Investigacion de mercado v.2010
 
Memorias Aranda webCast Gestión de conocimiento
Memorias Aranda webCast Gestión de conocimientoMemorias Aranda webCast Gestión de conocimiento
Memorias Aranda webCast Gestión de conocimiento
 
Anexo III segunda parte del manual de Ordenamiento Ecológico
Anexo III segunda parte del manual de Ordenamiento EcológicoAnexo III segunda parte del manual de Ordenamiento Ecológico
Anexo III segunda parte del manual de Ordenamiento Ecológico
 

Más de Blanca Alicia Vargas Govea

Más de Blanca Alicia Vargas Govea (11)

Introducción a R - con minería de datos
Introducción a R - con minería de datosIntroducción a R - con minería de datos
Introducción a R - con minería de datos
 
Una Breve Historia de la Ingeniería de Software
Una Breve Historia de la Ingeniería de SoftwareUna Breve Historia de la Ingeniería de Software
Una Breve Historia de la Ingeniería de Software
 
In10years
In10yearsIn10years
In10years
 
Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil
Aprendizaje de Programas Teleo-Reactivos para Robótica MóvilAprendizaje de Programas Teleo-Reactivos para Robótica Móvil
Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil
 
Taller weka
Taller wekaTaller weka
Taller weka
 
Aprendizaje de reglas para sistemas de recomendación
Aprendizaje de reglas para sistemas de recomendaciónAprendizaje de reglas para sistemas de recomendación
Aprendizaje de reglas para sistemas de recomendación
 
Effects of relevant contextual features in the performance of a restaurant re...
Effects of relevant contextual features in the performance of a restaurant re...Effects of relevant contextual features in the performance of a restaurant re...
Effects of relevant contextual features in the performance of a restaurant re...
 
Evaluando sistemas de recomendación
Evaluando sistemas de recomendaciónEvaluando sistemas de recomendación
Evaluando sistemas de recomendación
 
R: Taller de Introducción
R: Taller de IntroducciónR: Taller de Introducción
R: Taller de Introducción
 
Learning Relational Grammars from Sequences of Actions
Learning Relational Grammars from Sequences of ActionsLearning Relational Grammars from Sequences of Actions
Learning Relational Grammars from Sequences of Actions
 
Effects of relevant contextual features in the performance of a restaurant re...
Effects of relevant contextual features in the performance of a restaurant re...Effects of relevant contextual features in the performance of a restaurant re...
Effects of relevant contextual features in the performance of a restaurant re...
 

Último

Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTESaraNolasco4
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
SIMULACROS Y SIMULACIONES DE SISMO 2024.docx
SIMULACROS Y SIMULACIONES DE SISMO 2024.docxSIMULACROS Y SIMULACIONES DE SISMO 2024.docx
SIMULACROS Y SIMULACIONES DE SISMO 2024.docxLudy Ventocilla Napanga
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfssuser50d1252
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdfRAMON EUSTAQUIO CARO BAYONA
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Rosabel UA
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfssuser50d1252
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaLuis Minaya
 

Último (20)

Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
SIMULACROS Y SIMULACIONES DE SISMO 2024.docx
SIMULACROS Y SIMULACIONES DE SISMO 2024.docxSIMULACROS Y SIMULACIONES DE SISMO 2024.docx
SIMULACROS Y SIMULACIONES DE SISMO 2024.docx
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
 

Aprendizaje de Reglas para un SR contextual

  • 1. Aprendizaje de Reglas para un SR contextual Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Grupo de Sistemas de Recomendación cenidet Feb 16, 2012
  • 2. Contenido Surfeous 1 Antecedentes Evaluación 2 Metodología para el aprendizaje de reglas 3 Selección de atributos 4 Preparación de datos 2
  • 3. Surfeous: prototipo de SR usuario enfoque contextual [1] buscando restaurante enfoque social opiniones 3 ratings y tags
  • 4. Surfeous: modelos de contexto formalidad latitud dirección ciudad transportación presupuesto país fax alcohol fumador alcohol cocina cocina zona-fumar ambiente interés ZIP latitud servicios edad usuario pago costo item hijos teléfono estatura peso ambiente horas longitud estado tipo-de-pago personalidad estado-civil religión días estacionamiento accesibilidad ocupación accesibilidad franquicia color-favorito formalidad 4
  • 5. Evaluación: metodología Básica Popularidad ítem Usuarios con más ratings Por grupos Usuarios con menos ratings Distribución usuario-ítem Selección de atributos 5
  • 6. Evaluación: resultados 0.4 original social 0.335 fusión 0.278 contexto 0.133 atributos-sel 0.335 0.327 0.133 0.35 La evaluación 0.3 más baja se 0.25 obtiene en el social enfoque 0.2 fusión contextual 0.15 contexto 0.1 0.05 0 original atributos-sel 6
  • 7. ¿Por qué es bajo? ¿Qué ocurre con las reglas? ¿Sobreajuste? Si    es roja, redonda, de 5cm de     diámetro    y es jaspeada en el 20% de su     superficie  entonces     es una manzana ¿Demasiado generales? Si    es roja entonces     es una manzana 7
  • 9. ¿Entonces? Se necesita un conjunto de reglas que describa los datos sin sobre-ajuste ni extrema generalización Aprendizaje de Reglas 9
  • 10. Metodología modelo del usuario Selección de modelo del ítem atributos con ambos modelos Preparación de datos para el aprendizaje Análisis del estado actual de las reglas Aprendizaje automático usando ILP Prueba de reglas aprendidas 10
  • 12. ¿Para qué sirve? [2] Mejorar el desempeño predictivo Construir modelos más Selección de eficientes atributos Mejorar el entendimiento de los modelos 12
  • 13. Selección de atributos: proceso forward/backward búsqueda: hill-climbing, best-first,... Generación de sub-conjuntos sub-conjunto chi-cuadrada, ganan- cia de información, Métrica clasificador, consisten- Evaluación de cia sub-conjuntos filtro/wrapper no si Criterio Validación de de paro resultados Umbral No. de atributos seleccionados 13 Que no mejore la evaluación
  • 14. Las Vegas Filter: criterio de inconsistencia [3] Conteo de inconsistencia IC s ( A)=S ( A)−max S k ( A) k Valor de inconsistencia ∑ A∈S IC S ( A) IR( S )= ∣S∣ 14
  • 15. Ejemplo área costo franquicia fumar Rating A Rating B 1 i bajo n s 0 0 2 i bajo n s 1 0 3 i bajo n s 2 0 4 i bajo n s 1 1 5 i alto n n 0 1 6 i alto n n 1 1 7 i alto n n 2 1 8 e alto s n 1 1 9 e bajo n n 1 1 10 e bajo n s 2 2 15
  • 16. Ejemplo Sub-conjunto A Sub-conjunto B Instancias iguales: 1,2,3,4 Instancias iguales: 1,2,3,4 n=4, clases=0,1,2,1 n=4, clases=0,0,0,1 clase frecuente=1 (2 instancias) clase frecuente=0 (3 instancias) Conteo de inconsistencia (IC): 4-2=2 Conteo de inconsistencia (IC): 4-3=1 Instancias iguales: 5,6,7 Instancias iguales: 5,6,7 N=3, clases= 0,1,2 N=3, clases= 1,1,1 clase frecuente=1 (1 instancia) clase frecuente=1 (3 instancias) Conteo de inconsistencia (IC): 3-1=2 Conteo de inconsistencia (IC): 3-3=0 Valor de Inconsistencia: Valor de Inconsistencia: (2+2)/10 = 4/10 = 0.4 (1+0)/10 = 1/10 = 0.1 16
  • 17. Descripción de los datos: Surfeous 1,160 130 ratings restaurantes 138 usuarios 0,1,2 valores de rating 8.41 115 ratings/usuario restaurantes con 1 rating 17
  • 18. ¿Cómo se hizo? Selección de atributos para: [4] Modelo del usuario Modelo del servicio Modelo del usuario + Modelo del servicio 18 http://www.cs.waikato.ac.nz/ml/weka/
  • 19. Preparación de datos user­cuisine user­payment usuario user­profile Clase user­attributes 19
  • 20. Preparación de datos Para el modelo de servicio se efectuó un proceso similar. Selección de usuario atributos Selección de ítem atributos usuario Selección de + atributos ítem 20
  • 21. Cada archivo es la entrada a WEKA 21
  • 22. WEKA 22
  • 23. WEKA 23
  • 24. Resultados usuario ítem interés edad tipo-de-pago horas cocina color-favorito días 80.95% 86.96% usuario + ítem edad religión alcohol zona-fumar horas color-favorito interés alcohol cocina formalidad cocina 75.00% 24
  • 26. Preparación de datos para el aprendizaje Objetivos Obtener los elementos necesarios para el aprendizaje automático: reglas prototipo, conocimiento del dominio e instancias aterrizadas. Preparar una plataforma de prueba de reglas. 26
  • 27. Preparación de datos para el aprendizaje <regla nombre="fumatrue1"> <antecedente>Restaurant(?r) ^  Reglas IDPlace(?r,?id)  ^....</antecedente> Formato RDF <consecuente> sqwrl:selectDistinct(?id)</consecuente> <tipo>2</tipo> </regla> usuariofuma(Restaurant,User):­ Predicados atom_chars(Msg,"Regla1n"), Prolog write(Msg), permiteFumar(Restaurant,"section"), esFumador(User,true). permiteFumar(Item,Algo) Extracción de tieneFormalidad(Item,Algo) literales (condiciones) ofreceServicio(Item,Algo) sirveAlimento(Item,Algo) esFranquicia(Item,Algo) Instanciar las esFumador("AAAM",false). esFumador("aguilar",false). condiciones con los esFumador("agusperez",false). 27 valores de atributos
  • 28. Preparación de datos para el aprendizaje Ya se tiene Plataforma para prueba de reglas Predicados correspondientes a atributos (condiciones) En proceso Análisis de las reglas originales Reglas muy generales, producen varios resultados por tipo de regla (fumador, estudiante, …) 28
  • 29. Lo que sigue modelo del usuario Selección de modelo del ítem atributos con ambos modelos Preparación de datos para el aprendizaje Análisis del estado actual de las reglas Aprendizaje automático usando ILP Prueba de reglas aprendidas 29
  • 30. Referencias [1] R. Ponce-Medellín, Búsquedas contextuales de servicios basados en localización en un entorno de web social. 2010. [2] I. Guyon and A. Elisseeff, “An introduction to variable and feature selection,” Journal of Machine Learning Research, vol. 3, pp. 1157–1182, Mar. 2003. [3] H. Liu and R. Setiono, “A probabilistic approach to feature selection - A filter solution,” in 13th International Conference on Machine Learning, 1996, pp. 319–327. [4] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, “The WEKA data mining software: an update,” SIGKDD Explorations Newsletter, vol. 11, no. 1, pp. 10–18, Nov. 2009. 30

Notas del editor

  1. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  2. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  3. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  4. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  5. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  6. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  7. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  8. The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.