SlideShare a Scribd company logo
1 of 33
Download to read offline
Gradients de prototypicalité appliqués à la
      personnalisation d'ontologies


      X. AIME, F. FURST, P. KUNTZ & F. TRICHET

                   xaime@tennaxia.com
                frederic.furst@u-picardie.fr
        pascale.kuntz,francky.trichet@univ-nantes.fr

      LINA - UMR CNRS 6241 – Université de Nantes – FRANCE
               MIS – Université d’Amiens – FRANCE
                  TENNAXIA – Paris – FRANCE
En partenariat avec…




IC'09 – Hammamet, Mai 2009 - 2/32
Aujourd’hui – Recherche d’information




                 Pas d’extension de requêtes
                 Aucun document sur Pentyne, Hexyne, substance dangereuse
                                                         Substance dangereuse


                                                   Alkyne


                                                Pentyne Hexyne (C6H10)
IC'09 – Hammamet, Mai 2009 - 3/32
Ce soir – Recherche d’information




                                                   T
                                                  We ags
   Pas d’extension de requêtes                      b2
                                                       .0
   Documents sur Pentyne, Hexyne, C6H10 , etc.
   MAIS mêmes résultats
          pour un chimiste organique
          et un consultant en risques chimiques             utilisateurs
   MAIS résultats sur “Alkyne” le lapin
IC'09 – Hammamet, Mai 2009 - 4/32
Demain – Recherche d’information




    Extension de requêtes au moyen d’une ontologie de la chimie
   Documents sur Pentyne, Hexyne , C6H10 , etc.
                                                                  Substance dangereuse


   MAIS mêmes résultats                                     Alkyne

         pour un chimiste organique                      Pentyne Hexyne (C6H10)

         et un consultant en risques chimiques

IC'09 – Hammamet, Mai 2009 - 5/32
Ontologie Hygiène-Sécurité-Environnement


                     Conceptualisation communautaire
                                                            Hydrocarbon, CnHm
                        dangerous
       Conceptualisationsubstance
                         contextuelle

              Clear gas                   Alkyne, CnH2n-2                  Alkane, CnH2n+2




                 Acetylene, Ethyne,      Pentyne,                Hexyne,
          74-86-2, 200-816-9, C2H2    627-19-0, C5H8         693-02-7, C6H10




IC'09 – Hammamet, Mai 2009 - 6/32
Situation (prototype theory [Rosch,73])


              Deux observations :
                      Pour une communauté C     Ontol
                                               Verna ogie Perso
                                                    culair     nnalis
                      Pour un domaine D                   e de D     é
                                                                omain e
                                                                      e
                      Dans un contexte E
                  tous les sous-concepts d’une catégorie n’ont pas la
                   même représentativité conceptuelle ;
                  tous les termes dénotant un concept n’ont pas la
                   même représentativité lexicale.

IC'09 – Hammamet, Mai 2009 - 7/32
Ontologie Hygiène-Sécurité-Environnement


                                                                              Hydrocarbons, CnHm
                                           dangerous
                                           substance

              Clear gas                                    Alkynes, CnH2n-2                 Alkanes, CnH2n+2




     74-86-2, Acetylene, C2H2, Ethyne,
                                    200-816-9
                Acetylene, Ethyne,                        Pentyne,                 Hexyne
         74-86-2, 200-816-9, C2H2                      627-19-0, C5H8          693-02-7, C6H10

                         #1                                  #3                     #2


IC'09 – Hammamet, Mai 2009 - 8/32
En résumé

        Pour un utilisateur confronté à une ontologie de domaine
        Pour chaque concept, il est possible de classer :
                les sous-concepts par ordre de typicalité (conceptuelle)
                les termes par ordre de typicalité (lexicale)

                                                Alkynes                                     Alkynes
                                                                                                        0.3
                                                        0.2
                                                                                                  0.6         Hexyne
                                                  0.5     Hexyne              0.9
                                    0.9
                                          Pentyne                                         Ethyne
                Acetylene                                          Pentyne   Ethyne , 200-816-9 , 74-86-2, Acetylene,
            74-86-2, Acetylene, C2H2, Ethyne,                                                 C2H2
                       200-816-9




IC'09 – Hammamet, Mai 2009 - 9/32
Personnalisation des ontologies

              Entrée : une ontologie de domaine (OWL 1.0)


              Sortie : une ontologie de domaine enrichie des
              valeurs de
                       Prototypicalité Conceptuelle pour chaque lien is-a (défini
                      entre deux concepts)
                                                                       0.4   0.1   0.9

                      Prototypicalité Lexicale pour chaque terme dénotant un
                      concept (pour chaque concept)
                                                  A   B    C   D   E

IC'09 – Hammamet, Mai 2009 - 10/32
Approche sémiotique des gradients

                                                  Intension
                                                        ( propriétés )




                      Expression                                         Extension
                                     ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 11/32
Approche sémiotique des gradients

                                                  Intension
                                                        ( propriétés )


                                                                Chimiste
                                                               organique




                      Expression                                         Extension
                                     ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 12/32
Approche sémiotique des gradients

                                                  Intension
                                                        ( propriétés )




                                                                      Consultant en
                                                                   risques chimiques



                      Expression                                         Extension
                                     ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 13/32
Gradient de Prototypicalité Conceptuelle
        fondé sur une approche sémiotique


              SPG(cp,cf) = (                 α . intensionnel (cp,cf)
                                         + β . expressionnel (cp,cf)
                                     +   γ. extensionnel (cp,cf) ) δ
              Avec :
                      α + β + γ = 1, α ∈ [0,1], β ∈ [0,1], γ∈ [0,1]
                      α , β , γ pondération de l’influence des 3 composantes
                      δ ∈ ]0,+ ∝ [ pondération de l’état émotionnel
IC'09 – Hammamet, Mai 2009 - 14/32
Composante Intensionnelle (1/6)
Pondération des propriétés (Au Yeung 2006)

              Propriété “peut flotter”




              Comment déterminer l’importance de cette propriété
              lors de la définition de ces concepts ?


IC'09 – Hammamet, Mai 2009 - 15/32
Composante Intensionnelle (2/6)
Pondération des propriétés

              Propriété “peut flotter”




            0                        0.75         1
        Peu important                       Très important



IC'09 – Hammamet, Mai 2009 - 16/32
Composante Intensionnelle (3/6)
Vecteur caractéristique


              Concept “Canard”


                            (… , 0.3 , 0.75 , 0.8, 0.4 , …)

        A des plumes                 Peut flotter   Peut voler   Pond un oeuf




IC'09 – Hammamet, Mai 2009 - 17/32
Composante Intensionnelle (4/6)
Vecteur caractéristique

                                          Sous concepts de cp
                                     p1
                                                 =
                                           Nuage de points




                                             p0



             p2

IC'09 – Hammamet, Mai 2009 - 18/32
Composante Intensionnelle (5/6)
Vecteur prototype

                                                 Prototype de cp
                                     p1                 ~
                                          Barycentre du nuage de points




                                                p0



             p2

IC'09 – Hammamet, Mai 2009 - 19/32
Composante Intensionnelle (6/6)
Typicalité par les propriétés

                                                  Intension ( cp , cf )
                                     p1                   =
                                          1 – distance ( prototype(cp) , cf )




                                                 p0



             p2

IC'09 – Hammamet, Mai 2009 - 20/32
Composante Expressionnelle (1/2)
Typicalité par le corpus

              Fondé sur le nombre d’occurrences des termes
                                                                     n

        Expression (cf ,cp) =                   Information ( cf )
                                                Information ( cp )



        Avec :
        – Information(c) le Contenu en Information du concept c.



IC'09 – Hammamet, Mai 2009 - 21/32
Composante Expressionnelle (2/2)
Typicalité par le corpus                                                                  n

        Expressional (cf ,cp) =                         Information ( cf )
                                                        Information ( cp )



        Avec :
        – count ( term ) le nombre d’occurrences de term dans l’ensemble des documents
        – N le nombre de termes total dans le corpus
        – count (document , term) le nombre de documents où le terme apparaît
        – count ( document ) le nombre de documents du corpus
        – world ( c ) tous les termes concernant le concept c via la fonction ftermc et tous les sous-
           concepts de sa descendance.


IC'09 – Hammamet, Mai 2009 - 22/32
Composante Extensionnelle
Typicalité par les instances

              Fondée sur la quantité d’instances d’un concept


        Extension (cf ,cp) =                           1
                                           1 – log           countI ( cf )
                                                             countI ( cp )
        Avec CountI (c) le nombre d’instances du concept c
                                                cp
                                                             cf3
                                     cf1             cf2

IC'09 – Hammamet, Mai 2009 - 23/32
Facteur émotionnel


                                     delta < 1


                  S
                  P
                  G

                                                                           delta > 1


                         alpha . intension + bêta . expression + gamma . extension


 Un état positif dilue la typicalité sur les concepts les moins représentatifs
 Un état négatif concentre la typicalité sur les concepts les plus représentatifs

IC'09 – Hammamet, Mai 2009 - 24/32
Gradient de Prototypicalité Lexicale


              LPG (t , c) =                    1
                                     1 – log         count ( t )
                                                   count ( ftermc(c) )

        Avec :
        – count ( t ) le nombre d’occurrences du terme t dans les documents ;
        – count( ftermc (c) ) le nombre d’occurrences de tous les termes dénotant le
           concept dans les documents.



IC'09 – Hammamet, Mai 2009 - 25/32
Web Ontology Langage (OWL)

         Deux nouvelles propriétés :
                                     xml:lpg   & xml:cpg

  <owl:Class rdf:ID=“organic_farming”>

         <rdfs:label xml:lang=“EN” xml:lpg=1.0>organic farming</rdfs:label>
         <rdfs:subClassOf rdf:resource=“#cultivation_system” xml:cpg=0.7/>
  </owl:Class>




IC'09 – Hammamet, Mai 2009 - 26/32
Logiciel TooPrag (1/3)

         Tool dedicated to the Pragmatisation of Ontology
             Entrée : une ontologie de domaine (OWL), un corpus de textes ou un index
             Lucene.




IC'09 – Hammamet, Mai 2009 - 27/32
Logiciel TooPrag (2/3)

              Sortie : une ontologie de domaine enrichie avec les valeurs de prototypicalité
              conceptuelle et prototypicalité lexicale, enregistrée en OWL ou dans une base de
              données relationnelle (MySQL).




IC'09 – Hammamet, Mai 2009 - 28/32
Logiciel TooPrag (3/3)

             Caractéristiques :
                      Fonctionnalités dédiées à l’édition d’ontologies (concepts, instances, termes,
                      ressources, index)




IC'09 – Hammamet, Mai 2009 - 29/32
Expérimentations
             Ontologie Tennaxia-HSE (dépôt INPI N322.408, 13 juin 2008) :
                     7400 concepts (prévision : près de 100.000 concepts), 20830 termes
                     Corpus de 2500 textes réglementaires (règlements, lois, directives…)




IC'09 – Hammamet, Mai 2009 - 30/32
Limites
              Composante Intensionnelle
                      La pondération des propriétés peut s’avérer chronophage (pour les
                      ontologies volumineuses)


              Composante Expressionnelle
                      Termes ambiguës
                      Contexte autour du terme (“non m1”, “opposé de m1”…)
                      Anaphores (“Pierre a une voiture, c’est la même que la mienne”)


              Facteur Émotionnel
                      Pondération de l’état émotionnel de l’utilisateur

IC'09 – Hammamet, Mai 2009 - 31/32
Conclusion & perspectives

              Les Ontologies Personnalisées Vernaculaires de Domaine sont définies
              suivant :
                      Une spécificité à un endogroupe et à un domaine ;
                      Une dimension écologique ;
                      La prise en compte de l’état émotionnel de l’utilisateur.


              Nos gradients peuvent être utiles dans plusieurs contextes :
                      Évaluation des ontologies ;
                      Analyse de corpus de textes ;
                      Recherche d’information sémantique
                              http://www.ethnosiris.com
IC'09 – Hammamet, Mai 2009 - 32/32
Gradients de prototypicalité appliqués à la
      personnalisation d'ontologies


      X. AIME, F. FURST, P. KUNTZ & F. TRICHET

                   xaime@tennaxia.com
                frederic.furst@u-picardie.fr
        pascale.kuntz,francky.trichet@univ-nantes.fr

      LINA - UMR CNRS 6241 - Université de Nantes – FRANCE
               MIS – Université d’Amiens – FRANCE
                  TENNAXIA – Paris – FRANCE

More Related Content

Viewers also liked

Recommendationletters
RecommendationlettersRecommendationletters
Recommendationlettersmeganey123
 
Iusy si réforme résolution - conseil mondial de 2011
Iusy   si réforme résolution - conseil mondial de 2011Iusy   si réforme résolution - conseil mondial de 2011
Iusy si réforme résolution - conseil mondial de 2011Viviana Piñeiro
 
La grue flottante
La grue flottante La grue flottante
La grue flottante AliSou0154
 
Prends Le Temps
Prends Le TempsPrends Le Temps
Prends Le TempsBENSBIA
 
cfg_Ecodiseño_Clase04
cfg_Ecodiseño_Clase04cfg_Ecodiseño_Clase04
cfg_Ecodiseño_Clase04ecodiseno.cl
 
Cours tp2 eculture2012
Cours tp2 eculture2012Cours tp2 eculture2012
Cours tp2 eculture2012luctrouche
 
Boletín ordinario nro 7
Boletín ordinario nro 7Boletín ordinario nro 7
Boletín ordinario nro 7Yasmin Cortes
 
Antonio Cid galería flamenca
Antonio Cid galería flamencaAntonio Cid galería flamenca
Antonio Cid galería flamencacosasdeandalucia
 
Construcción: Conversación para la Acción
Construcción: Conversación para la AcciónConstrucción: Conversación para la Acción
Construcción: Conversación para la AcciónMasterBase®
 
El Origen De La Variabilidad Y La Presion
El Origen De La Variabilidad Y La PresionEl Origen De La Variabilidad Y La Presion
El Origen De La Variabilidad Y La Presionmjcf
 
Desarrollo_Sholy
Desarrollo_SholyDesarrollo_Sholy
Desarrollo_SholySholy4
 
Aproximacion Conceptual De La Seguridad Y Salud Laboral
Aproximacion Conceptual De La Seguridad Y Salud LaboralAproximacion Conceptual De La Seguridad Y Salud Laboral
Aproximacion Conceptual De La Seguridad Y Salud Laboralguest89af7d
 
MadInspain 2009
MadInspain 2009MadInspain 2009
MadInspain 2009Juan Leal
 
La Vocation de MMM
La Vocation de MMMLa Vocation de MMM
La Vocation de MMMMedmultimed
 
Le Mobile Analytics avec Analyzer III
Le Mobile Analytics avec Analyzer IIILe Mobile Analytics avec Analyzer III
Le Mobile Analytics avec Analyzer IIIAT Internet
 

Viewers also liked (20)

Recommendationletters
RecommendationlettersRecommendationletters
Recommendationletters
 
Iusy si réforme résolution - conseil mondial de 2011
Iusy   si réforme résolution - conseil mondial de 2011Iusy   si réforme résolution - conseil mondial de 2011
Iusy si réforme résolution - conseil mondial de 2011
 
La grue flottante
La grue flottante La grue flottante
La grue flottante
 
Moda E&E
Moda E&EModa E&E
Moda E&E
 
Prends Le Temps
Prends Le TempsPrends Le Temps
Prends Le Temps
 
cfg_Ecodiseño_Clase04
cfg_Ecodiseño_Clase04cfg_Ecodiseño_Clase04
cfg_Ecodiseño_Clase04
 
Mal aimés les fonctionnaires ?
Mal aimés les fonctionnaires ?Mal aimés les fonctionnaires ?
Mal aimés les fonctionnaires ?
 
Cours tp2 eculture2012
Cours tp2 eculture2012Cours tp2 eculture2012
Cours tp2 eculture2012
 
Boletín ordinario nro 7
Boletín ordinario nro 7Boletín ordinario nro 7
Boletín ordinario nro 7
 
Resumen 2
Resumen 2Resumen 2
Resumen 2
 
Antonio Cid galería flamenca
Antonio Cid galería flamencaAntonio Cid galería flamenca
Antonio Cid galería flamenca
 
Construcción: Conversación para la Acción
Construcción: Conversación para la AcciónConstrucción: Conversación para la Acción
Construcción: Conversación para la Acción
 
Web 2.0
Web 2.0Web 2.0
Web 2.0
 
El Origen De La Variabilidad Y La Presion
El Origen De La Variabilidad Y La PresionEl Origen De La Variabilidad Y La Presion
El Origen De La Variabilidad Y La Presion
 
Desarrollo_Sholy
Desarrollo_SholyDesarrollo_Sholy
Desarrollo_Sholy
 
Aproximacion Conceptual De La Seguridad Y Salud Laboral
Aproximacion Conceptual De La Seguridad Y Salud LaboralAproximacion Conceptual De La Seguridad Y Salud Laboral
Aproximacion Conceptual De La Seguridad Y Salud Laboral
 
MadInspain 2009
MadInspain 2009MadInspain 2009
MadInspain 2009
 
La Vocation de MMM
La Vocation de MMMLa Vocation de MMM
La Vocation de MMM
 
Aa41
Aa41Aa41
Aa41
 
Le Mobile Analytics avec Analyzer III
Le Mobile Analytics avec Analyzer IIILe Mobile Analytics avec Analyzer III
Le Mobile Analytics avec Analyzer III
 

More from Conférence IC 2009

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conférence IC 2009
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeConférence IC 2009
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Conférence IC 2009
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Conférence IC 2009
 
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Conférence IC 2009
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Conférence IC 2009
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineConférence IC 2009
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueConférence IC 2009
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Conférence IC 2009
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Conférence IC 2009
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWLConférence IC 2009
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Conférence IC 2009
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsConférence IC 2009
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebConférence IC 2009
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesConférence IC 2009
 
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...Conférence IC 2009
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesConférence IC 2009
 
Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Conférence IC 2009
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casConférence IC 2009
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesConférence IC 2009
 

More from Conférence IC 2009 (20)

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistée
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
 
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaine
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantique
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWL
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de concepts
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le Web
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiques
 
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologies
 
Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de cas
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de données
 

Gradients de prototypicalité appliqués à la personnalisation d'ontologies

  • 1. Gradients de prototypicalité appliqués à la personnalisation d'ontologies X. AIME, F. FURST, P. KUNTZ & F. TRICHET xaime@tennaxia.com frederic.furst@u-picardie.fr pascale.kuntz,francky.trichet@univ-nantes.fr LINA - UMR CNRS 6241 – Université de Nantes – FRANCE MIS – Université d’Amiens – FRANCE TENNAXIA – Paris – FRANCE
  • 2. En partenariat avec… IC'09 – Hammamet, Mai 2009 - 2/32
  • 3. Aujourd’hui – Recherche d’information Pas d’extension de requêtes Aucun document sur Pentyne, Hexyne, substance dangereuse Substance dangereuse Alkyne Pentyne Hexyne (C6H10) IC'09 – Hammamet, Mai 2009 - 3/32
  • 4. Ce soir – Recherche d’information T We ags Pas d’extension de requêtes b2 .0 Documents sur Pentyne, Hexyne, C6H10 , etc. MAIS mêmes résultats pour un chimiste organique et un consultant en risques chimiques utilisateurs MAIS résultats sur “Alkyne” le lapin IC'09 – Hammamet, Mai 2009 - 4/32
  • 5. Demain – Recherche d’information Extension de requêtes au moyen d’une ontologie de la chimie Documents sur Pentyne, Hexyne , C6H10 , etc. Substance dangereuse MAIS mêmes résultats Alkyne pour un chimiste organique Pentyne Hexyne (C6H10) et un consultant en risques chimiques IC'09 – Hammamet, Mai 2009 - 5/32
  • 6. Ontologie Hygiène-Sécurité-Environnement Conceptualisation communautaire Hydrocarbon, CnHm dangerous Conceptualisationsubstance contextuelle Clear gas Alkyne, CnH2n-2 Alkane, CnH2n+2 Acetylene, Ethyne, Pentyne, Hexyne, 74-86-2, 200-816-9, C2H2 627-19-0, C5H8 693-02-7, C6H10 IC'09 – Hammamet, Mai 2009 - 6/32
  • 7. Situation (prototype theory [Rosch,73]) Deux observations : Pour une communauté C Ontol Verna ogie Perso culair nnalis Pour un domaine D e de D é omain e e Dans un contexte E tous les sous-concepts d’une catégorie n’ont pas la même représentativité conceptuelle ; tous les termes dénotant un concept n’ont pas la même représentativité lexicale. IC'09 – Hammamet, Mai 2009 - 7/32
  • 8. Ontologie Hygiène-Sécurité-Environnement Hydrocarbons, CnHm dangerous substance Clear gas Alkynes, CnH2n-2 Alkanes, CnH2n+2 74-86-2, Acetylene, C2H2, Ethyne, 200-816-9 Acetylene, Ethyne, Pentyne, Hexyne 74-86-2, 200-816-9, C2H2 627-19-0, C5H8 693-02-7, C6H10 #1 #3 #2 IC'09 – Hammamet, Mai 2009 - 8/32
  • 9. En résumé Pour un utilisateur confronté à une ontologie de domaine Pour chaque concept, il est possible de classer : les sous-concepts par ordre de typicalité (conceptuelle) les termes par ordre de typicalité (lexicale) Alkynes Alkynes 0.3 0.2 0.6 Hexyne 0.5 Hexyne 0.9 0.9 Pentyne Ethyne Acetylene Pentyne Ethyne , 200-816-9 , 74-86-2, Acetylene, 74-86-2, Acetylene, C2H2, Ethyne, C2H2 200-816-9 IC'09 – Hammamet, Mai 2009 - 9/32
  • 10. Personnalisation des ontologies Entrée : une ontologie de domaine (OWL 1.0) Sortie : une ontologie de domaine enrichie des valeurs de Prototypicalité Conceptuelle pour chaque lien is-a (défini entre deux concepts) 0.4 0.1 0.9 Prototypicalité Lexicale pour chaque terme dénotant un concept (pour chaque concept) A B C D E IC'09 – Hammamet, Mai 2009 - 10/32
  • 11. Approche sémiotique des gradients Intension ( propriétés ) Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 11/32
  • 12. Approche sémiotique des gradients Intension ( propriétés ) Chimiste organique Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 12/32
  • 13. Approche sémiotique des gradients Intension ( propriétés ) Consultant en risques chimiques Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 13/32
  • 14. Gradient de Prototypicalité Conceptuelle fondé sur une approche sémiotique SPG(cp,cf) = ( α . intensionnel (cp,cf) + β . expressionnel (cp,cf) + γ. extensionnel (cp,cf) ) δ Avec : α + β + γ = 1, α ∈ [0,1], β ∈ [0,1], γ∈ [0,1] α , β , γ pondération de l’influence des 3 composantes δ ∈ ]0,+ ∝ [ pondération de l’état émotionnel IC'09 – Hammamet, Mai 2009 - 14/32
  • 15. Composante Intensionnelle (1/6) Pondération des propriétés (Au Yeung 2006) Propriété “peut flotter” Comment déterminer l’importance de cette propriété lors de la définition de ces concepts ? IC'09 – Hammamet, Mai 2009 - 15/32
  • 16. Composante Intensionnelle (2/6) Pondération des propriétés Propriété “peut flotter” 0 0.75 1 Peu important Très important IC'09 – Hammamet, Mai 2009 - 16/32
  • 17. Composante Intensionnelle (3/6) Vecteur caractéristique Concept “Canard” (… , 0.3 , 0.75 , 0.8, 0.4 , …) A des plumes Peut flotter Peut voler Pond un oeuf IC'09 – Hammamet, Mai 2009 - 17/32
  • 18. Composante Intensionnelle (4/6) Vecteur caractéristique Sous concepts de cp p1 = Nuage de points p0 p2 IC'09 – Hammamet, Mai 2009 - 18/32
  • 19. Composante Intensionnelle (5/6) Vecteur prototype Prototype de cp p1 ~ Barycentre du nuage de points p0 p2 IC'09 – Hammamet, Mai 2009 - 19/32
  • 20. Composante Intensionnelle (6/6) Typicalité par les propriétés Intension ( cp , cf ) p1 = 1 – distance ( prototype(cp) , cf ) p0 p2 IC'09 – Hammamet, Mai 2009 - 20/32
  • 21. Composante Expressionnelle (1/2) Typicalité par le corpus Fondé sur le nombre d’occurrences des termes n Expression (cf ,cp) = Information ( cf ) Information ( cp ) Avec : – Information(c) le Contenu en Information du concept c. IC'09 – Hammamet, Mai 2009 - 21/32
  • 22. Composante Expressionnelle (2/2) Typicalité par le corpus n Expressional (cf ,cp) = Information ( cf ) Information ( cp ) Avec : – count ( term ) le nombre d’occurrences de term dans l’ensemble des documents – N le nombre de termes total dans le corpus – count (document , term) le nombre de documents où le terme apparaît – count ( document ) le nombre de documents du corpus – world ( c ) tous les termes concernant le concept c via la fonction ftermc et tous les sous- concepts de sa descendance. IC'09 – Hammamet, Mai 2009 - 22/32
  • 23. Composante Extensionnelle Typicalité par les instances Fondée sur la quantité d’instances d’un concept Extension (cf ,cp) = 1 1 – log countI ( cf ) countI ( cp ) Avec CountI (c) le nombre d’instances du concept c cp cf3 cf1 cf2 IC'09 – Hammamet, Mai 2009 - 23/32
  • 24. Facteur émotionnel delta < 1 S P G delta > 1 alpha . intension + bêta . expression + gamma . extension Un état positif dilue la typicalité sur les concepts les moins représentatifs Un état négatif concentre la typicalité sur les concepts les plus représentatifs IC'09 – Hammamet, Mai 2009 - 24/32
  • 25. Gradient de Prototypicalité Lexicale LPG (t , c) = 1 1 – log count ( t ) count ( ftermc(c) ) Avec : – count ( t ) le nombre d’occurrences du terme t dans les documents ; – count( ftermc (c) ) le nombre d’occurrences de tous les termes dénotant le concept dans les documents. IC'09 – Hammamet, Mai 2009 - 25/32
  • 26. Web Ontology Langage (OWL) Deux nouvelles propriétés : xml:lpg & xml:cpg <owl:Class rdf:ID=“organic_farming”> <rdfs:label xml:lang=“EN” xml:lpg=1.0>organic farming</rdfs:label> <rdfs:subClassOf rdf:resource=“#cultivation_system” xml:cpg=0.7/> </owl:Class> IC'09 – Hammamet, Mai 2009 - 26/32
  • 27. Logiciel TooPrag (1/3) Tool dedicated to the Pragmatisation of Ontology Entrée : une ontologie de domaine (OWL), un corpus de textes ou un index Lucene. IC'09 – Hammamet, Mai 2009 - 27/32
  • 28. Logiciel TooPrag (2/3) Sortie : une ontologie de domaine enrichie avec les valeurs de prototypicalité conceptuelle et prototypicalité lexicale, enregistrée en OWL ou dans une base de données relationnelle (MySQL). IC'09 – Hammamet, Mai 2009 - 28/32
  • 29. Logiciel TooPrag (3/3) Caractéristiques : Fonctionnalités dédiées à l’édition d’ontologies (concepts, instances, termes, ressources, index) IC'09 – Hammamet, Mai 2009 - 29/32
  • 30. Expérimentations Ontologie Tennaxia-HSE (dépôt INPI N322.408, 13 juin 2008) : 7400 concepts (prévision : près de 100.000 concepts), 20830 termes Corpus de 2500 textes réglementaires (règlements, lois, directives…) IC'09 – Hammamet, Mai 2009 - 30/32
  • 31. Limites Composante Intensionnelle La pondération des propriétés peut s’avérer chronophage (pour les ontologies volumineuses) Composante Expressionnelle Termes ambiguës Contexte autour du terme (“non m1”, “opposé de m1”…) Anaphores (“Pierre a une voiture, c’est la même que la mienne”) Facteur Émotionnel Pondération de l’état émotionnel de l’utilisateur IC'09 – Hammamet, Mai 2009 - 31/32
  • 32. Conclusion & perspectives Les Ontologies Personnalisées Vernaculaires de Domaine sont définies suivant : Une spécificité à un endogroupe et à un domaine ; Une dimension écologique ; La prise en compte de l’état émotionnel de l’utilisateur. Nos gradients peuvent être utiles dans plusieurs contextes : Évaluation des ontologies ; Analyse de corpus de textes ; Recherche d’information sémantique http://www.ethnosiris.com IC'09 – Hammamet, Mai 2009 - 32/32
  • 33. Gradients de prototypicalité appliqués à la personnalisation d'ontologies X. AIME, F. FURST, P. KUNTZ & F. TRICHET xaime@tennaxia.com frederic.furst@u-picardie.fr pascale.kuntz,francky.trichet@univ-nantes.fr LINA - UMR CNRS 6241 - Université de Nantes – FRANCE MIS – Université d’Amiens – FRANCE TENNAXIA – Paris – FRANCE