Slideshare.net (beta)

 
Post: 
Myspace Hi5 Friendster Xanga LiveJournal Facebook Blogger Tagged Typepad Freewebs BlackPlanet gigya icons



All comments

Add a comment on Slide 1

If you have a SlideShare account, login to comment; else you can comment as a guest


Showing 1-50 of 6 (more)

Oe Abes Mai2008

From olivier, 1 month ago

Folksonomies et indexation sociale : le monde comme catalogue. Int more

1944 views  |  0 comments  |  5 favorites  |  56 downloads  |  15 embeds (Stats)
 

Groups/Events

 
 

Privacy InfoNew!

This slideshow is Public

 

Slideshow transcript

Slide 1: Indexation sociale et folksonomies : le monde comme catalogue. .Olivier ERTZSCHEID. Maître de conférences en sciences de l’information Université de Nantes / IUT La Roche sur Yon http://www.affordance.info Journées ABES. Montpellier. 20 et 21 Mai 2008

Slide 2: 2 Le Pitch • A l'heure du web 2.0, les technologies d'indexation sociale prennent de plus en plus de place dans le repérage, le classement, la hiérarchisation et l'accès à l'information et aux documents. • Les pratiques professionnelles se dissolvent dans les usages amateurs. • Quelles sont les frontières et les enjeux de cette nouvelle bibliothéconomie de masse pour la société de la connaissance ?

Slide 3: Demandez le programme Chapitre 1er : Définitions & Exemples Chapitre 2nd : Folksonomistes : qui sont-ils ? Chapitre 3ième : Pourquoi ça marche ? Chapitre 4ème : Quelles pratiques ? Chapitre 5ème : Quel avenir ? Chapitre 6ème : Le monde comme pan-catalogue.

Slide 4: L’indexation sociale ou « Folksonomie » Définitions & Exemples

Slide 5: 5 « Ce n’est pas sale ! »

Slide 6: 6 Définition • « Folksonomies désignent – un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. » (Wikipédia)

Slide 7: 7 ≠ thesaurus • « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »

Slide 8: 8 ≠ ontologie • « ensemble structuré de concepts. (…) • organisés dans un graphe (…) • relations sémantiques et de composition ou d'héritage. »

Slide 9: 9 Folksonomie ≠ thesaurus ≠ ontologie • « Folksonomies désignent – un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. » • Vocabulaire non-normalisé, • non-structuré, • non-spécifique à un domaine, • sans relations sémantiques ou hiérarchiques.

Slide 10: 10 Le petit folksonomiste illustré Source : Agnès de Saxcé BBF 2007 - Paris, t. 52, n° 4. Compte-rendu du colloque évaluation et validation de l’information.

Slide 11: 11 5 étapes d’indexation Web Standardisation DUBLIN-CORE GOOGLE <META> OAI-PMH PageRank Communauté Communauté « Indexeurs de pratique Métier / Ressources sans le savoir » Linguistique ? de corpus FOLKSONOMIES Communauté Web D’usage ONTOLOGIES Sémantique Communauté compétences (Outils + métier) ?

Slide 12: 12

Slide 13: 13

Slide 14: 14 Dél.icie.uses folksonomies

Slide 15: FolsonomiSTES Martiens ? Visionnaires ? Gourous ? Une secte ? Indexeurs du troisième type ? ? Pour ou contre ?

Slide 16: Qui indexe ? Quoi ? Textes Usagers, Docs de travail Consommateurs, Articles scientifiques Producteurs, Auteurs, Billets de blogs Novices, Photos Experts. Vidéos A moi Aux autres A la volée Organiser, En surface Partager, En profondeur (deep tagging) Chercher, En connaissance de cause Retrouver Au hasard Associer, Pour moi (tags privés) « Participer » Pour les autres (tags publics) Comment ? Pourquoi ? 16

Slide 17: Digital Natives / Digital immigrants La loi de (rupert) Murdoch • Sites pratiquant/proposant l’indexation sociale/communautaire sont – Majoritairement créés par de jeunes entrepreneurs (start-up) – Majoritairement utilisés par un public « jeune » – Majoritairement rachetés par des « digital immigrants » 17

Slide 18: ? Avantages = 18 Inconvénients ? • Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite • Intérêt d’un filtrage collaboratif • gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … • Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …) • Conforme aux usages (onebox, oneword) • Trop simple, trop peu d’expertise, trop d’hétérogénéité • Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) • polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) • = Méta-bruit

Slide 19: ? Avantages = 19 Inconvénients ? • « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » • Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. • Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. • Mais sur les objets ? – Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ? – Doit-on décider qu’elles sont inclassables ??

Slide 20: Pourquoi ça marche ?? « Si l'on tague "A la recherche du temps perdu", dans son édition de 1947 en 15 volumes (disponible en téléchargement ici), on trouve 442 occurrences du prénom "Odette" sur les quelques 5000 pages de l'ouvrage. Et pourtant Proust ne l'a pas appelé "A la recherche d'Odette ». (à noter qu'on ne trouve que 24 "madeleine"). Comme quoi les tags c'est de la merde. Et les taguers des branleurs. » Commentaire d’un billet publié sur Embruns.net (blog de Laurent Gloaguen)

Slide 21: 21 Une image vaut 1000 mots (clés ?) Graphic by Elliancet in Search Engine Land.

Slide 22: Les raisons du succès 1. Temporalité réunifiée entre interface et indexation 2. La fonction symbolique plutôt que la vocation analytique. 3. Sagesse des foules 4. Auto-régulation 5. Faible coût cognitif 6. (enfin une) Indexation orientée-tâche 1 2 3 4 5 6 22

Slide 23: 23 Les raisons du succès (1/5) : Une temporalité (ré?)unifiée entre interface et indexation • Temps consultation ≈ temps de l’accès ≈ temps de l’indexation • Micro-temporalités successives, parfois simultanées, jamais contraintes, sans préalables. • Langages documentaires & formels (Thésaurus & ontologies) pour l’accès à l’information : – Interfaces asynchrones. – Nbre textes > nbre d’indexeur = temporalité interfaçage longue – Acculturation difficile • Folksonomies – Interface synchrone. Le temps de l’indexation est le même que celui de l’accès et du repérage. – Nbre documents < = nbre d’indexeurs = temporalité interfaçage courte (simultanée) – Acculturation a priori.

Slide 24: 24 Les raisons du succès (2/5) : La fonction symbolique plutôt que la vocation analytique. • Vocation analytique des langages documentaires & formels : – classer physiquement et/ou conceptuellement selon la nature de l’objet – Univers de référence « construit » par l’indexeur, l’expert et l’état des connaissances au moment de l’indexation – Approche « objective », logique ou logiciste • Fonction symbolique Folksonomies : – Repérer sémantiquement pour accéder et/ou représenter l’objet. – Univers de référence induit par l’objet lui-même et le rapport objet/indexeur (affordance) – Approche « subjective », empirique, « essai et erreur »

Slide 25: 25 Les raisons du succès (3/5) : la sagesse des foules • « (…) N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)... » Adam Bosworth, VP ingénierie chez Google. • Postule l’existence pour tout élément donné (texte, image, document) d’une série de mots et termes composant le plus petit lexique commun (concensus) permettant de décrire l'objet ou le document.

Slide 26: 26 Les raisons du succès (4/5) : un faible coût cognitif • Marquage élimine la phase de décision (choix de la bonne catégorie) • Dissipe la phase de paralysie d’analyse (choix du mot-clé) • Permet l’ancrage en contexte socio-cognitif immédiat. – Google image labeller : http://images.google.com/imagelabeler/ • Hiérarchie centrée document VS anarchie centrée utilisateur MAIS … • Confirmation de l’axiomatique du memex : – « human mind doesn’t work that way » – « association »

Slide 27: 27 Les raisons du succès (5/5) : Auto-régulation ? • Golder Scott A. & Huberman Bernardo A., « The Structure of Collaborative Tagging Systems », Information Dynamics Lab, HP Labs , 2005. • Méthodologie – Site Del.icio.us sur une période donnée (5 jours) – Corpus : • Les plus populaires (212 URL présents dans 19422 signets) • Échantillon aléatoire de 229 usagers ayant partagé durant période test + tous leurs signets y compris hors-période (68 668 signets)

Slide 28: 28 Les lois folksonomiques • Loi de caractérisation – 7 types de tags : Thématiques (orientés sujet) / Nature de l’objet (article, blog, livre) / Propriétaire (auteur du signet) / adjectifs de caractérisation (drôle, stupide, horreur) / auto- référence (messignets, monnom …) / orientés tâche (à lire, recherche d‘emploi) • Loi de partage – Plus on possède (= partage), plus on taggue (avec fortes variations selon individus) • Loi de Feedback positif – Motifs stables dans la proportion et le choix des tags. – Plus une ressource est partagée, plus le nombre de tags la décrivant se stabilise ainsi que leur nature.

Slide 29: Folksonomies & Pratiques

Slide 30: Librarything : la communauté comme indexeur Site communautaire à vocation bibliothéconomique : www.librarything.com Février 2006: 1.5 millions de références => Juin 2006: 3.2 millions => Nov 2006: 6.2 millions => Juin 2007 : 14 millions => Mai 2008 : 26 Millions

Slide 31: 31 Le meilleur des deux mondes ? • Indexation « standard » : – notice au format MARC, – indexation DEWEY, – LC « subjects headings », • Indexation sociale : – tags associés, – fiches de lecture et revues de la communauté, – système de recommandation Modèle collaboratif, auto-régul, ouvert en lecture et en écriture, « Amazon-ifié », « OPAC-ifié »

Slide 32: 32 Les musées … aussi ! • Metropolitan Museum of Art indique que : – "sur 30 oeuvres d'art indexées par les usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée." • Outil collaboratif de tagging à destination des musées – http://www.steve.museum/ « Nécessité fait loi. »

Slide 33: 33 Les musées … aussi ! • Musée McCord de Montréal. • Usagers créent et ajoutent : – des tags pour annoter les fonds existants, – des commentaires, – des images personnelles, – Peuvent visionner l'ensemble des "circuits publics". « Nécessité fait loi. »

Slide 34: Les bases de données scientifiques … aussi !! hubmed.org 34

Slide 35: 35 Le catalogue … aussi !! http://orlabs.oclc.org/Identities

Slide 36: 36 Le moteurs … aussi !!! • Plusieurs « écoles » – Moteurs dédiés (technorati.com) – Fonctionnalité intégrée (MyYahoo) – Illusion folksonomique (cloud.clusty.com)

Slide 37: Les communautés scientifiques : aussi !!! • Postgenomic.com, CiteUlike (Repérage de signets IST) … • Folksonomies présentes partout : accès, repérage, commentaire. 37

Slide 38: 38 Et les bibliothèques ? Aussi ! • Bibliothèque & Catalogue http://tags.library.upenn.edu/ • Intégration dans SIGB (open source ou propriétaires) : Étagères virtuelles de PMB Rapport Calhoun pour la LoC (Mars 2006) Déclencheur pour le monde des bibliothèques www.loc.gov/catdir/calhoun-report-final.pdf

Slide 39: 39 Et les bibliothèques ? Aussi !! • Library of Congress sur FlickR : – http://flickr.com/photos/library_of_congress/ • Boston Public Library sur FlickR : – http://flickr.com/photos/boston_public_library/ • Pourquoi ? – « Pour partager ces collections photographiques avec ceux qui ne visitent pas notre site – Pour mieux comprendre en quoi l'indexation sociale pour nous apporter des idées d'amélioration de nos services et de nos fonds – Pour accroître notre expérience et notre implication dans des communautés web partageant des centres d'intérêts communs avec les collections de bibliothèques. » • Source : http://www.loc.gov/rr/print/flickr_pilot_faq.html • RÉSULTAT ??

Slide 40: 40 Résultat … • 392,000 views on the photostream • 650,000 views of photos • Adding in set and collection page views, there were about 1.1 million total views on our account • All 3,100+ photos have been viewed • 420 of the photos have comments • 1,200 of the photos have been favorited En une nuit !! http://www.loc.gov/blog/?p=237

Slide 41: 41 http://flickr.com/photos/library_of_congr ess/alltags/

Slide 42: 42

Slide 43: 43 C’est déjà demain Où comment « concilier l’inconciliable » ?

Slide 44: Intérêt « fusionnel » • Exporter … • Vers un site collaboratif communautaire (del.icio.us) • Des (méta)données documentaires (HubMed) • Fertilisation croisée • Ouverture des catalogues http://hublog.hubmed.org/ 44

Slide 45: L’hybridation comme modèle ? • Amazon : Amapedia • « Collaborative structured tagging » • Tags factuels – TagFactuel : valeur1, Valeur2, Valeur3 ... • Tags catégoriels – Relation « is a » – Relation « like … » – Relation « partage des attributs essentiels » 45

Slide 46: 46 Vers des modèles hybrides • FlickR (& bientôt) Del.icio.us : « Machine Tags » • Nom : attribut = valeur. • flickr:user=straup • flora:tree=coniferous • medium:paint=oil • geo:cartier="plateau mont royal" • geo:neighbourhood=geo:cartier

Slide 47: 47 Quel avenir ? Penser une bibliothéconomie « à l’échelle » des transformations en cours, et « en mouvement ». Une bibliothéconomie de masse.

Slide 48: 48 Quels mouvements ? Tectonique documentaire : Cinq continents réunifiés

Slide 49: indexé 49 Dérive des continents documentaires : non-indexé le monde comme Pan-catalogue ? Pourquoi ? Web public Web privé Web extime Web personnel Web intime (blogs) (Desktop) (Mail) 2015 ? Web public Web privé Web personnel Web intime Web extime (Desktop) (Mail) (blogs) 2005 Web public Web personnel Web intime (Desktop) (Mail) Web privé 1995

Slide 50: 50 Quelle échelle ? Celle des nouvelles cultures, des nouvelles pratiques, des nouveaux besoins des natifs digitaux

Slide 51: 51 Bouillon de cultures • Culture du fragment : Homogénéisation des savoirs • Culture de l’accès : Économie de l’attention • Culture du service, de la proximité, du « service de proximité » • Librairie, bibliothèque, pizzéria « près de chez vous » : « caRtalogue » • Culture de « l’économie » – d’expertise (sagesse des foules) – de temps (immédiateté) – d’argent (culture du gratuit) • Culture de l’ouverture : Open Access, Open Archives, Open Office, Open Data … • Culture de la synchronicité – Accès, repérage, recherche, certification, indexation, navigation, partage Réflexion sur « l’offre » documentaire Doit intégrer cette économie de la demande

Slide 52: 52 Quelles transformations ? Celle des pratiques

Slide 53: 53 Confusion des pratiques ? Web/documenet Web/document` Web personnel Web intime Web extime public privé (Desktop) (Mail) (blogs) chercher communiquer s’orienter organiser partager Tagger / indexer talk orkut print earth google API’s

Slide 54: 54 Mathématiques bibliothéconomiques • Années 90 : industrialisation de l’indexation (moteurs de recherche) • Années 2000 : marchandisation de l’indexation (liens sponsorisés) • Aujourd’hui : « indexabilité » de l’actuelle masse documentaire : – Totale : nos mails, nos documents de travail, nos « recherches », nos amis, nos préférences sexuelles, politiques, religieuses … – En temps réel : à la volée – Transparente : visible par tous (surtout par les moteurs) et de partout (interopérabilité) • Bibliothéconomie de masse = industrialisation + marchandisation + indexabilité • Horizon de l’indexation : – Question n’est plus celle de l’autorité (qui a autorité pour indexer) – ni même de l’expertise (qui a compétence pour indexer) – mais celle de l’usage (qui a besoin d’indexer) • IL EST URGENT DE SE SAISIR DE CES OUTILS !

Slide 55: 55 Il y a urgence. ? Sinon ? Modèle marchand de la bib. Autarcithécaires Bibliothèques ?

Slide 56: 56 Conclusion … • «It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing. » – Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006. • La communauté comme indexeur a son rôle à jouer. • Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique

Slide 57: 57 ?Q uE … sT c i io N e R M s? … ?Q uEs Tio Ns ?