A lecture delivered for "Web Application Development" discipline (MSc studies at Faculty of Computer Science, 'Alexandru Ioan Cuza' University of Iasi, Romania): https://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html
17. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Exemplu recurgând la vocabularul schema.org
adaptare după (Manu Sporny, 2012)
<p vocab="http://schema.org/" typeof="Person"
resource="#tux">
Salut, eu sunt
<span property="name">Tuxy Pinguinnesscool</span>
și vă invit să vizitați
<a property="url" href="http://tux.info/"
title="Situl lui Tuxy">situl meu</a>.
</p>
adnotare explicită direct în HTML:
resursa identificată cu tux este o persoană având atașate
un nume și o adresă Web a sitului personal
18. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Exemplu recurgând la vocabularul schema.org
adaptare după (Manu Sporny, 2012)
<p vocab="http://schema.org/" typeof="Person"
resource="#tux">
Salut, eu sunt
<span property="name">Tuxy Pinguinnesscool</span>
și vă invit să vizitați
<a property="url" href="http://tux.info/"
title="Situl lui Tuxy">situl meu</a>.
</p>
@prefix s: <http://schema.org/> .
:tux rdf:type s:Person ;
s:name "Tuxy Pinguinnesscool" ;
s:url <http://tux.info/> .
aserțiunile RDF
echivalente
19. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Exemplu: modelarea grafului social al unui utilizator
pe baza vocabularului FOAF (Friend Of A Friend)
<div vocab="http://xmlns.com/foaf/0.1">
<div resource="#busaco" typeof="Person">
<a property="url" href="http://purl.org/net/busaco">
<span property="name">Sabin Buraga</span></a>
îi are drept cunoscuți pe
<a property="knows" href="#alecsandru">Alecsandru</a> și
<a property="knows" href="#blankdots">Ștefan</a>.
</div>
<p resource="#alecsandru" typeof="Person">
<span property="name">Alecsandru Grigoriu</span></a>
</p>
…
</div>
24. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
RDFa transformă o pagină Web într-un API
diverse biblioteci/module de prelucrare:
clj-rdfa (Closure), EasyRDF (PHP), librdfa (C),
Green Turtle (JavaScript), PyRDFa (Python),
quadstore (Node.js), semargl (Java), vie (Node.js)
http://rdfa.info/dev/
vezi și www.w3.org/community/rdfjs/wiki/Comparison_of_RDFJS_libraries
27. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
rNews
se bazează pe microdate HTML5 și/sau RDFa
detalii în prezentarea E. Sandhaus, S. Myles & A. Gebhard,
“The State of rNews”, Semantic Technology & Business
Conference, San Francisco (2012)
https://speakerdeck.com/u/agebhard/p/the-state-of-rnews
28. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Generarea de construcții RDFa
pe baza editorului on-line RDFaCE
abordare WYSIWYG (What You See Is What You Get)
generează reprezentări RDFa – inclusiv rNews
recurge la API-uri de adnotare a conținutului textual
(e.g., Alchemy, Ontos, DBpedia)
disponibil și ca extensie pentru WordPress
http://aksw.org/Projects/RDFaCE.html
30. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
rdf: utilizari – rdfa
extragerea cu instrumentul RDFa 1.1 Distiller and Parser
a triplelor RDF dintr-un document HTML ce include RDFa
http://www.w3.org/2012/pyRdfa/Overview.html
aici, o resursă Web oferită de publicația Telegraph
URL-ul resursei
conținând (meta-)date
exprimate prin RDFa
31. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
rdf: utilizari – rdfa
pe baza construcțiilor RDFa specificate în codul HTML,
sunt extrase date RDF disponibile în format Turtle
în acest caz, se recurge la vocabularul OGP (Open Graph
Protocol) utilizat de Facebook – http://ogp.me/
@prefix og: <http://opengraphprotocol.org/schema/> .
<http://www.telegraph.co.uk/science/2016/11/06/forgotten-oil-painting-could-be-
lost-raphael-as-scientists-date/>
og:description "When collector Stephen Hibberts discovered..."@en-gb ;
og:image "http://www.telegraph.co.uk/content/...6f62EI5U.jpg" ;
og:site_name "The Telegraph"@en-gb;
og:title "Forgotten oil painting could be lost Raphael,
as scientists date it to 16th century…"@en-gb;
og:type "article"@en-gb;
og:url "http://www.telegraph.co.uk/...forgotten-oil-painting.../"@en-gb .
subiect
predicat
obiect
33. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Aserțiunile RDFa sunt indexate de motoarele de căutare
Bing Webmaster
http://tinyurl.com/b9mx2f2
Google Structured Data
developers.google.com/structured-data/
Yahoo! BOSS (Build your Own Search Service)
http://developer.yahoo.com/search/boss/
Yandex Semantic Markup Validator
https://webmaster.yandex.com/microtest.xml
34. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Crawl Date October 2016
Total Data 56 TB (compressed)
Parsed HTML URLs 3,181,199,447
URLs with Triples 1,242,727,852
Domains in Crawl 34,076,469
Domains with Triples 5,638,796
Typed Entities 9,590,731,005
Triples 44,242,655,138
statistici oferite de
Web Data Commons
webdatacommons.org/structureddata/