Similar to 2015-06 Monica Palmirani, L'informazione giuridica nella società della conoscenza: la rappresentazione del sapere giuridico nell'era digitale
Similar to 2015-06 Monica Palmirani, L'informazione giuridica nella società della conoscenza: la rappresentazione del sapere giuridico nell'era digitale (20)
2015-06 Monica Palmirani, L'informazione giuridica nella società della conoscenza: la rappresentazione del sapere giuridico nell'era digitale
1. L'informazione giuridica nella società
della conoscenza:
la rappresentazione del sapere
giuridico nell'era digitale
Monica Palmirani, Università di Bologna, CIRSFID
Milano
3 giugno 2015
2. Agenda
• Società della conoscenza e open data
• Le caratteristiche dell’informazione
giuridica nella società della conoscenza
• Sentenze, trattamento dei dati personali e
open data giuridici
• Soluzioni tecniche
3. Internet e la “Società della
conoscenza” condivisa
Dati/informazioni + Esperienza =
Conoscenza
Open Source INTelligence
4. Un nuovo paradigma
• “Raw Data now” – TED 2009
»Reuse data and create new markets
»Access, transparency, control,
monitoring, evaluation, partecipation
5. Obama’s Open Gov Initiative 2009
http://www.data.gov/
“an unprecedented level of openness in government”
“the public trust and establish a system of transparency,
public participation, and collaboration.”
“an unprecedented level of openness in government”
“the public trust and establish a system of transparency,
public participation, and collaboration.”
9. L’Italia e l’Open Data:
Art. 52 CAD
Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni
Le pubbliche amministrazioni pubblicano nel proprio sito web, all'interno della
sezione "Trasparenza, valutazione e merito", il catalogo dei dati, dei
metadati e delle relative banche dati in loro possesso ed i regolamenti
che ne disciplinano l'esercizio della facolta' di accesso telematico e il
riutilizzo, fatti salvi i dati presenti in Anagrafe tributaria
I dati e i documenti che le amministrazioni titolari pubblicano, con qualsiasi
modalita', senza l'espressa adozione di una licenza di cui all'articolo 2,
comma 1, lettera h), del decreto legislativo 24 gennaio 2006, n. 36, si
intendono rilasciati come dati di tipo aperto ai sensi
all'articolo 68, comma 3, del presente Codice.
Le attivita' volte a garantire l'accesso telematico e il riutilizzo dei dati delle
pubbliche amministrazioni rientrano tra i parametri di valutazione della
performance dirigenziale ai sensi dell'articolo 11, comma 9, del decreto
legislativo 27 ottobre 2009, n. 150.
d.l. 179/2012
10. Art. 50 CAD
Disponibilità dei dati delle pubbliche
amministrazioni
1. I dati delle pubbliche amministrazioni sono formati, raccolti, conservati, resi
disponibili e accessibili con l'uso delle tecnologie dell'informazione e della
comunicazione che ne consentano la fruizione e riutilizzazione, alle condizioni
fissate dall'ordinamento, da parte delle altre pubbliche amministrazioni e dai
privati; restano salvi i limiti alla conoscibilità dei dati previsti dalle leggi e
dai regolamenti, le norme in materia di protezione dei dati personali ed il
rispetto della normativa comunitaria in materia di riutilizzo delle
informazioni del settore pubblico.
2. Qualunque dato trattato da una pubblica amministrazione, con le
esclusioni di cui all'articolo 2, comma 6, salvi i casi previsti dall'articolo
24 della legge 7 agosto 1990, n. 241, e nel rispetto della
normativa in materia di protezione dei dati personali, è reso accessibile e
fruibile alle altre amministrazioni quando l'utilizzazione del dato sia necessaria
per lo svolgimento dei compiti istituzionali dell'amministrazione richiedente,
senza oneri a carico di quest'ultima, salvo per la prestazione di elaborazioni
aggiuntive è fatto comunque salvo il disposto dell'articolo 43, comma 4, del
decreto del Presidente della Repubblica 28 dicembre 2000, n. 445.
11. Art. 68 CAD
(per la prima volta la definizione di open data)
Agli effetti del presente decreto legislativo si intende per:
a) formato dei dati di tipo aperto, un formato di dati reso pubblico,
documentato esaustivamente e neutro rispetto agli strumenti
tecnologici necessari per la fruizione dei dati stessi;
b) dati di tipo aperto, i dati che presentano le seguenti caratteristiche:
a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da parte di
chiunque, anche per finalita' commerciali, in formato disaggregato;
b) sono accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi
comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera a),
sono adatti all'utilizzo automatico da parte di programmi per elaboratori e sono
provvisti dei relativi metadati;
c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e della
comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi
disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione. L'Agenzia
per l'Italia digitale deve stabilire, con propria deliberazione, i casi eccezionali,
individuati secondo criteri oggettivi, trasparenti e verificabili, in cui essi sono resi
disponibili a tariffe superiori ai costi marginali. In ogni caso, l'Agenzia, nel trattamento
dei casi eccezionali individuati, si attiene alle indicazioni fornite dalla direttiva 2003/98/CE
del Parlamento europeo e del Consiglio, del 17 novembre 2003, sul riutilizzo
dell'informazione del settore pubblico, recepita con il decreto legislativo 24 gennaio 2006,
n. 36.
12. Caratteristiche
dell’open government data
• Formati aperti: JSON, XML, RDF, CSV, excel, txt, etc.
• Dotati di licenza aperta con attribuzione (cc0 si usa
limitatamente nell’OGD)
• Con metadati che tracciano la storia del dataset
• A disposizione senza filtri rispetto ai motori di ricerca
• Gratuitamente distribuiti o a costi marginali
Limiti ?
– Tanti: dati personali, dati sensibili, copyright, marchi,
segreto statistico, segreto amministrativo, segreto di
stato…. e tutto l’art. 24 della L. 241/90
13. L’informazione giuridica digitale
Accursio
Magna Glossa
XI
Corpus iuris
civilis
CODEX
Accursio
Magna Glossa
XI
Corpus iuris
civilis
CODEX
copia del contenuto
presentazione
annotazione
Caratteristiche da preservare: distinguere chiaramente fra contenuto
autorevole, metadati aggiuntivi, presentazione editoriale
14. L’informazione giuridica digitale:
Funzionalità
• Drafting cooperativo
• Tagging e annotazioni
• Tracciamento della storia del documento giuridico
• Anonimizzazione e alterazioni per la pubblicazione
• Autorevolezza, Autenticità, Autorialità, Consistenza,
Integrità
• Validità legale e preservazione nel lungo periodo
• Provenienza delle asserzioni semantiche
• Ricerche semantiche – problema dell’incrocio dei dati
15. Motivazioni per l’apertura
dell’informazione giuridica
• La libera accessibilità delle sentenze ha lo scopo di
rendere un migliore servizio al cittadino e rendere più
trasparente il sistema della giustizia in Italia:
– per le imprese per sviluppare servizi
– per gli operatori della giustizia: giudici, avvocati, liberi
professionisti
– per gli studenti e ricercatori
– per le associazioni, cittadini, attivisti.
• L’offerta di servizi su banche di dati d’informazione
giuridica è costituita da un piccolo gruppo di soggetti che
determinano una situazione di sostanziale oligopolio
17. Contesto Europeo
• CURIA – Corte di Giustizia Europea
http://curia.europa.eu/juris/document/document.jsf?text=hiv&docid=48564&pageI
ndex=0&doclang=IT&mode=req&dir=&occ=first&part=1&cid=602664#ctx1
ECLI:EU:C:2004:262
ECLI: Standard europeo
per gli URI persistenti
18. Corte di Strasburgo
• http://hudoc.echr.coe.int/sites/eng/pages/search.aspx?i=001-127055
19. Quadro normativo italiano per
favorire l’apertura delle sentenze
• Trasparenza: d.lgs. 33/2013
• Pubblicità delle sentenze: CAD, art.
56, comma 2bis
“2-bis. I dati identificativi delle questioni
pendenti, le sentenze e le altre
decisioni depositate in cancelleria o
segreteria dell'autorità giudiziaria di
ogni ordine e grado sono, comunque,
rese accessibili ai sensi dell'articolo
51 del codice in materia di protezione
dei dati personali approvato con
decreto legislativo n.196 del 2003.”
• Pubblicazione e comunicazione della
sentenza: Art. 133 Codice di
Procedura Civile
• Linee guida Garante (2 dicembre
2010)
• Privacy artt. 51 e 52, d.lgs.
196/2003 (privacy)
• Anonimizzazione: Linee guida in
materia di trattamento dei dati
personali nella riproduzione di
provvedimenti giurisdizionali per
finalità di informazione giuridica
(2 dicembre 2010)
• Pena accessoria di
pubblicazione per intero o per
estratto della sentenza nel
penale art. 186 Codice Penale
20. Linee guida del Garante Privacy
• “La diffusione dei provvedimenti giurisdizionali
costituisce fonte preziosa per lo studio e
l'accrescimento della cultura giuridica e
strumento indispensabile di controllo da parte
dei cittadini dell'esercizio del potere
giurisdizionale.
• Il Codice favorisce la più ampia diffusione delle sentenze
e degli altri provvedimenti dell'Autorità giudiziaria per i
quali sia stato assolto, mediante il deposito nella
cancellerie e nelle segreterie giudiziarie, l'onere della
pubblicazione previsto dalle disposizioni dei codici di
procedura civile e penale.”
23. Garante Privacy
“E tuttavia, la circostanza della pubblicazione integrale
delle pronunce – con anche i nominativi, per esteso,
delle parti e dei terzi coinvolti a qualunque titolo – non
può non suscitare più di una preoccupazione in ordine
alla garanzia del diritto alla protezione dei dati personali
(spesso anche sensibili e giudiziari) degli interessati.
Questa preoccupazione si fonda, in particolare, sui rischi
di indicizzazione, decontestualizzazione, finanche
alterazione dei dati stessi, inevitabilmente connessi alla
loro indiscriminata accessibilità via web; rischi ben
evidenziati dalla sentenza della Corte di giustizia
dell'Unione europea del 13 maggio scorso, in re C-
131/12 (Google-Spain).”
http://www.garanteprivacy.it/web/guest/home/docweb/-/docweb-
display/docweb/3432529
25. Punti critici
• Soggetti che hanno diritto ad accedere
• Tutto il documento o solo l’estratto
• Finalità del trattamento e pertinenza (non eccedenza)
• Le motivazioni della sentenza o solo il dispositivo
• Per quanto tempo
• In che forma e formato (XML??)
• Indicizzate dai motori generalistici
• Diritto all’oblio
• Anonimizzazione dei dati di identificazione indiretta
• De-anonimizzazione
• Metadati di ricerca
• Penale (Indagati, imputati, condannati ????)
26. OpenSentenze
• Gruppo di lavoro composto da circa 50 esperti,
professionisti, accademici:
• favorire la pubblicazione delle sentenze come dati di tipo
aperto, ai sensi dell’art 68 comma 3 del Codice di
Amministrazione Digitale (Dlgs. n. 82 del 2005) nel
rispetto delle norme sulla protezione dei dati personali;
• apertura dei dati statistici in open data;
• creare delle linee guida;
• Creare tool per facilitare il compito delle corti.
27. Soluzioni tecnologiche
possibili
• Linee guida per la pubblicazione delle sentenze in
formato aperto
• Standard: ECLI and Akoma Ntoso
ECLI/ELI per i riferimenti
Sentenza n. 12/2008 Tribunale di Milano
ECLI:IT:TRBMI:2008:S12LA
– ECLI components under national responsibility
– ECLI : [CountryCode] : [CourtCode] : [Year] : [OrdinalNumber]
(Agnoloni, Bacci, Francesconi, ITTG-CNR)
http://www.cortedicassazione.it/cassazione-
resources/resources/cms/documents/20141014_Francesconi.pdf
28. Akoma Ntoso
• Akoma Ntoso: Standard
XML per i documenti
giuridici
• Adottato dal Parlamento
EU, Camera, Senato, etc.
• Nel futuro anche dalla
Corte di Cassazione
• Non è un semplice
strumento sintattico ma
ingloba i principi ontologici
del documento giuridico
31. Soluzioni tecnologiche
possibili
• NLP tools per
– l’anonimizzazione (nomi, indirizzi, ruoli,
contesto)
– Il detecting automatico dei riferimenti
normativi e delle sentenze
• Classificazione automatica degli
oggetti/argomenti
35. Indice di rischio
• Categoria dell’oggetto della sentenza 20% (e.g., diritto di famiglia)
• Presenza di minori 30%
• Abusi sessuali 15%
• Dati sanitari 20%
• Dati sullo stato della persona 15%
36. Anonimizzazione
Hash: ossia un metodo per crittografare i dati
personali/sensibili senza cancellarli ma oscurarli a coloro
che non hanno le finalità e i permessi per accedervi
37. Conclusione e
considerazioni su JurisWiki
Lati positivi
• Difficile bilanciamento fra informazione giuridica /diritto alla conoscenza e trattamento
dei dati personali secondo finalità e pertinenza
• Positivo impulso verso il nuovo come sfida alla staticità e al monopolio
• Strumenti Web 2.0 per l’annotazione in crowdsourcing delle risorse giuridiche in linea
con l’emergente società della conoscenza
• Nuove forme imprenditoriali
Lati oscuri
• Problematica ancora aperta sulle licenze nella composizione di fonti eterogenee
provenienti dalle corti: esempio Creative Commons (CC-BY-SA 3.0) Corte
Costituzionale combinate con altre risorse del Web
• Problematica aperta sull’indicizzazione dell’informazione da parte di motori di ricerca
(Google) e gestione del diritto all’oblio – molti siti delle corti non sono indicizzati
mentre JurisWiki espone all’indicizzazione i materiali sottratti precedentemente
• Uso commerciale non autorizzato di dati sensibili – (uso di AdSense)
• Gestione della presentazione via Web delle fonti giuridiche per preservare la
semantica inclusa nella forma
• Dati sensibili relativamente specie nelle sentenze penali (pena accessoria)