Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen
1. Was wir HEUTE beachten müssen ...um die Wissenschaftler in 10 Jahren nicht zu enttäuschen Dipl. Sozw. Ralf Stockmann, SUB Göttingen
2.
3. These Der Umgang mit digitalen Daten wird die Wissenschaften genauso verändern wie der Buchdruck Aber: es gibt nicht „DIE Wissenschaft“ sondern viele Disziplinen mit teils gegensätzlichen Anforderungen und Erwartungen
4. Zoologie vs. Wissenschaftsgeschichte Zoologie Verzeichnis der Erstbeschreibungen von Tieren Sehr schneller Zugriff auf gut ausgezeichnete Seiten (nicht: Seitenzahlen, Kapitel) Best practice: kleine bitonaleScans, <1 Sekunde für Seitenwechsel, kein Download Wissenschaftsgeschichte Detailanalye einzelner Seiten, Feinheiten wie Wasserzeichen interessant Best practice: hochauflösende Farbscans, Downloadmöglichkeit der vollen Auflösung, Online-Editor für Bildmanipulationen (MPI für Wiss.Gesch.)
5. Digital != Digital Astrophysik: die NASA hat bereits alles digitalisiert Medizin: digitalisierte Bücher töten Menschen
7. Verfügbarkeit„Es ist da, ich kann es finden und nutzen“ 24 / 7 Fehler werden auftreten und sind nicht zu verhindern Europeana Internet-Manifest Klare Kommunikationsstrategien über Ausfälle Indexierbar / Harvestbar denn: verfügbar ist das, was ich finde ohne es gesucht zu haben Reaktion auf Nutzereingaben: < 1 Sek, max. 3 Sek Bedienung
8. Bedienung ist ein Teil von Verfügbarkeit! 10% für GUI / Design Projektkosten
12. Qualität Orientierung an Praxisregeln der DFG 300 dpi Farbe, 600 dpibitonal „echte“ optisch aufgelöste dpi! Farbkalibrierung? Farbkeil reicht Bestmögliche Bildqualität pro Kilobyte Dateigröße JPG2000 ? Bildoptimierung nur wo es sinnvoll ist Entzerrung fragwürdig Qualitätskontrolle: Vollständigkeit, dem Ziel angemessen
14. Semantik Korrigierte bibliographische Daten Digitalisierung als Maßnahme der Katalogshygiene Volltexte zu vertretbaren Preisen < 1 Cent pro Seite Fraktur OCR läuft uns nicht weg: 5 Jahre warten Keine händischen Korrekturen, lieber regelmäßig Fortschritte der Technik nutzen Kollaborative Ansätze unterstützen (WikiSource)
15. „kluger“ Volltext Nicht in Suchindex verstecken, sondern neben Digitalisat präsentieren Beurteilung von Qualität der OCR und damit der Verlässlichkeit der Suche Wortkoordinaten Download im TEI Format Adressierbarkeit beliebig granularer Einheiten (Kapitel, Absatz, Satz, ...) Erschlossen durch Normdaten PND,
20. Überwindung der Provinienz Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur steht. Noch viel weniger interessiert ihn, in welchem Repository er die digitale Fassung gefunden hat. Digitale Werkzeuge MÜSSEN system- und applikationsübergreifend funktionieren: Bookmarking Vernetzung Kommentierung Kollaboration
21. ACHTUNG! Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem Rücken der Forscher austragen Wir brauchen keinen Wettbewerb um lokal implementierte Features, sondern einen Wettbewerb um die beste Implementierung offener Standards Im Zweifelsfall werden die Wissenschaftler in Zukunft dahin gehen wo Vernetzung funktioniert (Google)
22. Rundumlösung vs. vernetze Dienste Google: Suche Mail Maps Kalender News Docs Picasa (Bilder) Nur durch ein Single Sign On verbunden
23. ToDo‘s Digitalisierung in hoher Qualität (Digital Master) Mehrere Derivate für unterschiedliche Nutzungsszenarien anbieten So viele (Meta)Daten wie möglich freigeben Systematisch „kluge“ OCR vorantreiben Softwareentscheidungen nicht (nur) danach treffen welche Features angeboten werden sondern welche Schnittstellen