Wikidata +
Pressearchiv 20. Jh.

Netzwerk Pressedokumentation, 5.5.2022

Joachim Neubert

ZBW - Leibniz Informationszentrum Wirtschaft

Agenda

  1. Was ist und wie funktioniert Wikidata?
  2. Wie können Archive
    • es nutzen?
    • sich verlinken?
    • beitragen?

Wikidata ist …

… eine freie, kollaborative und vielsprachige Wissensdatenbank.

  • Daten für alle Zwecke frei verfügbar (CC0-Lizenz)
  • jede/r kann ändern (wie in Wikipedia)
  • Inhalte für alle Sprachen verfügbar

Strukturierte Daten

Beispiel-Item

aagarwal

Nutzung - Schnittstellen

Verlinkung zu externen Daten - Beispiel

Verlinken auf Wikidata als Hub

eigene Sektion auf den Wikidata-Webseiten:
Identifier / Bezeichner

Verlinkungs-Mechanismus

  • ca. 4000 Properties vom Datentyp “external-id”
  • große Vielfalt, z.B.:
    • GND / VIAF / Geonames IDs
    • Proteine
    • afrikanische Pflanzen
    • schwedische Kulturerbe-Objekte
  • funktionsfähige Links (in Verbindung mit einem URL-Template)
  • die Einrichtung von neuen Properties kann jede/r beantragen (Beispiel)
  • Toolunterstützung, insbesondere Mix-n-Match

Wie können Archive beitragen?

z.B. Pressemappe 20. Jahrhundert

  • alle 5.266 Personenmappen verlinkt (346 neue Items)
  • zusätzliche Daten (z.B. Berufsangaben für Wirtschaftswissenschaftler/innen)
  • zusätzliche Verknüpfungen (z.B. Familie Warburg)
  • in Abfragen und Anwendungen nutzbar
    • z.B. Karte von Wirtschaftswissenschaftler/innen der Pressemappe per Wikidata-Abfrage

Agieren in der Wikidata-Community

  • Beteiligung mit individuellem User (tunlichst unter Offenlegung der beruflichen Einbindung - Beispiel)
  • keine zentrale Entscheidungsstruktur
  • Konsensbildung, mit dem Project Chat als wichtigstem Forum
  • Mailingliste / “Weekly Summary”
  • WikiProjects, um Themen zu fokussieren (oft auch gute Anlaufstelle für Datenstrukturierung)

z.B.

wikiproject pm20

Wikidata für Archive

  • erhöhte Sichtbarkeit (zusätzlicher Discovery-Kanal)
  • Kontextualisierung für die eigenen Bestände, ohne die Daten selbst erheben/speichern zu müssen
  • Crowdsourcing für eine erweiterte Erschließung?
  • Andocken an weltgrößten Linking Hub
  • niedrigschwelliger Einstieg in Linked Open Data

Vielen Dank -
Fragen willkommen!

Joachim Neubert
j.neubert@zbw.eu
auf Wikidata: Jneubert
zbw logo

zusätzliches Material

Qualitätssicherung bei Wikidata

  • Jeder kann alles ändern: Chancen des Crowdsourcings ./. Gefahr der Kompromittierung
  • Grundansatz: Anforderung, für jeden einzelnen Fakt Quellen zu benennen
  • Unterstützung von Autor/innen bei der Eingabe durch Constraints (z.B. Format ISBN, z.B. Geburtsdatum < Todesdatum)
  • alle Versionen bleiben mit Autor, Änderungszeitpunkt und Inhalt erhalten
  • Zurücksetzen einer Änderung technisch sehr einfach

revision history gandhi

Automatische Tools zur Vandalismuserkennung

  • Patroling ist Handarbeit => Fokussierung unerlässlich
  • Tools zur Filterung aller händischen Änderungen auf “verdächtige” (z.B. “neuer Editor löscht Statement”)
  • zunehmender Einsatz von regelbasierten oder machine-learning Tools