Publikation von Daten

Repositorien

Repositorien sind Datenbanken, in denen digitale Objekte archiviert, dokumentiert und publiziert werden können. Es sind Speicherorte, die eine zeitlich und räumlich vom wissenschaftlichen Artikel selbst unabhängige Veröffentlichung und Archivierung von Forschungsdaten ermöglichen.

Je nach Repositorium können Daten, Datensätze, Experiment- und Auswertungsbeschreibungen, audiovisuelle Objekte wie Bild- und Videodateien, Modelle von Simulationen oder auch Software veröffentlicht werden. In manchen Repositorien können ganze Forschungsdatensätze in ihrer komplexen Form als Einheit (z. B. „Collection“ bei PANGAEA) abgelegt werden. read more

  

Dauer:  6:23 Min

Inhalt: „Forschungsdaten zu Publikationen“ ist ein Lehrvideo in dem anhand eines fiktiven Beispiels gezeigt wird, wie mit Forschungsdaten, die Grundlage einer Publikation sind, verfahren werden kann. Es wird erklärt, wie solche Daten bewusst ausgewählt, nachvollziehbar strukturiert und schließlich auf einem Repositorium öffentlich zur Nachnutzung bereitgestellt werden können.

Schmitz, D., Hausen, D., Trautwein-Bruns, U. (2018). „Forschungsdaten zu Publikationen“ RWTH Aachen University, DOI: 10.18154/RWTH-2018-224187

Lizenz: CC BY 4.0

In diesem Beitrag aus der Reihe zu Forschungsdatenmanagement geht es um Forschungsdaten zu Publikationen. Louise Leader denkt an ihr Projekt zurück: Die Populationsdynamik von Eichhörnchen. Es war ein tolles Projekt und sie hat zusammen mit Frank und Rachel daraus hervorragende Veröffentlichungen gemacht, die häufig zitiert wurden. Louise Leader ist überrascht, immer wieder wird sie noch auf ihre Forschung und ihre Publikationen angesprochen. Noch weit nach Projektende wollen andere Forscher auf ihre Daten zugreifen. Natürlich hat sie die Daten archiviert. Auch Frank und Rachel haben das getan, aber es kostet sie doch immer wieder ordentlich Aufwand, um die Daten herauszusuchen, sich neu einzufinden und die Daten so bereitstellen zu können, wie der nächste sie benötigt. So hat sie zum Beispiel ein langes Gespräch mit Remy Reuse gehabt, der die Daten in seinem Projekt zur Evaluation von Eichhörnchen in ganz Europa nachnutzen möchte.

Was könnte sie besser machen? Was sollte sie mit den Daten tun, die Grundlage einer Publikation sind? Den Regeln der guten wissenschaftlichen Praxis hat sie entsprochen. Die Daten sind archiviert, aber bei dem, was sie an Aufwand jetzt hinein stecken muss, würde sie gerne eine bessere Lösung finden. Eigentlich wünscht sich Louise drei Dinge: Sie möchte, dass sie die Daten direkt zu den Publikationen findet. Das heißt, dass sie nicht lange in alten Archivordnern rumsucht, sondern wirklich direkt von der Publikation zu den Daten kommt. Außerdem sollen alle Informationen, die sie braucht um die Daten zu verstehen, direkt bei den Daten sein, damit sie für sie und für andere leicht verständlich sind. Und eigentlich wäre sie froh, wenn nicht sie immer die Daten bereitstellen müsste, sondern, dass die Nachnutzer die Daten selber zugreifen können.

In diesem Kontext fällt ihr das Stichwort FAIR ein: Sie erinnert sich daran, dass viele Kollegen gerade darüber sprechen, dass ihre Daten FAIR werden. Dabei geht es eigentlich um dasselbe: Die Anforderungen, die sie hat, da kommt nur noch ein Aspekt hinzu, denn neben dem Auffinden, also Daten findable zu machen, geht es bei FAIR darum, dass die Daten zugreifbar sind, so wie sie sich das vorgestellt hat, accessible; aber auch, dass die Daten interoperabel sind, also, dass sie mit den Daten von anderen gut zusammenpassen. Und eben schließlich, dass sie nachnutzbar sind, reusable. Louise beschließt, dass auch ihre Daten in Zukunft FAIR sein sollen, sie weiß aber auch, dass das nicht einfach ist. Wichtig sind ihr kleine Schritte: Zunächst einmal geht es ihr darum, die Daten, die zu einer Publikation gehören, damit zu verknüpfen. Sie nimmt sich deshalb vor, in Zukunft, wenn sie Daten zu einer Publikation hat, diese bewusst auszuwählen, dass sie wirklich genau darauf sieht, welche Daten sind in diese Publikation eingeflossen, und daraus eine Zusammenstellung zu machen. Überflüssige Versionen, andere Fehlversuche, all das ist in der Zusammenstellung nicht enthalten.

Wichtig ist aber, dass die Zusammenstellung verständlich ist. Sowohl was die Struktur, als auch, was die Benennung angeht und, dass die Kontextinformationen, die wichtig sind, um die Daten zu verstehen, mitarchiviert werden - möglichst innerhalb der Struktur. Für die Archivierung setzt sie auf einen professionellen Archivdienst, zum Beispiel auf das Archiv ihrer Einrichtung, das ihr die zehn Jahre gute wissenschaftliche Praxis garantiert. Und schließlich sollen die archivierten Daten auf jeden Fall einen Persistent Identifier bekommen, denn damit kann sie die Daten zu ihrer Publikation verknüpfen. Zwar war bisher die Publikation von Forschungsdaten für Louise kein Thema, aber mit Rückblick auf ihr Projekt, wo sie die Daten nicht mehr selber nachnutzen möchte, aber viel Aufwand damit hat, die Daten anderen bereit zu stellen, sieht es nach einer sinnvollen Option aus. Was muss sie tun, um ihre Daten zu veröffentlichen? Zunächst muss sie ein geeignetes Repositorium finden, das, auf dem ihre Daten dann öffentlich zugänglich sind. Auch hier muss es natürlich einen Persistent Identifier (PID) geben, zum Beispiel, typischerweise eine DOI. Darüber sind ihre Daten eindeutig zitierbar. Bei einer Veröffentlichung von Daten ist es analog wie bei der Archivierung.

Die Dokumentation muss enthalten sein und zwar eine nachvollziehbare, verständliche Dokumentation, erst recht wenn die Daten publiziert werden und ohne direkten Kontakt zum Erzeuger der Daten nachgenutzt werden sollen. Außerdem ist zu regeln, ob es Einschränkungen gibt, wie die Daten von anderen wiederverwendet werden können. Zum Beispiel in Form von Lizenzen. Bei den Daten von Louise handelt es sich um Daten aus einem öffentlich geförderten Projekt, da will sie möglichst offene Lizenzen verwenden. Wie kann so eine Verknüpfung aussehen? Hier ist ein Beispiel für die Verknüpfung einer Publikation mit veröffentlichten Forschungsdaten.

Zur Dissertation sind hier verschiedene Daten entstanden, die direkt auf der Detailseite verlinkt werden und zu einem eigenen Eintrag führen, über den die Daten direkt heruntergeladen werden können und von anderen genutzt werden können. Auch wenn die Daten nicht publiziert werden können, ist es möglich, eine Verknüpfung zu den archivierten Daten zu machen. Zu diesem Journal-Artikel gibt es innerhalb der Referenzen einen Verweis auf ein Archiv. Explizit ist der Hinweis hier, dass die Daten primär für die interne Nutzung sind. Das heißt Zugriff auf die Daten haben an dieser Stelle nur die Dateneigner, aber jemand von extern erhält zumindest ein Kontaktformular, mit dem er mit dem Erzeuger in Kontakt treten kann und nachfragen kann, ob der Zugriff auf die Daten gegebenenfalls möglich ist. Wenn auch Sie Fragen haben zu der Verknüpfung von Daten und Publikationen, zur Datenarchivierung oder Daten-Publikationen, dann kontaktieren Sie uns einfach über das Service-Desk.

Quiz

Willkommen bei Ihrem Forschungsdaten zu Publikationen Quiz.

Bitte klicken Sie auf Weiter, um das Quiz zu starten.


Weiterführende Informationen

Repositorien – Daten professionell zur Verfügung stellen:

Eine ausführliche Erklärung von Repositorien mit Beispielen und weiterführenden Links.

https://www.forschungsdaten.info/themen/veroeffentlichen-und-archivieren/repositorien/

Zitationshinweise

FAIR Data Austria (2021). „Publikation von Daten“ . In: Offene Bildungsressourcen Forschungsdatenmanagement. (https://fair-office.at/index.php/publikation-von-daten/).

Lizenz: CC BY 4.0 soweit nicht anders angegeben.