FAIR Prinzipien

FORCE11, eine Gruppe aus Forschenden sowie Mitarbeitenden von Bibliotheken, Archiven, Verlagen und Forschungsförderern, hat 2016 Prinzipien zur Aufbereitung von Forschungsdaten verfasst. Die sogenannten FAIR-Prinzipien umfassen vier Ziele : die Auffindbarkeit (Findable), Zugänglichkeit (Accessible), Interoperabilität (Interoberable) und Wiederverwendbarkeit (Reusable) von Daten. Mit dem Erreichen dieser Ziele, soll die nachhaltige Nachnutzbarkeit von Forschungsdaten gewährleistet werden.

Biernacka, Katarzyna, Buchholz, Petra, Dolzycka, Dominika, Helbig, Kerstin, Neumann, Janna, Odebrecht, Carolin, … Wuttke, Ulrike. (2020). Train-the-Trainer Konzept zum Thema Forschungsdatenmanagement (Version 3.0). Zenodo. http://doi.org/10.5281/zenodo.3938533 S.39, Creative Commons Attribution 4.0 International

Dauer: 4:54 Min

Inhalt: In diesem Video werfen wir einen Blick auf FAIR-Daten und die Bedeutung der einzelnen FAIR-Prinzipien (findable = auffindbar, accessible = zugänglich, interoperable = interoperabel und reusable = wiederverwendbar). Es wird auch behandelt, wie (vertrauenswürdige) Datenrepositorien eine Schlüsselinfrastruktur sind, die FAIR-Daten ermöglicht. (Video auf Englisch)

Ghent University Data Stewards (2020). Knowledge clip: FAIR data principles. Available at: https://youtu.be/2uZxFu9SFi8

Lizenz: CC BY 4.0

Transcript

Was sind die FAIR-Prinzipien und was sind FAIR-Daten? FAIR sind eine Reihe von Leitprinzipien, die die Wiederverwendung von Daten durch Menschen und Maschinen ermöglichen und verbessern. FAIR ist ein Akronym, das für Findable, Accessible, Interoperable und Reusable steht. Die FAIR-Prinzipien stammen ursprünglich aus den Lebenswissenschaften, lassen sich aber auf alle Disziplinen anwenden. Sie gewinnen zunehmend an Bedeutung und werden unter anderem von vielen Forschungsförderern gefordert. Werfen wir einen Blick darauf, was die einzelnen FAIR-Prinzipien bedeuten.

FINDABLE (auffindbar): Um ihre Auffindung zu ermöglichen, sollten die Daten mit umfangreichen Metadaten beschrieben und mit einer dauerhaften Kennung versehen werden, z. B. einem digitalen Objektidentifikator (DOI). Diese Metadaten sollten online in einer durchsuchbaren Ressource wie einem Datenkatalog oder Repositorium verfügbar sein.

ACCESSIBLE (zugänglich): Metadaten und/oder die Daten selbst sollten über ihre dauerhafte Kennung mit einem Standardkommunikationsprotokoll wie HTTP oder HTTPS abrufbar sein. Das bedeutet, dass die Metadaten oder Daten über die dauerhafte Kennung abrufbar sein sollten. Beachten Sie jedoch, dass "zugänglich" nicht bedeutet, dass die Daten in dem Sinne offen sein müssen, dass es keine Zugriffsbeschränkungen gibt. Es bedeutet vielmehr, dass die Zugangsbedingungen für die Daten sowohl für Menschen als auch für Maschinen klar sind. Daher sollte das Protokoll für den Zugriff auf die Daten gegebenenfalls ein Authentifizierungs- und Autorisierungsverfahren vorsehen. Darüber hinaus sollten die Metadaten auch dann noch zugänglich sein, wenn die Daten selbst nicht mehr verfügbar sind.

INTEROPERABLE (interoperabel): Wann immer möglich, sollten Metadaten und Daten anerkannte Standards verwenden. Durch die Verwendung von Formaten, Begriffen oder Vokabularen, auf die sich eine Gemeinschaft geeinigt hat, stellen wir nicht nur sicher, dass unsere Daten für andere verständlich sind, sondern wir ermöglichen auch den Austausch und die Kombination von Daten über Computersysteme hinweg. Zur Interoperabilität gehört auch die Bereitstellung von Kontext, indem Verweise auf andere relevante Metadaten und Daten aufgenommen werden. Zum Beispiel durch die Verknüpfung mit einem anderen Datensatz, auf dem Ihr Datensatz aufbaut.

REUSABLE (wiederauffindbar): Daten sollten nicht nur verfügbar, sondern auch effektiv wiederverwendbar sein. Um dies zu erreichen, sollten die Daten in Übereinstimmung mit den Standards der Forschungsgemeinschaft umfassend beschrieben und dokumentiert werden. Metadaten und Dokumentation sollten in der Lage sein, die W-Fragen zu beantworten, damit andere verstehen können, was wir die Herkunft der Daten nennen. Mit anderen Worten: Woher kommen die Daten und was ist mit ihnen auf dem Weg dorthin geschehen? All dies ist notwendig, wenn wir wollen, dass andere den Kontext der Daten verstehen und beurteilen können, wie relevant und nützlich sie sind. Die Wiederverwendbarkeit von Daten erhöht das Vertrauen und die Wahrscheinlichkeit der Wiederverwendung. Außerdem müssen wir andere darüber informieren, welche Arten der Wiederverwendung erlaubt sind, indem wir eine klare Datennutzungslizenz hinzufügen.

Angesichts der vielfältigen Aspekte von FAIR sind Daten nicht entweder FAIR oder UNFAIR. FAIR ist ein Spektrum, d. h. Daten können mehr oder weniger FAIR sein. Wie können Sie also Ihre Daten FAIR machen? Leider gibt es kein Patentrezept, aber ein Großteil der Arbeit, um Ihre Forschungsdaten FAIR zu machen, kann durch die Hinterlegung Ihrer Daten in einem vertrauenswürdigen Datenspeicher erledigt werden. Durch die Wahl eines geeigneten vertrauenswürdigen und vorzugsweise domänenspezifischen Repository können Sie viele Punkte im FAIR-Spiel sammeln. Wenn Sie Ihre Daten in ein Repository hochladen, müssen Sie in der Regel Metadaten in einem Formular angeben. Die Elemente des Formulars entsprechen einem bestimmten Metadatenstandard. Ihre Metadaten werden dann in einer Online-Ressource maschinenlesbar und durchsuchbar. Das Repository sollte auch einen dauerhaften Identifikator für Ihre Daten erzeugen. Es wird auch die Möglichkeit bieten, Verweise auf andere Daten oder Metadaten aufzunehmen, z. B. um auf verwandte Datensätze oder Ihre ORCiD zu verweisen. Darüber hinaus verfügen vertrauenswürdige Repositories über Authentifizierungs- und Autorisierungsverfahren, die sicherstellen, dass angemessene Zugangsbedingungen für die Daten eingehalten oder durchgesetzt werden. Außerdem können Sie bei Repositories zwischen maschinenlesbaren Lizenzen wählen, was die Wiederverwendbarkeit Ihrer Daten erhöht. Bei fachspezifischen Repositories werden in der Regel Fachstandards und kontrollierte Vokabulare verwendet, was die Interoperabilität Ihrer Daten erhöht.

Datenrepositorien sind in der Tat eine wichtige Infrastruktur, die FAIR-Daten ermöglicht. Sie werden Ihnen jedoch nicht die ganze Arbeit abnehmen. Schließlich sind Sie derjenige, der die Daten am besten kennt. Sie sind also immer noch dafür verantwortlich, umfangreiche Metadaten und Dokumentationen bereitzustellen, um die Daten verständlich zu machen. Und wenn ein fachspezifisches Repositorium verlangt, dass die Daten in einem bestimmten Standardformat vorliegen und kontrollierte Vokabulare verwendet werden, ist es immer noch Ihre Aufgabe, den Standardisierungsprozess durchzuführen. Je früher die Daten auf FAIR Art und Weise gesammelt und verwaltet werden, desto einfacher wird es sein, die Daten letztendlich FAIR zu halten. Dies wird manchmal als "FAIR by design" bezeichnet. Deshalb ist es wichtig, die Datenverwaltung zu planen, noch bevor Sie mit der Datenerhebung beginnen. Sind Sie also bereit, Ihre Daten FAIR zu machen?

Zitationshinweis

FAIR Data Austria (2021). „FAIR Prinzipien“. In: Offene Bildungsressourcen Forschungsdatenmanagement. (https://fair-office.at/index.php/fair-prinzipien/)

Lizenz: CC BY 4.0 soweit nicht anders angegeben.

FAIR Prinzipien

Quiz

Weiterführende Informationen

Kommentar in Nature bezüglich FAIR Prinzipien

FAIR-Prinzipien und die Europäische Kommission

GO FAIR Initiative

Das GO FAIR Austria office , das Teil der globalen GO FAIR Initiative ist, vernetzt Forschende und Serviceeinrichtungen zur Umsetzung der FAIR Prinzipien

Trainingsmaterial zum Thema „FAIR“ im Train-the-Trainer-Programm zum Forschungsdatenmanagement

OPENAIRE

FAIR-Prinzipien and das Committee on Data for Science and Technology (Codata)

Zitationshinweis