Dr. Florina Mihaela Piroi, Senior Researcher an der TU Wien
Ich bin Senior Researcherin mit langjähriger Erfahrung im Bereich Information Retrieval Evaluation (IR Evaluation). Gemeinsam mit Kollaborationspartnern an der TU Wien und RSA DSc nutzen wir sogenannte „Test Collections“, um Hypothesen zur Informationextraktion und -verarbeitung (Information Extraction and Processing) zu testen und Suchergebnisse der unterschiedlichen Suchmaschinen zu vergleichen. Die Test Collections kommen von verschiedenen Domänen und beinhalten Dokumente von Erfindungen (z.B. Patentdokumente), wissenschaftliche Artikel, Tweets, Logfiles oder auch Bilddateien. Hierbei wird es immer wichtiger die Daten gut zu dokumentieren, entsprechend der FAIR Prinzipien, da das Verständnis der Daten eine entscheidende Komponente für ein gutes IR-System ist.
Aus meiner persönlichen Erfahrung kann ich berichten, dass Daten mit denen wir arbeiten, selten so gut beschrieben, dass ihre Anwendung einfach ist – es sei denn, wir sind der Ersteller dieser Daten. Bei den von uns erstellten Datensätzen bemühen wir uns, sie so zu beschreiben, dass andere Forscher sie leicht weiterverwenden können, und wir stellen sie über institutionelle Websites zur Verfügung.