Der Begriff „Forschungsdaten“ ist schwer zu fassen, da jede Fachdisziplin letztendlich ein eigenes Verständnis hat, was Forschungsdaten in dem entsprechenden Forschungsgebiet sind. Verallgemeinernd könnte man sagen, dass unter Forschungsdaten, diejenigen Daten zu verstehen sind, die im Laufe der verschiedensten fachrichtungsbezogenen Forschungsprozesse entstehen. Hierbei sind sowohl Rohdaten als auch die aus diesen abgeleiteten Forschungsergebnisse in Form von Publikationen inklusive der jeweils dazugehörigen Metadaten und Dokumentationen gemeint.
Lebenszyklus von Forschungsdaten
Das Modell des Datenlebenszyklus beschreibt Daten von deren Produktion über die Analyse und langfristigen Speicherung bis zur Zugänglichmachung und Nachnutzung. Hierzu existieren verschiedene Modelle.
Im Rahmen wissenschaftlicher Forschung entstehen digitale Daten unterschiedlichster Art. Für die dauerhafte und nachvollziehbare Bewahrung der Daten und für die mögliche Nachnutzung der Forschungsprimärdaten durch Dritte ist ein Management der Forschungsdaten erforderlich. Dieses betrifft jeden Teilschritt im Umgang mit Forschungsdaten, von der Projektplanung bis zur dauerhaften Speicherung von Daten.
Drittmittelgeber wie die Deutsche Forschungsgemeinschaft (DFG) oder die Europäische Union messen dem Forschungsdatenmanagement eine hohe Bedeutung bei und machen Vorgaben zum Forschungsdatenmanagement und auch zu Open Data in ihren Förderprogrammen.
Ein Datenmanagementplan beschreibt die im Rahmen eines Forschungsprojektes entstehenden digitalen Forschungsdaten und den geplanten Umgang mit diesen. Die Beschreibung beinhaltet dabei z.B. Angaben zu der Art der Daten und den Weg ihrer Erzeugung, verwendete Standards und Metadaten, die geplanten Maßnahmen zur Archivierung und Datenerhaltung. Darüber hinaus können DMPs Angaben über Zugriffsmöglichkeiten, Lizenzen, persistente Identifikatoren für die Datensätze oder auch Angaben zu Nutzungsmöglichkeiten über den ursprünglichen Zweck hinaus enthalten. Ein Datenmanagementplan ist ein dynamisches Dokument, dass an Änderungen im Projektverlauf angepasst wird.
Für die Erstellung von Datenmanagementplänen existieren bereits verschiedene Werkzeuge:
Research Data Management Organizer (RDMO) JGU: https://rdmo.zdv.uni-mainz.de/
https://dmponline.dcc.ac.uk/Digital Curation Center (UK) (an Horizon 2020 angepasst)
https://dmptool.org/ University of California (USA) (Beispielpläne)
Wie sollten Daten gespeichert werden?Bitte Button klicken, um Inhalt zu erweitern bzw. zu reduzieren
Zur Vermeidung von Datenverlusten sollten die Daten möglichst auf mehreren Speichermedien abgelegt werden. Es empfiehlt sich eine Datenspeicherung auf dem Universitätsserver, da für diesen regelmäßige Back-ups durchgeführt werden. Darüber hinaus sollte auf eine standardisierte Benennung geachtet werden, damit Datensätze auch nach längerer Zeit noch eindeutig identifiziert werden können. Zudem sollten die zu den Datensätzen gehörenden Metadaten erfasst und ebenfalls gespeichert werden. Des Weiteren ist, falls erforderlich (z.B. Schutz von personenbezogen Daten), für einen Zugriffsschutz zu sorgen.
Metadaten
Unter Metadaten in bibliothekarischer Hinsicht versteht man zusätzliche beschreibende Daten über Objekte, wie beispielsweise ein Buch oder eine Zeitschrift. Die Metadaten dienen dazu, Ressourcen einheitlich und strukturiert zu beschreiben. In diesem Zusammenhang sind Metadaten z.B. Angaben über den Autor oder das Erscheinungsjahr. Sollen beispielsweise Forschungsdaten in ein Repositorium eingestellt werden, sind Metadaten zum Verständnis des Datensatzes, für die Nachnutzbarkeit sowie für die Durchsuchbarkeit des Repositoriums notwendig. Zur einheitlichen Erfassung von Metadaten existieren allgemeine Standards wie z.B. Dublin Core als auch fachspezifische Standards wie ISO 19115 (Geowissenschaften).
Langzeitarchivierung
Die dauerhafte Speicherung von digitalen Daten ist eine große Herausforderung. Die Daten sollen nicht nur langfristig als Bitstream abgelegt werden, sondern auch lesbar und auffindbar bleiben. Da sich Softwareumgebungen und auch die Speichermedien beständig ändern, ist sowohl dafür zu sorgen, dass die zum Lesen und erstehen der Daten notwendigen Softwareumgebungen nachgebildet werden können (Emulation) und auch der Bitstream in seiner genauen Abfolge auf Dauer erhalten bleibt und dem ursprünglichen Bitstream entspricht. Es ist von Bedeutung nicht-proprietäre und dokumentierte Softwareformate zu verwenden. Die Langzeitarchivierung kann nur dann erfolgreich sein, wenn Sie standardisierten Abläufen folgt.
Archiv der JGU: https://researchdata.uni-mainz.de/wiki-archiving-research-data/
Datenveröffentlichung
Datenrepositorien bieten die Möglichkeit zur Veröffentlichung von Forschungs(roh)daten. Auf diese Weise werden auch Forschungs(roh)daten zitierbar und sind aber auch für andere Wissenschaftler/-innen nachnutzbar. Die JGU bietet demnächst zur Veröffentlichung und Speicherung von Forschungsdaten ein Repositorium an.
Eine Übersicht über ca. 1500 verschiedenste fachspezifische Datenrepositorien bietet re3data.
Als allgemeines Repositorium für die Veröffentlichung von Artikeln und Forschungsprimärdaten kann z.B. „Zenodo“, das vom CERN betreut wird, verwendet werden. Datenpakete können bis zu einer Größe von 50 Gigabyte in Zenodo gespeichert werden. Neben der Open Data Option ist es auch möglich, Daten für eine gewisse Zeit zugriffsgeschützt abzulegen.
Persistente Identifikatoren (PID)
PIDs dienen dazu digitale Objekte eindeutig und dauerhaft zu identifizieren und auf diese Weise auffindbar zu halten. PIDs verhindern die Entstehung von dysfunktionalen Links, beispielsweise bei Änderung der Internetadresse eines Verlages. Es gibt verschiedene Arten von PIDs, wie beispielsweise DOI, Handle, URN etc.
Digital Object Identifier (DOI): http://www.doi.org/ Die DOI ist unter den PIDs am bekanntesten und auch international am weitesten verbreitet. DOIs sind im akademischen Bereich kostenfrei.
Handle: http://www.handle.net/ Handle ist ein weiterer international häufig verwendeter PID. Das DOI System basiert z.B. auf Handle. Ggf. mit geringen Kosten verbunden.
Uniform Resource Name (URN): http://www.dnb.de/DE/Netzpublikationen/URNService/urnservice_node.html URNs werden in Deutschland kostenlos über die Deutsche Nationalbibliothek vergeben und verwaltet. URNs werden für Publikationen vergeben und sind den meisten vermutlich aus Bibliotheken bekannt. URNs sind eher in Europa gebräuchlich.
Persistent Uniform Resource Locator (PURL): https://archive.org/services/purl/ werden vor allem in Nordamerika verwendet (z.B. in Bibliotheken) und ähneln einer HTTP Weiterleitung.
Im Zusammenhang mit Open Data wird oft gefordert, dass Daten FAIR sein sollen. D.h.:
Findable
Accessible
Interoperable
Reusable
Weitere Informationen finden Sie hier:
https://www.go-fair.org/fair-principles/
https://blogs.tib.eu/wp/tib/2017/09/12/die-fair-data-prinzipien-fuer-forschungsdaten/
38 Absatz 4: Der Urheber eines wissenschaftlichen Beitrags, der im Rahmen einer mindestens zur Hälfte mit öffentlichen Mitteln geförderten Forschungstätigkeit entstanden und in einer periodisch mindestens zweimal jährlich erscheinenden Sammlung erschienen ist, hat auch dann, wenn er dem Verleger oder Herausgeber ein ausschließliches Nutzungsrecht eingeräumt hat, das Recht, den Beitrag nach Ablauf von zwölf Monaten seit der Erstveröffentlichung in der akzeptierten Manuskriptversion öffentlich zugänglich zu machen, soweit dies keinem gewerblichen Zweck dient. Die Quelle der Erstveröffentlichung ist anzugeben. Eine zum Nachteil des Urhebers abweichende Vereinbarung ist unwirksam. Es ist demnach nach Ablauf eines Jahres möglich, Zeitschriftenartikel z.B. im instutionellen Repositorium der JGU ((https://openscience.ub.uni-mainz.de/) zu veröffentlichen. Dies ist z.B. relevant für die Erfüllung der Open Access Verpflichtung in Horizon 2020 Projekten. Die Webseite SHERPA/RoMEO http://www.sherpa.ac.uk/romeo/index.php informiert zu Copyright Regelungen und Selbstarchivierungsvorgaben der verschiedensten wissenschaftlichen Verlage/Journale. CC-Lizenzen https://de.creativecommons.org/ sind standardisierte Lizenzverträge mit deren Hilfe Urheber ihre digitalen Objekte in verschiedenen Graden zur Nutzung freigeben können. Im wissenschaftlichen Bereich ist die Verwendung von CC BY gebräuchlich. Beispiele: CC 0: Keine Rechte vorbehalten CC BY: Namensnennung CC BY SA: Namensnennung-Share Alike CC BY ND: Namensnennung – Keine Bearbeitungen Informationen zu Open-Source-Software sowie eine Handreichung für die JGU zur Lizensierung von Software unter Open-Source-Lizenzen finden sich unter https://forschung.uni-mainz.de/files/2019/03/Open_Source_Lizenzen.pdf.Urheberrechtsgesetz - Open Access Veröffentlichung von Zeitschriftenartikeln
SHERPA/RoMEO
Creative Commons Lizenzen (CC-Lizenzen)
Open-source-software
Im Umgang mit personenbezogenen Daten, z.B. im Rahmen von Interviews/Befragungen etc. sind das Bundes- und das Landesdatenschutzgesetz sowie die europäische Datenschutz-Grundverordnung zu berücksichtigen.
Bei Fragen zum Datenschutz nehmen Sie bitte Kontakt zu den für Sie zuständigen Datenschutzbeauftragten auf. Für die JGU finden Sie diese unter https://organisation.uni-mainz.de/datenschutzbeauftragter/.
Handreichungen
Rechtliche Fragen zur Bereitstellung von Forschungsdaten
Vorträge
FORSCHUNGSDATEN@RMU 2023
Prof. Dr. Peter Pelz: Presentation_231109_Forschungsdaten_RMU_Pelz
Henriette Senst: 20231109_RMU_Keynote_Senst
Marina Lemaire: 2023-11-09-FDM_Geisteswissenschaften_RMU
Fabian Cremer: 231109-RMU-fcremer-IEG-FDM
Prof. Dr. Birgitt Röttger-Rössler und Camilla Heldt: Data Affairs Nov 23-2
Dr. Yasmin Demerdash und Sarah Wettermann: Bridging_the_gap_Demerdash_Wettermann
Prof. Dr. Harald Schwalbe: Forschungsdatenmanagement_Schwalbe_09112023
Lukas Hellmann: 2023-11-09 ELN@RMU Hellmann Lukas
Dr. Johann Isaak: RMU_day_Isaak
FORSCHUNGSDATEN@RMU 2021
Datenkompetenz von Anfang an - Bachelor und Masterstudium Maschinenbau -
Sustainable Engineering https://zenodo.org/record/5669216#.YwXPAHFBy-Z
Aktionstag Forschungsdaten 2021 - RDM Day 2021
Servicezentrum Digitalisierung und Fotodokumentation
FORSCHUNGSDATEN@RMU 2020 am 13. Oktober 2020
Programm FORSCHUNGSDATEN@RMU 2020
"Urheberrecht und Daten im Wissenschaftskontex"
„Forschungsdatenmanagement strukturiert angehen - mit RDMO zum eigenen Datenmanagementplan (DMP)“
Aktionstag Forschungsdaten am 13. Juni 2018
"Vorstellung des Kompetenzteams Forschungsdaten"; Dr. Anne Vieten
Von Forschungsdaten zu Projekten; Aline Deicke
"Wer sammelt Forschungsdaten? Das passende Repositorium mit re3data finden"; Frank Tristram
Aktionstag Forschungsdaten 26. Juni 2019
"NFDI Status Quo"; Prof. Dr. Kai-Christian Bruhn
"Wer braucht schon Datenmanagementpläne?"; Franziska Helbing
"Datenschutzrechtliche Fragen beim Umgang mit Forschungsdaten"; Dr. Sebastian Golla