Häufig gestellte Fragen
Was sind Forschungsdaten?
Der Ausdruck "Forschungsdaten" umfasst sämtliche im Rahmen des Forschungsprozesses erhobenen Daten, auf deren Grundlage der schlussendliche Erkenntnisgewinn publiziert wird. Dabei spielen Format, Datentypus, Umfang o.ä. keine Rolle. Zu den Forschungsdaten gehören daher mithin Texte, Datenbanken, Tabellen, Messreihen, Video- und Audio-Aufzeichnungen, Grafiken, Modelle, Software, Umfragen uvm.
Die Datenkultur ist dabei sehr stark abhängig vom Fach und seinen tradierten Methoden. So mag man bei "Forschungsdaten" zunächst ausschließlich an die Erhebungen empirisch arbeitender Fächer denken, jedoch wäre dies zu kurz gegriffen. Auch in den qualitativ textkritisch arbeitenden Fächern, in der bildlichen oder darstellenden Kunst und in der Musik fallen Daten an. Bei der Aussage "ich erhebe gar keine Forschungsdaten" handelt es sich daher um ein Missverständnis, welches oft von einer zu stark eingrenzenden Definition von "Daten" ausgeht.
Was ist Forschungsdatenmanagement
Unter Forschungsdatenmanagement versteht man alle Prozesse, die dazu führen, dass Forschungsdaten nachhaltig zugänglich gemacht werden. Im Vordergrund steht hierbei der Gedanke, dass Forschende ihre Daten derart aufbereiten und zur Verfügung stehen, dass ihre Forschungsergebnisse von anderen nachvollzogen und reproduziert werden können. Darüber hinaus spielt die Verarbeitung von Meta-Daten eine große Rolle, sowohl in der Verlinkung von Datensätzen als auch als eigenes Forschungsfeld.
Das Forschungsdatenmanagement umfasst dabei alle Stationen des "Datenlebenszyklus" und beginnt bereits in der Planungsphase eines Projekts.
Wofür brauche ich Forschungsdatenmanagement?
Vor allem in Fächern mit wenig ausgeprägter Datenkultur kommt rasch die Frage auf, wofür man ein umständliches Forschungsdatenmanagement benötigt, zumal dieses viel Zeit in Anspruch nehmen kann und für den Datenerzeuger selbst wenige Vorteile zu haben scheint. Schließlich handelt es sich bei den erhobenen Daten um etwas "eigenes", das man selbst erarbeitet hat und das daher nach Möglichkeit nur für die eigenen Publikationen genutzt werden können soll.
Für die in der privaten Freizeit und auf eigene Kosten durchgeführte Forschung mag das auch stimmen. Weniger zutreffend ist dies für Forschung, die mit öffentlichen Geldern bestritten wird - unbesehen der konkreten Herkunft dieser Gelder: Bund, DFG, BMBF, EU o.ä. Doch auch bei den privaten Stiftungen ist ein ausgearbeiteter Datenmanagementplan mittlerweile Teil des Antragsverfahrens. Es lässt sich zusammenfassen, dass ohne Datenmanagement die Chance auf externe Förderung zunehmend geringer wird.
Neben diese ideellen und pragmatischen Gründe des Daten-Teilens tritt überdies die fortschreitende Digitalisierung der weltweiten Forschungslandschaft. So fördern gut kuratierte Datensätze die Sichtbarkeit, während die schlecht aufbereiteten - oder gar nicht erst zur Verfügung gestellten - Daten selbst hervorragende Forschung im Dschungel des globalen Angebots verschwinden lassen.
Wo kann ich meine Forschungsdaten während eines Projekts speichern?
Die Speicherung von Forschungsdaten während der Projektlaufzeit unterliegt anderen Anforderungen als die Archivierung von Datensätzen zur Veröffentlichung nach Projektabschluss:
- Daten müssen für Projektbeteiligte und Kooperierende gut erreichbar sein
- Daten müssen im Zweifelsfall wiederherstellbar sein
- Die Bearbeitung von Datensätzen bleibt über die Projektdauer möglich
- Datensätze sind durch den Zugriff von außen geschützt
- ...
Zu diesem Zweck gibt es verschiedene Optionen, die sowohl innerhalb als auch außerhalb der EUF verfügbar sind. Die Eignung der einzelnen Lösungen ist abhängig von den konkreten Projektanforderungen (z.B. im Umgang mit besonders schützenswerten Daten) und kann daher nicht gänzlich pauschal ausgesprochen werden. Gängige Lösungen hierfür können sein:
- Einrichtung eines Netzlaufwerks durch das ZIMT (Intranet)
- Nutzung von Cloud-Services wie Teamdrive oder EUF-Box
- Einrichtung eines eigenen institutionellen Datenservers
- Externe Anbieter wie Sciebo (mit Einschränkungen auch Datenmanagementplattformen wie Coscine)
Bei allen vorhandenen Lösungen muss darauf geachtet werden, dass die Daten für die Speicherung auf dem jeweiligen System zugelassen sind. Dies betrifft insbesondere Daten, welche im Rahmen von Einverständniserklärungen für Forschungszwecke erhoben wurden und die einen besonderen Schutzbedarf haben. Falls hier Unsicherheiten bestehen, sprechen Sie uns einfach an.
Für alle angesprochenen Lösungen gilt, dass ein projektinternes Backup-Management unerlässlich ist, um im Falle technischer Probleme nicht plötzlich ohne Daten dazustehen.
Wo kann ich meine Forschungsdaten publizieren/archivieren
Genau wie das Speichern von Daten während des laufenden Forschungsprojekts stellt das Archivieren von Datensätzen spezielle Anforderungen an den Betreiber. Im Gegensatz zum häufigen Bearbeiten und Revidieren von Dokumenten steht hier die nachhaltige Verfügbarkeit im Mittelpunkt. Dazu reicht ein schlichtes Ablegen nicht aus, sondern Daten müssen (idealiter maschinen-verständlich) beschrieben werden, dauerhafte Verlinkungen (sog. Persistente Identifikatoren [PID]) erstellt und die inhaltliche Konsistenz sichergestellt werden. Dies alles stabil über einen Zeitraum von wenigstens 10 Jahren und mit dem Blick auf Format- und Systemwechsel hinweg.
Bei der Wahl des geeigneten Daten-Repositoriums oder Archivs spielen überdies ganz pragmatische Erwägungen eine Rolle:
- Sind die Daten für die angestrebte Peer-Gemeinschaft auffindbar?
- Werden besondere Anforderungen an Format oder Beschreibung (beispielsweise die Nutzung nicht-lateinischer Schriften) unterstützt?
- Gibt es ein Zugriffsmanagement für geschützte Daten?
- Gibt es die Möglichkeit, Daten zeitverzögert zu veröffentlichen (sog. Embargo)?
- Sind die Kosten tragbar?
- ...
Darüber hinaus ist darauf zu achten, ob das Repositorium der Wahl kuratiert ist, ob es einen umfangreichen Support gibt (sofern dieser benötigt wird), ob die von den Drittmittel-Einrichtungen verlangten Zertifikate vorliegen und viele andere Aspekte.
Vor dem Hintergrund all dieser Anforderungen ist es nicht verwunderlich, dass Forschende - gerade in der Antragsphase - Orientierung bei der Auswahl benötigen. Sprechen Sie uns hierzu gerne an.
Was sind DOI?
DOI (Digital Object Identifier) gehören zu den sog. Persistenten Identifikatoren (PID), welche den dauerhaften Zugriff auf ein digitales Objekt im Internet gewährleisten sollen.
In dieser Funktion kann man sie analog zu ISBN und ISSN verstehen, welche dem Buchmarkt erlauben, eine Publikation eindeutig zu identifizieren.
Bei einer DOI handelt es sich dem Grunde nach um einen Weblink, der (mit einem Umweg über eine durch die International DOI Foundation [IDF] betriebene Datenbank) auf ein durch die beantragende Einrichtung hinterlegtes digitales Objekt (Publikationen, Forschungsdatensatz o.ä.) verweist. Eine DOI lässt sich in der Praxis dadurch auch wie ein normaler Link verwenden. Der Aufbau gestaltet sich für gewöhnlich wie folgt:
doi:10.PRÄFIX/SUFFIX (bspw. doi:10.1000/182)
Woher beziehe ich eine DOI?
DOI werden durch eine der neun großen Registrierungsagenturen [RA] (DataCite, CrossRef usw.) vergeben.
Obwohl im Grunde jede Person individuelle DOI bei einer RA beantragen könnte, werden diese für gewöhnlich über eine größere Institution bezogen, welche im Präfix der DOI vermerkt ist. Dies können generische oder disziplinspezifische Datenrepositorien sein (bspw. GESIS oder ZENODO), Publikationsrepositorien an den Bibliotheken wissenschaftlicher Einrichtungen oder auch Open Access Journale.
Was muss ich im Umgang mit DOI beachten?
Mit der Registrierung des digitalen Objekts geht die Verknüpfung mit Metadaten entlang eines Metadaten-Schemas einher. So werden mit dem Upload der auszuzeichnenden Objekte in aller Regel auch Angaben zu Verfasser*innen, Inhalt, fachlichen Kategorien uvm. in Form einer XML-Datei hinterlegt, welche die Indizierung durch externe Suchmaschinen und Wissensplattformen erst ermöglicht. Für das DataCite-Metadatenschema gibt es z.B. diesen hilfreichen Generator. Den entsprechenden Best Practice Guide (der auch als Leitfaden für andere Schemata herangezogen werden kann) gibt es hier.
Wo kann ich an der EUF eine DOI erhalten?
Die EUF bietet zurzeit keine Möglichkeit, eine DOI im Rahmen einer (Daten-)Publikation zu erhalten. Mit der Registrierung einer DOI liegt die Verantwortung für die korrekte Auflösung des dahinterliegenden Weblinks bei der beantragenden Einrichtung. Die EUF unterhält derzeit keine Infrastruktur in Form eines (Publikations-)Repositoriums o.ä., was diese konstante Verlinkung gewährleisten könnte. Forschende sind daher dazu angehalten, ihre (Daten-)Publikationen zunächst bei externen Anbietern unterzubringen.
Ist die Einrichtung von DOI an der EUF geplant?
Langfristig ist die Einrichtung eines Publikationsrepositoriums geplant, über das dann auch DOI vergeben werden können.