Die DFG-"Checkliste"

Die "Checkliste" der DFG bietet Leitfragen, die im Antrag unter Punkt 2.4 adressiert werden sollen. Da die Fragen stellenweise etwas abstrakt erscheinen, sind im untenstehenden Akkordeon die Fragen mit ein wenig zuzsätzlichem Kontext versehen.

Welche Konsequenzen die Qualität der Beantwortung dieser Fragen schlussendlich hat, ob immer alle Fragen zu beantworten sind und ob noch fachspezifische Bedingungen zu beachten sind ist nicht pauschal zu sagen und auch schwer abzuschätzen. Sollten weitere Fragen bestehen, kontaktieren Sie die Servicestelle FDM gerne direkt.

  • Bei diesem Punkt geht es darum, sich selbst mit den im Projektverlauf entstehenden Daten zu befassen. Je klarer es den Forschenden selbst ist, wie der Umgang mit den Daten aussieht, desto klarer kann es den Gutachtern gemacht werden. Es ist dabei allen Beteiligten klar, dass nie alle Eventualitäten abgebildet werden können.

    • Auf welche Weise entstehen in Ihrem Projekt neue Daten? 
      • Die DFG fördert Forschungsvorhaben in vielen verschiedenen Gebieten, so dass Daten auch auf unterschiedliche Weise entstehen können. So können naturwissenschaftliche Messdaten, geologische Beobachtungsdaten und sozialwissenschaftliche Umfragedaten nicht immer alle gleich behandelt werden. Hier soll dieser Aspekt kurz beschrieben werden. "Im beantragten Projekt werden $Proben mit $Methode vermessen." oder "... unter $Gruppe werden folgende Umfragen durchgeführt:..."
    • Werden existierende Daten wiederverwendet? 
      • Soll z. B. ein Vergleich mit alten Messungen Teil des Projektes sein oder ein alter Datensatz unter neuen Aspekten ausgewertet werden, kann dies hier angegeben werden. Das muss nicht zwingend der Fall sein. Wenn es allerdings der Fall ist und die nachgenutzten Daten veröffentlicht sind, kann hier konkret der Datensatz genannt werden. Auch wenn man Daten anderer Wissenschaftler nachnutzt, sollte das hier erwähnt werden.
    • Welche Datentypen, im Sinne von Datenformaten (z. B. Bilddaten, Textdaten oder Messdaten) entstehen in Ihrem Projekt und auf welche Weise werden sie weiterverarbeitet?
      • Hier gilt es, grob die Prozessierungsschritte zu beschreiben, die an den erhobenen Rohdaten durchgeführt werden. Dies ist für jedes Forschungsvorhaben anders, kann aber auch schon Details der Datenauswahl bzw.  Bereinigungs- und Analyseschritte enthalten.
    • In welchem Umfang fallen diese an bzw. welches Datenvolumen ist zu erwarten? 
      • Es soll grob abgeschätzt werden, wie groß der Umfang an Rohdaten ist bzw. wie sich der notwendige Speicherplatz im Laufe der Datenanalyse entwickelt. Sollte sich hieraus ein Bedarf an Erweiterung der vorhandenen Infrastruktur ergeben, kann dies im untenstehenden Punkt "Kosten" aufgegriffen werden.
  • Auch zum Thema Datenqualität kann man promovieren. Es ist alles andere als selbstverständlich, dass erhobene Daten sofort qualitativ hochwertig aufbereitet vorliegen. Um dies sicherzustellen, werden an dieser Stelle durch die folgenden Fragen Denkanstöße gegeben. Anliegende Kriterien können hier Validität, Reliabilität, Objektivität, Integrität und Replikabilität der Daten sein.

    • Welche Ansätze werden verfolgt, um die Daten nachvollziehbar zu beschreiben (z. B. Nutzung vorhandener Metadaten- bzw. Dokumentationsstandards oder Ontologien)? 
      • Manche Fachbereiche haben ihr eigenes Fachvokabular. Wenn dies umfangreich genug ist und über feste Relationen miteinander verknüpft ist, kann man es als Ontologie formulieren. In den meisten Fällen ist dies jedoch (noch) nicht der Fall. Hier ist es eventuell sinnvoll zu schauen, ob sich in der Community ein Metadatenstandard etabliert hat. Wenn dies auch nicht der Fall ist, kann man einen gängigen Standard versuchen auf seine Bedürfnisse anzupassen. Diese Überlegungen zu Beginn anzustellen spart Zeit bei der nachträglichen Metadatenvergabe bei Veröffentlichung der Daten. Die Servicestelle Forschungsdaten steht hier gerne als Ansprechpartner zur Verfügung.
    • Welche Maßnahmen werden getroffen, um eine hohe Qualität der Daten zu gewährleisten? 
      • Nicht alle erhobenen Daten sind sofort für eine Veröffentlichung geeignet. Daten sollten für eine hohe Qualität so aufbereitet werden, dass sich ihr Inhalt erschließen lässt ohne weitere externe Angaben zu benötigen. Es sollte außerdem sichergestellt werden, dass die Daten sich wieder erheben oder messen lassen (wenn es sich nicht um Beobachtungsdaten handelt). Hier sollte kurz darauf eingegangen werden, wie man die Daten passend aufzubereiten gedenkt.
    • Sind Qualitätskontrollen vorgesehen und wenn ja, auf welche Weise? 
      • In manchen Projekten und Forschungsbereichen gibt es hierfür fest definierte Kriterien. Es können z. B. Testdurchläufe einer Software sein oder eine Checkliste, die auf die Daten angewandt wird. Wenn dies nicht existiert, ist eine Überlegung sinnvoll, ob es prinzipiell möglich wäre. Wenn es nicht notwendig ist, sollte es sich aus den obigen Punkten aber ergeben.
    • Welche digitalen Methoden und Werkzeuge (z. B. Software) sind zur Nutzung der Daten erforderlich? 
      • Hier werden Aspekte der Datenweiterverarbeitung aus dem ersten Fragenblock aufgeriffen. Wenn Software benutzt wird, können die Ergebnisse von unterschiedlichsten Faktoren abhängig sein, von der Programmversion bis hin zur verwendeten Hardware. Wenn eigener Programcode genutzt wird, ist an dieser Stelle zu prüfen, inwiefern man diesen zugänglich machen kann.
  • Dieser Fragenblock behandelt die technischen Aspekte, bei denen hauptsächlich überdacht werden soll, ob die Infrastruktureinrichtungen eingebunden werden sollten bzw. Mittel für das FDM beantragt werden sollten.

    • Auf welche Weise werden die Daten während der Projektlaufzeit gespeichert und gesichert?
      • Hierbei sollte zunächst klar sein, welche Möglichkeiten sich an der TU Clausthal bieten. Prinzipiell unterschieden werden sollte zwischen a) dem eigenen Arbeitsrechner, b) eigenen externen Datenträgern, c) Cloud-Speicherlösungen und d) Netzwerkspeichern.
      • Zur Datensicherung ist die 3-2-1-Regel hilfreich: Drei Kopien der Daten auf mindestens zwei unterschiedlichen Speichermedien, wovon eins räumlich getrennt sein sollte. Z. B. eigener Rechner, externes Laufwerk und Netzwerkspeicher.
      • Eine wichtige Unterscheidung ist zwischen der (TU-/Academic-)Cloud und den Netzwerk-Servern des Rechenzentrums zu treffen. Während die Cloud für den Datenaustausch bzw. die Arbeit an unterschiedlichen Endgeräten geeignet ist, sind die Server (nas.tu-clausthal) ein sicherer Ablageort für die Daten, von dem auch regelmäßige dezentrale Backups erstellt werden.
    • Wie wird die Sicherheit sensibler Daten während der Projektlaufzeit gewährleistet (Zugriffs- und Nutzungsverwaltung)? 
      • Wenn es sich um sensible Daten handelt, ist die Ablage technisch so zu gestalten, dass der Zugriff auf einen notwendigen Personenkreis eingeschränkt ist. Zusätzlich empfehlen sich festgeschriebene Absprachen für die Berechtigungen. Hierbei kann auch in Lese- und Schreibzugriffe getrennt eine Betrachtung erfolgen.
  • Rechtliche Betrachtungen sind oftmals Einzelfallbetrachtungen. Die Servicestelle FDM bietet keine Rechtsberatung an, sondern bittet Sie, für konkrete Fragen das Justiziariat zu kontaktieren.

    • Welche rechtlichen Besonderheiten bestehen im Zusammenhang mit dem Umgang mit Forschungsdaten in Ihrem Projekt? 
      • Diese Frage wird besonders interessant, sobald entweder personenbezogene Daten im Rahmen eines Forschungsprojektes erhoben werden oder aber besondere Absprachen mit den Projektpartner:innen existieren. Besonders bei Kooperationen mit Industriepartner:innen können solche besonderen Klauseln in den Verträgen enthalten sein. Eine weitere Möglichkeit wäre, dass sich das Forschungsvorhaben auf Primärdaten bezieht, die besonderen Schutzrechten unterliegen und nicht ohne Weiteres veröffentlicht werden dürfen. Diese und ähnliche Einschränkungen sind in diesem Themenblock anzugeben.
    • Sind Auswirkungen oder Einschränkungen in Bezug auf die spätere Veröffentlichung bzw. Zugänglichkeit zu erwarten? 
      • Hier können das Urheberrecht oder Schutzrechte von Personen greifen, die eine vollständige Veröffentlichung der Daten verhindern. Wenn dies zu einem eingeschränkten späteren Zugriff auf die Daten führt, ist diese Erwartung hier zu formulieren.
    • Auf welche Weise werden nutzungs- und urheberrechtliche Aspekte sowie Eigentumsfragen berücksichtigt? 
      • Sind oben Einschränkungen angegeben worden, sollten Schritte beschrieben werden, wie man plant, die Einschränkungen so gering wie möglich zu halten. Dies kann eine Anonymisierung oder Pseudonymisierung der Daten sein, aber auch Einholung von Rechten, Kenntlichmachung... Wie so oft bei rechtlichen Fragestellungen ist der Einzelfall entscheidend.
    • Existieren wichtige wissenschaftliche Kodizes bzw. fachliche Normen, die Berücksichtigung finden sollten? 
      • Sollte es in der Community Abmachungen geben, die im Idealfall auch niedergeschrieben existieren, wie der Umgang mit Daten auszusehen hat, so sollten diese hier referenziert werden.
  • Ziel des Forschungsdatenmanagements ist es immer auch, die Daten zur Nachnutzung zur Verfügung stellen zu können. Während die obigen Punkte die Voraussetzungen dafür abprüfen, sind hier Details zur Umsetzung gefragt.

    • Welche Daten bieten sich für die Nachnutzung in anderen Kontexten besonders an?
      • Nicht alle Daten, die im Rahmen eines Projektes anfallen sind für die Nachnutzung von großem Interesse. Hier ist eine erste Einschätzung gefragt, welche Daten auch in anderen, ggf. sogar fachfremden Vorhaben genutzt werden könnten. 
    • Nach welchen Kriterien werden Forschungsdaten ausgewählt, um diese für die Nachnutzung durch andere zur Verfügung zu stellen?
      • Wenn die Planung des Forschungsvorhabens weit genug fortgeschritten ist, lässt sich abschätzen, welche der anfallenden Daten veröffentlicht werden können bzw. sollten. Hier sollte sozusagen der Gedankengang nachvollziehbar dargestellt werden, warum genau diese Daten veröffentlicht werden.
    • Planen Sie die Archivierung Ihrer Daten in einer geeigneten Infrastruktur?
      • Kurz vorab: der Datenträger im Keller oder der Server unter dem Schreibtisch sind hier nicht gemeint. Der DFG geht es an dieser Stelle anscheinend um zwei Dinge: einerseits sollen Daten auf Servern in der eigenen Einrichtung sicher archiviert werden (vgl. Punkt 3), andererseits aber relevante Daten auch extern auf Forschungsdatenrepositorien abgelegt werden.
    • Falls ja, wie und wo? 
      • Wenn es in der Community verbreitet genutzte Repositorien gibt, kann man diese hier angeben, ebenso wenn es keine fachspezifischen gibt, kann man das hier angeben. Im letzten Fall bieten sich institutionelle oder große generische Repositorien an, im Idealfall mit einer vertrauenswürdigen Zertifizierung. Hierbei ist die Seite re3data eine gute erste Anlaufstelle.
    • Gibt es Sperrfristen? 
      • Manche Daten können erst nach Projektablauf oder anderen rechtlich notwendigen Fristen öffentlich zugänglich gemacht werden. Wenn dies im Vorfeld bekannt ist, sollte man es hier angeben.
    • Wann sind die Forschungsdaten für Dritte nutzbar? 
      • Die einfache, oft unzureichende Antwort wäre "nach Ablauf der Sperrfristen", aber es kann hier auch angegeben werden, dasss Daten bereits nach der Erhebung, also noch während der Projektlaufzeit, mit dem Projektabschluss oder zu einem anderen Zeitpunkt nutzbar gemacht werden.
    • Wer ist verantwortlich für den adäquaten Umgang mit den Forschungsdaten (Beschreibung der Rollen und Verantwortlichkeiten innerhalb des Projekts)?
      • Die Ergänzung in Klammern bringt das Problem eigentlich auf den Punkt. Es sollte im Projekt klar verteilte Rollen geben, wer zu welchem Zeitpunkt im Datenlebenszyklus für die Daten zuständig ist. Eine Möglichkeit ist es, diese Absprachen schriftlich zu fixieren und regelmäßig auf bestehende Gültigkeit zu überprüfen.
    • Welche Ressourcen (Kosten; Zeit oder anderes) sind erforderlich, um einen adäquaten Umgang mit Forschungsdaten im Projekt umzusetzen?
      • Wenn bereits bei Projektbeantragung aus früheren Projekten Erfahrungen bestehen, dass hier Kosten anfallen oder ein nicht vernachlässigbarer personeller Aufwand besteht, sollte das hier einfließen und kann so bei der Begutachtung entsprechend berücksichtigt werden.
    • Wer ist nach Ende der Laufzeit des Projekts für das Kuratieren der Daten verantwortlich?
      • Wenn das Projekt beendet ist, sollten alle Daten noch einmal begutachtet und entsprechend der bereits angesprochenen Regeln veröffentlicht oder archiviert werden. Wenn die Bearbeiter:innen des Projekts dann ggf. nicht mehr an der Einrichtung beschäftigt sind, sollte auch hier eine klare Zuständigkeit formuliert werden, die zum Zeitpunkt der Beantragung auch absehbar realistisch ist.
https://www.dfg.de/resource/blob/174732/3c6343eed2054edc0d184edff9786044/forschungsdaten-checkliste-de-data.pdf

Umgang mit Forschungsdaten

DFG-Checkliste für Antragstellende zur Planung und zur Beschreibung des Umgangs mit Forschungsdaten in Forschungsvorhaben

https://www.sft.tu-clausthal.de/dfg5401

DFG-Leitfaden-54.01

Der komplette Leitfaden zur Erstellung von DFG-Anträgen wird hier bei den Kolleg:innen des Forschungsservice erläutert.