VDI_6320_Blatt-1_E__2019-05
ICS 35.240.70 VDI-RICHTLINIEN Mai 2019 VEREIN DEUTSCHER INGENIEURE Datenmanagement in den Life Sciences VDI 6320 Blatt 1 Entwurf Data management for Life Sciences Einsprche bis 2020-01-31 vorzugsweise ber das VDI-Richtlinien-Einspruchsportal http//www.vdi.de/einspruchsportal in Papier an VDI-Gesellschaft Technologies of Life Sciences Fachbereich Biotechnologie Postfach 10 11 39 40002 Dsseldorf VDI-Gesellschaft Technologies of Life Sciences TLS Fachbereich Biotechnologie VDI-Handbuch Biotechnologie VDI-Handbuch Medizintechnik VDI-Handbuch Verfahrenstechnik und Chemieingenieurwesen, Band 2 Planung/Projektierung Inhalt Seite Vorbemerkung 2 1 Anwendungsbereich 2 2 Begriffe . 2 3 Abkrzungen 5 4 Grundstze . 6 5 Anleitungen 7 5.1 Organisatorische Datenverfgbarkeit 7 5.2 Maschinelle Verarbeitbarkeit .18 5.3 Nutzbarkeit Integritt, Aussagekraft, Nachvollziehbarkeit .21 5.4 Qualittssicherung .24 Anhang A Risikomatrix .27 Anhang B Beispiel Datenmanagementplan 28 Anhang C Beispiel Arbeitsanweisung ELN .34 Anhang D Beispiel Datenate .37 Schrifttum 38 2 VDI 6320 Blatt 1 Entwurf Vorbemerkung Der Inhalt dieser Richtlinie ist entstanden unter Beachtung der Vorgaben und Empfehlungen der Richtlinie VDI 1000. An der Erarbeitung dieser Richtlinie waren betei-ligt Prof. Dr. Thomas Berlage, St. Augustin Dr. Eugenio Fava, Bonn Martin Golebiewski, Heidelberg Dr. Manfred Kohler stellvertretender Vorsitzen-der, Hamburg Dr. Stefan Kreusch, Jena Dr. Wolfgang Mller, Heidelberg Dr. Andreas Pippow, St. Augustin Vorsitzender Allen, die ehrenamtlich an der Erarbeitung dieser Richtlinie mitgewirkt haben, sei gedankt. Eine Liste der aktuell verfgbaren Bltter dieser Richtlinienreihe ist im Internet abrufbar unter www.vdi.de/6320. 1 Anwendungsbereich Diese Richtlinie betrifft die Grundregeln des guten Datenmanagements im Bereich der Life-Science-Forschung in nicht regulierten Umgebungen. Sie richtet sich an organisatorisch Verantwortliche fr die Erhebung und Verarbeitung von digitalen Da-ten im Zusammenhang mit forschungsorientierten Aktivitten z. B. Projekt- oder Laborleiter, deren Vorgesetzte, Beauftragte fr die IT oder das Quali-ttsmanagement. Die Richtlinie beschreibt Aktivitten zur Umset-zung guten Datenmanagements vornehmlich in-nerhalb einer Organisation oder Organisationsein-heit und grenzt sich damit zu den sogenannten FAIR-Prinzipien ab FAIR steht fr to be findab-le, accesible, interoperable, re-usable Daten sollen also auffindbar, zugnglich, interoperabel und wiederverwendbar sein vgl. 1. Whrend die FAIR-Prinzipien in erster Linie den Forschen-den adressieren und Anforderungen an die Anno-tierung von Daten in ffentliche Repositorien stel-len, spricht diese Richtlinie darber hinaus auch das Management einer Organisation und andere verantwortliche Bereiche an, z. B. die IT. Die Ka-tegorien der hier aufgestellten Regeln sind in Be-zug auf den Mehrwert fr eine Organisation for-muliert. Im Gegensatz dazu sind die FAIR-Prin-zipien in Bezug auf die weitere Nutzbarkeit von Daten und Metadaten strukturiert. Da die FAIR-Prinzipien fr das Forschungsdatenmanagement immer mehr an Bedeutung gewinnen, erklrt diese Richtlinie im Abschnitt 4, welche der hier u-lierten Regeln zur Erfllung der FAIR-Prinzipien angewendet werden mssen. Die Richtlinie dient als Leitfaden fr die Sicherung der Nutzbarkeit und Nachvoll-ziehbarkeit der Daten ber die konkrete der Datenerhebung hinaus, den Austausch der Daten mit Projektpartnern und Kunden sowie in der wissenschaftlichen Gemeinschaft und die Erstellung organisationsspezifischer Da-tenmanagement-Arbeitsanweisungen. Die Anwendung der Richtlinie erleichtert die Weiterverwertung wissenschaft-licher Ergebnisse, schafft Handlungssicherheit fr die Verantwort-lichen Ausfhrende und Auftraggeber, untersttzt dabei, Konitt mit Richtlinien von Frdergebern und wissenschaftlichen Ver-lagen zu erreichen und kann auch als erste bersicht ber relevante Standards in diesem Themengebiet genutzt wer-den. Die Richtlinie gilt im forschungsorientierten Um-feld und beschrnkt sich ausdrcklich auf nicht GMP-regulierte Bereiche. Darber hinaus werden in dieser Richtlinie keine technischen Einzelfestle-gungen Datenate, Protokolle, Schnittstellen getroffen und keine dateninhaltlichen Aspekte Vokabulare, Ontologien, minimale Attributmen-gen vorgegeben oder entwickelt. 2 Begriffe Fr die Anwendung dieser Richtlinie gelten die folgenden Begriffe Administrator Nutzer, der gegenber dem normalen Anwender ber spezielle Verantwortung und Rechte verfgt, um ein IT-System zu verwalten Arbeitsanweisung Work Instruction, WI Beschreibung eines Prozesses, die keiner besonde-ren Kontrolle und keinem Freigabeprozess unter-liegt Entwurf VDI 6320 Blatt 1 3 Archivierung unvernderbare, langfristig angelegte Aufbewah-rung von Inationen Anmerkung Die Archivierung bedarf einer sorgfltigen Pla-nung, um die Lesbarkeit auch ber einen langen Zeitraum bli-cherweise 15 Jahre gewhrleisten zu knnen. Dazu mssen Daten bzw. Dateien im Lauf der Zeit unter Umstnden in neue, gltige ate konvertiert werden. Zur Archivierung gehrt auch die Fhrung eines Indizes ber alle archivierten Daten/ Dateien. Assay des Experiments, bei dem eine standardisier-te e auf sehr viele verschiedene Untersu-chungsobjekte chemische Substanzen, Zellen, Gewebeproben usw. parallel angewendet wird, um die Untersuchungsobjekte meist in zwei Klas-sen zu unterteilen Hit/Non-Hit Audit durch Betriebsfremde durchgefhrte Untersuchung der Strukturen und Prozesse einer Organisation, um zu berprfen, ob sie die selbst gesetzten oder geforderten Standards erfllt Audittrail Funktion eines Softwarepakets zur Dokumentation einer nderung an einem Datenelement Anmerkung Meist werden der vorherige und der neue Wert, der Anwender, der die nderung durchfhrt, sowie das Datum der nderung erfasst. In besonderen Fllen muss auch ein Grund fr die nderung angegeben werden, der mit dokumen-tiert wird. Benutzerverwaltung Einrichtung und Verwaltung von Nutzeraccounts fr den Zugriff auf Hard- und Software Anmerkung 1 Speziell in Netzwerken verwendet fr die eindeutige Identifizierung von Anwendern. Anmerkung 2 siehe auch Nutzeraccount Business Continuity proaktive Vermeidung von Schden Data Life Cycle definierte Handhabung und Gebrauch der Daten whrend der Dauer der minimalen Datenverfg- und -lesbarkeit Anmerkung Wird im regulierten Bereich durch Vorschriften oder Verordnungen vorgegeben, im nicht regulierten Bereich durch Vorgaben der Organisation. Hufig sind Angaben von 10 Jahren bis 30 Jahren zu finden. Im regulierten Bereich ist eine automatische Lschung nach dieser Zeit nicht vorgesehen. Dateiattribute Attribute, die innerhalb des Betriebssystems einer Datei zugeordnet sind und die fr spezielle Funkti-onalitt innerhalb des Betriebssystems zustndig sind Beispiel sichtbar/unsichtbar, nur lesbar/vernderbar Daten alisierte Darstellung von Ination als Ein-zelwerte Messwerte, Metadaten, deren Zusam-menfassungen in von Dateien Tabellen sowie beschreibende Zusammenfassungen wie Dokumente Reports, Protokolle usw. in Anleh-nung an VDI 2552 Blatt 2 Datencontainer Datei, die wiederum aus mehreren einzelnen Da-teien besteht Beispiel ZIP-Datei Anmerkung Ein Datencontainer kann auch verschiedene Dateien enthalten. Dateneigner Person oder Organisation mit dem Verfgungs-recht ber die Verwendung der Daten Anmerkung 1 Rechtlich nicht eindeutig definiert, da auf Forschungsdaten an sich kein Urheberrecht besteht. Allgemein gilt die Auffassung, dass ein Unternehmen Eigentmer aller generierten Daten ist. Hufig ist dies auch in Arbeitsvertrgen fixiert. Verfgungsrechte knnen aber auch durch Auftrags- und Frdergeber vorgegeben sein. Anmerkung 2 Als Dateneigner im Zusammenhang mit DSGVO/BDSG wird meist die Person bezeichnet, deren Da-ten erhoben worden sind. Der Erheber oder Verwalter der Daten wird dort als Data Controller bezeichnet. Datenmanagementplan Dokument, in dem beschrieben ist, wie mit Daten und Dateien innerhalb eines Projekts umgegangen werden soll Datenreihe regelmige Wiederkehr gleichstrukturierter Da-tenelemente records Datensatz alle fr einen bestimmten Zweck erforderlichen Daten, bestehend aus unterschiedlichen Dokumen-ten, Datenreihen und Metadaten Anmerkung Ein Datensatz besteht aus einer oder mehreren Datenreihen die einer bestimmten Zweckbestimmung z. B. Versuchsergebnisse, Liste mit Publikationen dienen. Jede Datenreihe besteht aus vergleichbaren Datenelementen z. B. Datum, Gewicht, Untersuchungsmaterial. Eine Datenreihe deckt einen bestimmten Raum an Variationen ab z. B. Kr-pertemperatur 35 C bis 40 C. Datenschutz Manahmen zum Schutz der personenbeziehbaren Daten vor unerlaubter Verwendung Anmerkung siehe auch 2; 3 Datensicherung Back-up Sicherung des Datenbestands auf ein Medium, das unabhngig vom aktiven Datenbestand fr einen bestimmten, festgelegten Zeitraum aufzubewahren ist Anmerkung Eine Datensicherung sollte regelmig entspre-chend den Anforderungen gegenber Datenverlust erfolgen. 4 VDI 6320 Blatt 1 Entwurf Datenverantwortlicher Delegation der Verantwortlichkeit des Unterneh-mens fr die Daten an den Erzeuger der Daten Anmerkung Dieser ist damit verantwortlich fr den ange-messenen Umgang und die sichere Verwaltung der Daten. In Absprache mit der zentralen IT ist der Datenverantwortliche damit auch zustndig fr die Festlegung von Zugriffsrechten auf die Daten. Disaster Recovery Manahmen, die im Fall eines eigetretenen Scha-dens die zeitnahe Wiederherstellung des Betriebs ermglichen Experiment in sich abgeschlossenes kontrolliertes Vorhaben, dessen Ausgang vor der Durchfhrung nicht feststeht Anmerkung Ein Experiment besteht aus den Phasen Planung, Durchfhrung, Auswertung und Interpretation. Groe Ex-perimente knnen wiederum aus Teilexperimenten bestehen. Export-Import-Schnittstelle Softwareschnittstelle zum Austausch von Daten meist in generischen atenFirmware eingebettete Software eines Computersystems, welches zur Verwendung notwendig ist und vom Anwender nicht einfach ausgetauscht werden kann Handlungsanweisung Regelwerke Policies, die meist eher unverbind-lich uliert die Richtung vorgeben, wie ein Unternehmen arbeiten mchte z. B. Als Unter-nehmen halten wir den Datenschutz ein. Hardware physische Komponente eines IT-Systems konzeptuelle Entitt Objekte aus der wissenschaftlichen Modellwelt, die mit verschiedenen Namen identifiziert wer-den knnen Beispiele chemische Substanzen, Proteine, Gene, Diagnosen Metadaten alle strukturierten Daten, die zur Beschreibung von Daten im Sinne von Messwerten notwendig sind, um den Zusammenhang der Daten im greren Kontext darstellen zu knnen. Anmerkung Metadaten knnen demnach wiederum Einzel-daten Temperatur, Softwareversion als auch Beschreibungen Protokolle, Standardanweisungen SOP, WI sein. Nutzbarkeit Eignung von Daten zur ursprungstreuen Verwen-dung ohne zustzlichen Aufwand in spteren Aus-wertungen Nutzeraccount aus einer eindeutigen Identifikationskennung ID und einem Passwort bestehende Anwenderkennung Anmerkung 1 Die ID kann z. B. aus dem Namen, der E-Mail-Adresse oder einer kryptischen Kennung bestehen. Das Passwort unterliegt hufig speziellen Anforderungen was die Lnge und Kombination von Zeichen, Ziffern und Sonderzei-chen betrifft. Anmerkung 2 siehe auch Benutzerverwaltung offenes at Datenat, dessen Beschreibung ffentlich zu-gnglich ist Beispiele *.ODT, *.XML, *.TIF/TIFF, *.PDF, *DOCX, *.XLSX Organisationsanweisung Richtlinien/Vorgaben Guidelines, die genauer spezifizieren, wie eine Manahme umgesetzt wer-den soll Anmerkung 1 Diese Richtlinien sind solange verbindlich einzuhalten wie sie dem betrieblichen Ablauf nicht widerspre-chen. Abweichungen sollten schriftlich begrndet werden z. B. Fr die Kommunikation innerhalb und auerhalb des Unternehmens wird im Unternehmen das Programm XYZ verwendet.. Anmerkung 2 Oft werden diese Organisationsanweisungen im IT-Zusammenhang Guidelines genannt. Patch Software, die Fehler beseitigt, ohne neue Funktio-nalitt hinzuzufgen, in der Regel findet keine nderung der Versionsnummer statt Persistent Identifier PID Systeme, mithilfe derer sich eindeutige Referenzen auf interne oder externe digitale Ressourcen erstel-len und suchen lassen Anmerkung Beispiele finden sich in 5 bis 9. Primrdaten Daten in einem Bearbeitungsstand so nah wie mglich an der ursprnglichen Messung Anmerkung Prozessierungsen, die erwartbar nicht gendert werden Standarden oder allgemein aner-kannte und verwendete Verfahren sind, knnen bereits durch-gefhrt worden sein, wenn dadurch Einsparungen im Datenvo-lumen oder Vereinfachungen des Prozesses verbunden sind. Fr manche Daten z. B. NGS sind Komprimierungsverfah-ren aus technischen Grnden unabdingbar. Projekt Investigation Vorhaben, an dem ber einen definierten Zeitraum mit einer Gruppe von Personen gearbeitet wird Anmerkung Wird manchmal auch als Investigation bezeich-net siehe 4. proprietres at Datenat, dessen genauer interner Aufbau nicht frei verfgbar und oft auch urheberrechtlich ge-schtzt ist Beispiele *.DOC, *.XLS Anmerkung Der Zugriff auf die Daten hngt allein vom Hersteller/Urheber ab. Entwurf VDI 6320 Blatt 1 5 Rechenleistung Ma fr die Geschwindigkeit, mit der ein Rechner Aufgaben abarbeiten kann, meist angegeben in Operationen pro Zeiteinheit Release vollstndig neue, eigenstndige Version einer Software, hufig auch mit einem Wechsel des GUI verbunden Rohdaten erste digital erfasste und unverndert gespeicherte Daten Anmerkung Dies knnen einzelne Messwerte, aber auch kontinuierliche Messsequenzen EKG oder umfangreiche kompl Datenstze sowie Bilder bzw. Bildsequenzen sein. Speicherkapazitt Speichervolumen, das zum Ablegen von Daten auf einem Datentrger zur Verfgung steht Software Teil eines Computersystems, das basierend auf Code, zur Ausfhrung von Aktionen durch den Anwender auf dem Computer installiert ist Beispiel Programme, die ein Computer bentigt, um arbeiten zu knnen. Anmerkung Dazu gehren das Betriebssystem und die An-wendungssoftware. Merkmal der Software ist ihre leichte Austauschbarkeit vgl. auch Firmware durch den Anwender. Standardarbeitsanweisung Standard Operation Procedure, SOP Dokument, das den genauen Ablauf eines Prozesses beschreibt und eine Aufstellung aller Materialien und Gerte, die im Lauf des Prozesses verwendet werden, deren Handhabung und die Dokumentation von Ergebnissen aus diesem Prozess enthlt Anmerkung 1 Abweichungen von dem vorgegebenen Ablauf mssen protokolliert werden. Anmerkung 2 Die Standardarbeitsanweisung dient der Nach-vollziehbarkeit von Prozessen. Im Gegensatz zur Arbeitsan-weisung unterliegt die Standardarbeitsanweisung einem regu-lierten und wiederum in einer bergeord