Rubriken
Als Biologe fragte ich mich schon während meiner Doktorarbeit häufig, wo meine Daten liegen, wie ich sie ausgewertet hatte oder welche Bedeutung sie hatten. Daten meiner Kollegen waren noch schwerer zu verstehen. Seit ich am Fraunhofer FIT arbeite, versuche ich herauszufinden warum Menschen so viel Zeit für das Suchen und Finden von Informationen verbrauchen. Durch eine Umfrage mit 70 kleinen und mittleren Unternehmen aus den Life Sciences stellte ich vor einiger Zeit fest, dass die Befragten etwa ein Viertel ihrer Arbeitszeit mit der Verwaltung von Daten beschäftigt sind. Das ist viel Zeit, die anderswo fehlt.
In vielen Gesprächen mit anderen Datenmanagement-Interessierten stellte ich fest, dass es bis heute keinen umfassenden Leitfaden für die Organisation eines Projektes in Bezug auf das Datenmanagement gibt. Was muss ein organisatorisch Verantwortlicher eigentlich alles berücksichtigen, damit die Daten verständlich und auffindbar bleiben auch wenn das Projekt beendet ist? Eine Frage, der wir zurzeit im Richtlinienausschuss VDI 6320 „Datenmanagement im Bereich Life Sciences“ aus dem Fachbereich Biotechnologie nachgehen.
Aktivitätsfelder des Datenmanagements
In dem Ausschuss konnten wir bereits sieben Bereiche identifizieren, die für das Datenmanagement wichtig sind:
- die organisatorische Datenverfügbarkeit
- der Datenschutz
- die Qualitätssicherung
- die Datensicherheit
- die Datenintegrität
- die Prozessierbarkeit der Daten
- die Nachvollziehbarkeit der Arbeit
Das Datenmanagement ist also mehr als das, was ein Data Scientist darunter versteht. Dieser denkt an große Mengen an heterogenen Big-Data-Quellen, die er gut beschreiben und an den Analysten weitergeben möchte. Aus unserer Sicht gehören aber auch viele organisatorische und leitende Aufgaben dazu, die über die der Data Sciences hinausgehen. Ein Datenmanager muss nicht nur mit den Daten, sondern auch mit den Menschen umgehen können, die die Daten produzieren, in Systemen ablegen und darauf zugreifen.
Sieben Regeln des Datenmanagements
Für jede der Aktivitätsfelder des Datenmanagements kann man Regeln dafür definieren, wie man sich in bestimmten Situationen zu verhalten hat. Ein Kompendium dieser Regeln wird es in der Richtlinie VDI 6320 zu lesen geben. Ein Auszug dieser Regeln:
- sorge dafür, dass Mitarbeiter Zugriff auf Daten haben
- schütze personenbezogene Daten
- definiere Prozesse, benenne einen Verantwortlichen für die Sicherung der Datenqualität und der Risikovermeidung
- schütze Daten gegen Verlust und stelle den Zugriff und die Lesbarkeit sicher
- überprüfe die Datenqualität
- lege die Datenstruktur fest und definiere Metadaten
- dokumentiere Datenverarbeitungsschritte
Schulung für das Datenmanagement
Daten müssen für eine effektive Suche und das Finden von Informationen möglichst selbsterklärend beschrieben sein. Dafür muss ein Datenmanager verschiedene Regeln aber auch Werkzeuge kennen, die er in den verschiedenen Alltagssituationen einsetzen kann. Am Fraunhofer FIT vermitteln wir daher im Kurs „Scientific Data Manager" zusammen mit dem Fraunhofer IME Methoden für den nachhaltigen Umgang mit Daten und Dokumenten. In Theorie und Praxis vermitteln wir dort hilfreiche Anleitungen und zeigen wie verschiedene Software-Typen für das Datenmanagement, Datenintegration und Datenanalyse eingesetzt werden.
Autor: Dr. Alexander Pippow, Vorsitzender des Richtlinienausschusses zur VDI 6320 und Projektleiter und Dozent für Datenmanagement-Schulungen beim Fraunhofer Institut für Angewandte Informationstechnik
Kommentare
Inzwischen haben 2 Leser einen Kommentar hinterlassen.Lieber Herr Wollenschein, vielen Dank für Ihren Kommentar. Sie haben absolut Recht, wenn Sie sagen, dass eine zentrale Datenablage unerlässlich ist. Es stimmt, dass dieser Punkt nicht explizit erwähnt wird. In unserem Fachausschuss haben wir schon mehrfach darüber diskutiert, so dass die Richtlinie eine Regel "Definiere eine zentrale Datenablage" als Teil einer organisatorischen Aktivität enthalten wird.
"Vielen Dank für diesen interessanten Blog-Artikel.
Gerade das Thema Datamanagement oder MDM wird nicht nur im wissenschaftlichen Bereich ""vernachlässigt"", sondern ebenso in fast allen Bereichen der Wirtschaft. Eine Anmerkung möchte ich gerne geben da dieser Punkt nicht explizit aufgezeigt wurde:
die Erstellung eines ""Golden Records"" oder ""Single Point of the Truth"". Die Aggregation von Daten in einer zentralen Datenbank ist ein entscheidender Faktor für erfolgreiches Datamanagement. Daten liegen meist an verschiedenen Orten, in verschiedenen Abteilungen oder gar technischen Systemen vor.
Hier gilt es eine zentrale ""Schaltzentrale"" zu schaffen welche die Daten (DEN! Golden Record) an die verschiedenen Stellen kommuniziert und somit verlässlich immer die gleiche, valide Information bereitstellt."
Diskutieren Sie mit uns