Wer sucht der findet - aber richtig gemanagt geht’s schneller!

7 Regeln für das Datenmanagement

Data Scientists kennen Methoden und Vorgehensweisen für das Datenmanagement. Dabei helfen Regelwerke wie die VDI 6320 und Schulungsangebote.

Bild: VDI / Thomas Ernsting2016-04-07_7 Regeln für das Datenmanagement _702x363px-V1

Data-Management kostet Zeit
Als Biologe fragte ich mich schon während meiner Doktorarbeit häufig, wo meine Daten liegen, wie ich sie ausgewertet hatte oder welche Bedeutung sie hatten. Daten meiner Kollegen waren noch schwerer zu verstehen. Seit ich am Fraunhofer FIT arbeite, versuche ich herauszufinden warum Menschen so viel Zeit für das Suchen und Finden von Informationen verbrauchen. Durch eine Umfrage mit 70 kleinen und mittleren Unternehmen aus den Life Sciences stellte ich vor einiger Zeit fest, dass die Befragten etwa ein Viertel ihrer Arbeitszeit mit der Verwaltung von Daten beschäftigt sind. Das ist viel Zeit, die anderswo fehlt.

In vielen Gesprächen mit anderen Datenmanagement-Interessierten stellte ich fest, dass es bis heute keinen umfassenden Leitfaden für die Organisation eines Projektes in Bezug auf das Datenmanagement gibt. Was muss ein organisatorisch Verantwortlicher eigentlich alles berücksichtigen, damit die Daten verständlich und auffindbar bleiben auch wenn das Projekt beendet ist?  Eine Frage, der wir zurzeit im Richtlinienausschuss VDI 6320 „Datenmanagement im Bereich Life Sciences“ aus dem Fachbereich Biotechnologie nachgehen.

Aktivitätsfelder des Datenmanagements
In dem Ausschuss konnten wir bereits 7 Bereiche identifizieren, die für das Datenmanagement wichtig sind:

•    Die organisatorische Datenverfügbarkeit
•    Der Datenschutz
•    Die Qualitätssicherung
•    Die Datensicherheit
•    Die Datenintegrität
•    Die Prozessierbarkeit der Daten
•    Die Nachvollziehbarkeit der Arbeit

Datenmanagement und Big Data
Das Datenmanagement ist also mehr als das, was ein Data Scientist darunter versteht. Dieser denkt an große Mengen an heterogenen Big Data- Quellen, die er gut beschreiben und an den Analysten weitergeben möchte. Aus unserer Sicht gehören aber auch viele organisatorische und leitende Aufgaben dazu, die über die der Data Sciences hinausgehen. Ein Datenmanager muss nicht nur mit den Daten, sondern auch mit den Menschen umgehen können, die die Daten produzieren, in Systemen ablegen und darauf zugreifen.

7 Regeln des Datenmanagements
Für jede der Aktivitätsfelder des Datenmanagements kann man Regeln dafür definieren, wie man sich in bestimmten Situationen zu verhalten hat. Ein Kompendium dieser Regeln wird es in der VDI Richtlinie VDI 6320 zu lesen geben. Ein Auszug dieser Regeln:

•    Sorge dafür, dass Mitarbeiter Zugriff auf Daten haben
•    Schütze personenbezogene Daten
•    Definiere Prozesse, benenne einen Verantwortlichen für die Sicherung der Datenqualität und der Risikovermeidung
•    Schütze Daten gegen Verlust und stelle den Zugriff und die Lesbarkeit sicher
•    Überprüfe die Datenqualität
•    Lege die Datenstruktur fest und definiere Metadaten
•    Dokumentiere Datenverarbeitungsschritte

Schulung für das Datenmanagement
Daten müssen für eine effektive Suche und das Finden von Informationen möglichst selbsterklärend beschrieben sein. Dafür muss ein Datenmanager verschiedene Regeln aber auch Werkzeuge kennen, die er in den verschiedenen Alltagssituationen einsetzen kann. Am Fraunhofer FIT vermitteln wir daher im Kurs »Scientific Data Manager« (http://www.fit.fraunhofer.de/de/fb/life/scientific-data-manager.html) zusammen mit dem Fraunhofer IME Methoden für den nachhaltigen Umgang mit Daten und Dokumenten. In Theorie und Praxis vermitteln wir dort hilfreiche Anleitungen und zeigen wie verschiedene Software-Typen für das Datenmanagement, Datenintegration und Datenanalyse eingesetzt werden.

Bild: privatPortrait PippowAutor: Dr. Andreas Pippow, Vorsitzender des Richtlinienausschusses zur VDI 6320 „Datenmanagement im Bereich Life Sciences“ und Projektleiter und Dozent für Datenmanagement- Schulungen beim Fraunhofer Institut für Angewandte Informationstechnik FI

 

6065 motiv-digitale-transformation-1

Kommentare & Pingbacks

2 Gedanken zu “7 Regeln für das Datenmanagement

  1. Vielen Dank für diesen interessanten Blog-Artikel.

    Gerade das Thema Datamanagement oder MDM wird nicht nur im wissenschaftlichen Bereich „vernachlässigt“, sondern ebenso in fast allen Bereichen der Wirtschaft. Eine Anmerkung möchte ich gerne geben da dieser Punkt nicht explizit aufgezeigt wurde:

    die Erstellung eines „Golden Records“ oder „Single Point of the Truth“. Die Aggregation von Daten in einer zentralen Datenbank ist ein entscheidender Faktor für erfolgreiches Datamanagement. Daten liegen meist an verschiedenen Orten, in verschiedenen Abteilungen oder gar technischen Systemen vor.

    Hier gilt es eine zentrale „Schaltzentrale“ zu schaffen welche die Daten (DEN! Golden Record) an die verschiedenen Stellen kommuniziert und somit verlässlich immer die gleiche, valide Information bereitstellt.

    • Lieber Herr Wollenschein, vielen Dank für Ihren Kommentar. Sie haben absolut Recht, wenn Sie sagen, dass eine zentrale Datenablage unerlässlich ist. Es stimmt, dass dieser Punkt nicht explizit erwähnt wird. In unserem Fachausschuss haben wir schon mehrfach darüber diskutiert, so dass die Richtlinie eine Regel „Definiere eine zentrale Datenablage“ als Teil einer organisatorischen Aktivität enthalten wird.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*