Business-IT
14.09.2015
Big Data
1. Teil: „Der Data Scientist und die Nadel im Heuhaufen“

Der Data Scientist und die Nadel im Heuhaufen

Autor:
Personen mit WortwolkePersonen mit WortwolkePersonen mit Wortwolke
Fotolia
Big Data rechnet sich nur, wenn man die Daten auch lesen kann – das macht der Data Scientist. com! professional stellt Ihnen das Berufsbild des Big-Data-Experten en détail vor.
  • Christian Liguda, Data Scientist, Marketing-Agentur eprofessional GmbH: „Data Scientists sind für jedes Unternehmen, das auf Big Data setzt, unverzichtbar.“
Bereits 2012 haben die beiden Big-Data-Experten Thomas H. Davenport und DJ Patil in der amerikanischen Fachzeitschrift Harvard Business Review den Data Scientist zum „sexiest job of the 21st century” gekürt. Patil hat den Job auch gleich ergriffen: Seit Februar 2015 ist er Chief Data Scientist of the United States Office of Science and Technology Policy im Weißen Haus in Washington.
Dass die These der beiden Autoren nicht aus der Luft gegriffen war, lässt sich anhand aktueller Zahlen belegen. So prognostiziert der Verband der deutschen Internetwirtschaft e.V. (eco), dass bis 2020 mehr als 50 Milliarden Dinge mit dem Internet verbunden sein werden und sich die generierte Datenmenge auf 44 Zettabyte im Vergleich zu heute verzehnfachen wird. Das Volumen der Daten steigt also kontinuierlich an, und wer die Daten für seinen Geschäftserfolg nutzen will, der muss sich das nötige Know-how aneignen.
Grund: Die meisten Informationen sind nicht strukturiert oder gewinnen erst an Aussagekraft, wenn sie ins Verhältnis zu anderen Daten gesetzt werden. Genau hier beginnt die Arbeit des Data Scientists. Er muss die Daten sichten und die für das Unternehmen relevanten Fakten ans Tageslicht befördern.
2. Teil: „Das macht ein Data Scientist im Unternehmen“

Das macht ein Data Scientist im Unternehmen

Data Science – zu Deutsch Datenwissenschaft – bezeichnet die Extraktion von Wissen aus Daten. Der Begriff selbst ist bereits mehr als 50 Jahre alt, er wurde von dem dänischen Informatiker Peter Naur in den 1960er-Jahren als Alternativbegriff für Informatik geprägt. Seitdem hat sich dessen Bedeutung allerdings grundlegend verändert.
  • Qualifikationen eines Data Scientists: Das Diagramm zeigt, welche drei Qualifikationen der Data Scientist braucht. Der Schnittpunkt aller drei Eigenschaften (Unicorn) stellt das Ideal dar.
Heute ist es die Aufgabe von Data Scientists, aus einer großen Menge von Daten, die einem Unternehmen aus unterschiedlichen Quellen wie sozialen Netzwerken, Hotlines oder Webshops zufließen, Trends zu erkennen und daraus Handlungsempfehlungen abzuleiten, um beispielsweise effizienter zu werden oder die Kundenzufriedenheit zu erhöhen.
So sind etwa die Produktempfehlungen im Webshop von Amazon das Werk von Data Science. Aber auch in der Versicherungsbranche wird sie für die Tarifierung der Prämien herangezogen oder in der Industrie zur Auswertung der Sensoren von Produktionsmaschinen eingesetzt.
Es zeigt sich: Data Science ist dort wichtig, wo ständig viele Daten anfallen – und das ist mittlerweile fast überall der Fall. Mit der Unterstützung durch Data Scientists können Firmen dann ihre Unternehmensführung optimieren, neue individualisierte Dienstleistungen anbieten oder intelligente Produkte entwickeln.
  • Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC: „Data Scientists are as hard to find as unicorns.“

Nach Informationen graben

Betrachtet man die Arbeit eines Data Scientists genauer, so lässt sich daraus ableiten, über welche Qualifikationen er verfügen sollte.
Zum einen muss er sich die Daten beschaffen und sie aufbereiten. Hier sind vor allem Programmierkenntnisse gefordert, mit denen er Programme und Filter erstellt, die die gewünschten Informationen aus dem Datenpool extrahieren.
Mit den Daten selbst lässt sich in der Rohform aber noch nicht viel anfangen, sie müssen gesäubert, formatiert und gegebenenfalls auch transformiert werden.
Aus den aufbereiteten Daten lassen sich anschließend aber immer noch keine Kenntnisse gewinnen. Hier kommt die zweite Qualifikation des Data Scientists ins Spiel, die mathematischen und statistischen Kenntnisse. Dazu gehören Standards wie lineare Regression, Varianzanalyse sowie Visualisierung und Text Mining.
Zur dritten Qualifikation zählen ein grundlegendes Geschäftsverständnis und detaillierte Kenntnisse der Unternehmensziele und -prozesse, die je nach Anwendungsfeld variieren können.
Auf den Punkt bringt es das auf dieser Seite abgebildete Venn-Diagramm von Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC. Sein Diagramm ist eine Weiterentwicklung des Venn-Diagramms des amerikanischen Sozial- und Politikwissenschaftlers Drew Conway.
Es zeigt, wie sich die drei Qualifikationen eines Data Scientists überlappen. Das Feld in der Mitte, dem Schnittpunkt der drei Qualifikationen, hat Steve Geringer Unicorn (Einhorn) genannt. Unicorn steht hier für den Data Scientist. Steve Geringer begründet die Namensgebung in seinem Blog damit, dass seiner Meinung nach Data Scientists so schwer zu finden sind wie Einhörner.
3. Teil: „Die IT-Experten eines Data-Scientist-Teams“

Die IT-Experten eines Data-Scientist-Teams

Da es sehr schwierig ist, Experten zu finden, die sämtliche Qualifikationen des Data Scientists in sich vereinen, stellen Unternehmen Data-Scientist-Teams zusammen. Um die einzelnen Qualifikationsprofile weitestgehend abzudecken, bestehen diese Teams meistens aus Physikern, Mathematikern und Betriebswirten.
  • Die Welt der Daten: Crisp Research zufolge werden 2015 weltweit bereits rund 95 Milliarden Euro für Analytics- und datenbasierte Services ausgegeben.
In der Praxis konzentrieren sich diese Experten auf ihre Spezialbereiche und werden damit zu Business-Developern, Data-Analysten, Data-Managern und Application-Developern.
Bei der Zusammenarbeit greifen die Arbeitsschritte der Experten des Teams wie in einem Uhrwerk ineinander, wenn sie versuchen, das Unternehmen mit Hilfe des Wissens, das aus den Daten generiert wird, nach vorn zu bringen.
Business-Developer: Sind für die Unternehmensentwicklung zuständig. Dazu bringen sie die Unternehmensziele mit den Datenanalysen in Verbindung, um beispielsweise neue Geschäftsmodelle zu entwickeln, individualisierte Angebote zu erstellen, smartere Produkte zu entwerfen oder die Geschäftsprozesse zu optimieren.
Data-Analysten: Sie sind die Mathematiker und Statistiker im Team und rücken den Daten mit analytischen Methoden, Data-Mining-Verfahren und Techniken der Datenvisualisierung zu Leibe. Mit Hilfe maschineller Lernverfahren entwickeln sie prädiktive Modelle, um neue Trends in den Daten aufzuspüren, Prognosen zu erstellen und Handlungsoptionen abzuleiten.
Data-Manager: Kümmern sich um den Datenbestand und bringen dazu die strukturierten und unstrukturierten Daten, die aus heterogenen Quellen stammen, in eine gemeinsame Datenbank. Wichtig ist dabei, die Dokumente und Daten so zu organisieren, dass der Zugriff effizient und eine leichte Nachverfolgbarkeit gewährleistet ist. Außerdem sorgen Data-Manager dafür, dass die Daten durch Metadaten ausreichend beschrieben sind.
Application-Developer: Sie stellen die IT-Experten im Team dar. Dazu kennen sie sich mit modernen Datenbanken wie noSQL und verteilter Speicherung via Hadoop aus und können mit ihrem Wissen robuste, skalierbare Lösungen entwickeln, um Massendaten datenschutzkonform auszuwerten und die Ergebnisse zur weiteren Verwendung sicher in die Unternehmens-IT einzuspeisen.
4. Teil: „Data Scientists sind in den Unternehmen begehrt“

Data Scientists sind in den Unternehmen begehrt

Für wie wichtig Unternehmen datenzentrierte Geschäftsmodelle halten, zeigt eine Studie von Crisp Research, die 2015 veröffentlicht wurde. Nach Einschätzung des Marktforschungsunternehmens werden in diesem Jahr bereits rund 95 Milliarden Euro für Analytics- und datenbasierte Services ausgegeben – Tendenz weiter steigend. Kein Wunder also, wenn derzeit händeringend nach Datenexperten gesucht wird.
  • Dieter Kempf, bis vor Kurzem Bitkom-Präsident: „In den datenzentrierten und kundenorientierten Geschäftsmodellen liegen bedeutende Chancen für den Wirtschaftsstandort Deutschland.“
Carlo Velten zufolge, CEO bei Crisp Research, „ist die Aufgabe der ,Data Scientists‘ in den Unternehmen nicht unbedingt eine ,vergnügungssteuerpflichtige‘ Veranstaltung“, sondern ein Knochenjob, da, so Velten weiter, „die Daten meist nicht in der gewünschten Qualität und Quantität vorliegen“.

Praxisbeispiele

Jedes Unternehmen, das sich die digitale Transformation auf die Fahnen geschrieben hat – damit sind nicht nur die großen gemeint, sondern auch kleine und mittlere Unternehmen –, können von Data Science profitieren. Wer nicht weiß, wie Big Data in sein Geschäftsmodell passt, der sollte einen Blick in die Broschüre „Big Data und Geschäftsmodell – Innovationen in der Praxis: 40+ Beispiele“ werfen, die der Branchenverband Bitkom herausgegeben hat. Hier werden viele Einsatzbeispiele von Big Data in Wirtschaft und Verwaltung vorgestellt. Die Beispiele sollen die deutschen Unternehmen ermuntern, in Big Data zu investieren, „denn in den datenzentrierten und kundenorientierten Geschäftsmodellen liegen bedeutende Chancen für den Wirtschaftsstandort Deutschland“, so Dieter Kempf, bis vor Kurzem Bitkom-Präsident.
Doch damit sich Big Data für ein Unternehmen rechnet, sind Spezialisten in Form von Data Scientists nötig. Denn: „Ohne das nötige mathematische sowie technische Knowhow, aus großen Datenmengen relevante Informationen abzuleiten, verursacht Big Data eher Kosten als Nutzen. Somit sind Data Scientists für jedes Unternehmen, welches auf Big Data setzt, unverzichtbar, um die wirklich interessanten Informationen, die einen realen Mehrwert liefern, zu identifizieren“, betont Christian Liguda, Data Scientist bei der Performance Marketing-Agentur eprofessional in Hamburg, im Interview mit marktforschung.de.
5. Teil: „Universitäre Ausbildung und Weiterbildung“

Universitäre Ausbildung und Weiterbildung

  • Ausbildung zum Data Scientist: Die TU Dortmund ist eine der wenigen Universitäten in Deutschland, die einen kompletten Studiengang anbieten.
Es ist nicht einfach, Experten für Big Data zu bekommen. Das liegt vor allem daran, dass dieses Fachgebiet noch recht jung ist. Auch in der universitären Ausbildung spiegelt sich das wider. So sind komplette Studiengänge mit einer spezifischen Ausrichtung auf Big Data – wie sie etwa die Statistik-Fakultät der TU Dortmund mit dem Masterstudiengang Datenwissenschaft/Data Science anbietet – in Deutschland noch relativ selten. Häufiger findet man an deutschen Universitäten hingegen spezielle Vorlesungen und Seminare, die sich mit Big Data und insbesondere mit Data Science, Data Mining oder Data Crunch beschäftigen.
Ein breiteres Angebot gibt es im Ausland. So bietet beispielsweise die Colorado Technical University das Programm „Doctor of Computer Science – Big Data Analytics (DCS-BDA)” an. Ein typisches Masterprogramm zum Master of Science in Business Analytics wird von der Universität USC Marshall School of Business in Los Angeles als Einjahresprogramm für angehende Data Scientists angeboten. In Frankreich hat die Business School HEC einen MBA-Studiengang eingerichtet, der gezielt die Fähigkeit zur Entwicklung von Big-Data-Lösungen vermittelt. Die spanische IE School of Social and Behavioral Sciences in Madrid offeriert einen „Master in Business Analytics & Big Data“ und die Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) hat einen kompletten Weiterbildungsstudiengang „Diploma of Advanced Studies (DAS) in Data Science“ im Angebot.
Bis genügend Experten für Data Science von den Universitäten kommen, dürfte noch etwas Zeit verstreichen.
  • Online-Kurse: Auf der Webseite von Coursera gibt es kostenlose Fortbildungsangebote zum Thema Data Science.

Weiterbildung

Fortbildungsmöglichkeiten in Data Science bieten verschiedene Forschungsinstitute und andere Einrichtungen an. Die Fraunhofer-Gesellschaft beispielsweise hält ein umfassendes Seminarprogramm für Data Scientists bereit.
Das Paket richtet sich schwerpunktmäßig an Praktiker und besteht aus zahlreichen Modulen, die abhängig vom Tätigkeitsschwerpunkt (Projektleiter, Entwickler, Analytiker, Sales Manager) kombiniert werden können.
Auch bei Online-Plattformen wie Coursera, Udacity oder edX gibt es Kurse, mit denen sich Data-Science-Grundlagen erlernen lassen. Der Nachteil dieser Weiterbildungen liegt allerdings darin, dass die Abschlüsse nicht zertifiziert sind und es daher nicht garantiert ist, dass sie vom Arbeitgeber akzeptiert werden.

Weitere Infos


mehr zum Thema