14.09.2015
Big Data
1. Teil: „Der Data Scientist und die Nadel im Heuhaufen“
Der Data Scientist und die Nadel im Heuhaufen
Autor: Oliver Ehm
Fotolia
Big Data rechnet sich nur, wenn man die Daten auch lesen kann – das macht der Data Scientist. com! professional stellt Ihnen das Berufsbild des Big-Data-Experten en détail vor.
Big-Data-Experten Thomas H. Davenport und DJ Patil in der amerikanischen Fachzeitschrift Harvard Business Review den Data Scientist zum „sexiest job of the 21st century” gekürt. Patil hat den Job auch gleich ergriffen: Seit Februar 2015 ist er Chief Data Scientist of the United States Office of Science and Technology Policy im Weißen Haus in Washington.
Bereits 2012 haben die beiden Dass die These der beiden Autoren nicht aus der Luft gegriffen war, lässt sich anhand aktueller Zahlen belegen. So prognostiziert der Verband der deutschen Internetwirtschaft e.V. (eco), dass bis 2020 mehr als 50 Milliarden Dinge mit dem Internet verbunden sein werden und sich die generierte Datenmenge auf 44 Zettabyte im Vergleich zu heute verzehnfachen wird. Das Volumen der Daten steigt also kontinuierlich an, und wer die Daten für seinen Geschäftserfolg nutzen will, der muss sich das nötige Know-how aneignen.
Grund: Die meisten Informationen sind nicht strukturiert oder gewinnen erst an Aussagekraft, wenn sie ins Verhältnis zu anderen Daten gesetzt werden. Genau hier beginnt die Arbeit des Data Scientists. Er muss die Daten sichten und die für das Unternehmen relevanten Fakten ans Tageslicht befördern.
2. Teil: „Das macht ein Data Scientist im Unternehmen“
Das macht ein Data Scientist im Unternehmen
Data Science – zu Deutsch Datenwissenschaft – bezeichnet die Extraktion von Wissen aus Daten. Der Begriff selbst ist bereits mehr als 50 Jahre alt, er wurde von dem dänischen Informatiker Peter Naur in den 1960er-Jahren als Alternativbegriff für Informatik geprägt. Seitdem hat sich dessen Bedeutung allerdings grundlegend verändert.
So sind etwa die Produktempfehlungen im Webshop von Amazon das Werk von Data Science. Aber auch in der Versicherungsbranche wird sie für die Tarifierung der Prämien herangezogen oder in der Industrie zur Auswertung der Sensoren von Produktionsmaschinen eingesetzt.
Es zeigt sich: Data Science ist dort wichtig, wo ständig viele Daten anfallen – und das ist mittlerweile fast überall der Fall. Mit der Unterstützung durch Data Scientists können Firmen dann ihre Unternehmensführung optimieren, neue individualisierte Dienstleistungen anbieten oder intelligente Produkte entwickeln.
Nach Informationen graben
Betrachtet man die Arbeit eines Data Scientists genauer, so lässt sich daraus ableiten, über welche Qualifikationen er verfügen sollte.
Zum einen muss er sich die Daten beschaffen und sie aufbereiten. Hier sind vor allem Programmierkenntnisse gefordert, mit denen er Programme und Filter erstellt, die die gewünschten Informationen aus dem Datenpool extrahieren.
Mit den Daten selbst lässt sich in der Rohform aber noch nicht viel anfangen, sie müssen gesäubert, formatiert und gegebenenfalls auch transformiert werden.
Aus den aufbereiteten Daten lassen sich anschließend aber immer noch keine Kenntnisse gewinnen. Hier kommt die zweite Qualifikation des Data Scientists ins Spiel, die mathematischen und statistischen Kenntnisse. Dazu gehören Standards wie lineare Regression, Varianzanalyse sowie Visualisierung und Text Mining.
Zur dritten Qualifikation zählen ein grundlegendes Geschäftsverständnis und detaillierte Kenntnisse der Unternehmensziele und -prozesse, die je nach Anwendungsfeld variieren können.
Auf den Punkt bringt es das auf dieser Seite abgebildete Venn-Diagramm von Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC. Sein Diagramm ist eine Weiterentwicklung des Venn-Diagramms des amerikanischen Sozial- und Politikwissenschaftlers Drew Conway.
Es zeigt, wie sich die drei Qualifikationen eines Data Scientists überlappen. Das Feld in der Mitte, dem Schnittpunkt der drei Qualifikationen, hat Steve Geringer Unicorn (Einhorn) genannt. Unicorn steht hier für den Data Scientist. Steve Geringer begründet die Namensgebung in seinem Blog damit, dass seiner Meinung nach Data Scientists so schwer zu finden sind wie Einhörner.
3. Teil: „Die IT-Experten eines Data-Scientist-Teams“
Die IT-Experten eines Data-Scientist-Teams
Da es sehr schwierig ist, Experten zu finden, die sämtliche Qualifikationen des Data Scientists in sich vereinen, stellen Unternehmen Data-Scientist-Teams zusammen. Um die einzelnen Qualifikationsprofile weitestgehend abzudecken, bestehen diese Teams meistens aus Physikern, Mathematikern und Betriebswirten.
Bei der Zusammenarbeit greifen die Arbeitsschritte der Experten des Teams wie in einem Uhrwerk ineinander, wenn sie versuchen, das Unternehmen mit Hilfe des Wissens, das aus den Daten generiert wird, nach vorn zu bringen.
Business-Developer: Sind für die Unternehmensentwicklung zuständig. Dazu bringen sie die Unternehmensziele mit den Datenanalysen in Verbindung, um beispielsweise neue Geschäftsmodelle zu entwickeln, individualisierte Angebote zu erstellen, smartere Produkte zu entwerfen oder die Geschäftsprozesse zu optimieren.
Data-Analysten: Sie sind die Mathematiker und Statistiker im Team und rücken den Daten mit analytischen Methoden, Data-Mining-Verfahren und Techniken der Datenvisualisierung zu Leibe. Mit Hilfe maschineller Lernverfahren entwickeln sie prädiktive Modelle, um neue Trends in den Daten aufzuspüren, Prognosen zu erstellen und Handlungsoptionen abzuleiten.
Data-Manager: Kümmern sich um den Datenbestand und bringen dazu die strukturierten und unstrukturierten Daten, die aus heterogenen Quellen stammen, in eine gemeinsame Datenbank. Wichtig ist dabei, die Dokumente und Daten so zu organisieren, dass der Zugriff effizient und eine leichte Nachverfolgbarkeit gewährleistet ist. Außerdem sorgen Data-Manager dafür, dass die Daten durch Metadaten ausreichend beschrieben sind.
Application-Developer: Sie stellen die IT-Experten im Team dar. Dazu kennen sie sich mit modernen Datenbanken wie noSQL und verteilter Speicherung via Hadoop aus und können mit ihrem Wissen robuste, skalierbare Lösungen entwickeln, um Massendaten datenschutzkonform auszuwerten und die Ergebnisse zur weiteren Verwendung sicher in die Unternehmens-IT einzuspeisen.
4. Teil: „Data Scientists sind in den Unternehmen begehrt“
Data Scientists sind in den Unternehmen begehrt
Für wie wichtig Unternehmen datenzentrierte Geschäftsmodelle halten, zeigt eine Studie von Crisp Research, die 2015 veröffentlicht wurde. Nach Einschätzung des Marktforschungsunternehmens werden in diesem Jahr bereits rund 95 Milliarden Euro für Analytics- und datenbasierte Services ausgegeben – Tendenz weiter steigend. Kein Wunder also, wenn derzeit händeringend nach Datenexperten gesucht wird.
Praxisbeispiele
Jedes Unternehmen, das sich die digitale Transformation auf die Fahnen geschrieben hat – damit sind nicht nur die großen gemeint, sondern auch kleine und mittlere Unternehmen –, können von Data Science profitieren. Wer nicht weiß, wie Big Data in sein Geschäftsmodell passt, der sollte einen Blick in die Broschüre „Big Data und Geschäftsmodell – Innovationen in der Praxis: 40+ Beispiele“ werfen, die der Branchenverband Bitkom herausgegeben hat. Hier werden viele Einsatzbeispiele von Big Data in Wirtschaft und Verwaltung vorgestellt. Die Beispiele sollen die deutschen Unternehmen ermuntern, in Big Data zu investieren, „denn in den datenzentrierten und kundenorientierten Geschäftsmodellen liegen bedeutende Chancen für den Wirtschaftsstandort Deutschland“, so Dieter Kempf, bis vor Kurzem Bitkom-Präsident.
Doch damit sich Big Data für ein Unternehmen rechnet, sind Spezialisten in Form von Data Scientists nötig. Denn: „Ohne das nötige mathematische sowie technische Knowhow, aus großen Datenmengen relevante Informationen abzuleiten, verursacht Big Data eher Kosten als Nutzen. Somit sind Data Scientists für jedes Unternehmen, welches auf Big Data setzt, unverzichtbar, um die wirklich interessanten Informationen, die einen realen Mehrwert liefern, zu identifizieren“, betont Christian Liguda, Data Scientist bei der Performance Marketing-Agentur eprofessional in Hamburg, im Interview mit marktforschung.de.
5. Teil: „Universitäre Ausbildung und Weiterbildung“
Universitäre Ausbildung und Weiterbildung
Ein breiteres Angebot gibt es im Ausland. So bietet beispielsweise die Colorado Technical University das Programm „Doctor of Computer Science – Big Data Analytics (DCS-BDA)” an. Ein typisches Masterprogramm zum Master of Science in Business Analytics wird von der Universität USC Marshall School of Business in Los Angeles als Einjahresprogramm für angehende Data Scientists angeboten. In Frankreich hat die Business School HEC einen MBA-Studiengang eingerichtet, der gezielt die Fähigkeit zur Entwicklung von Big-Data-Lösungen vermittelt. Die spanische IE School of Social and Behavioral Sciences in Madrid offeriert einen „Master in Business Analytics & Big Data“ und die Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) hat einen kompletten Weiterbildungsstudiengang „Diploma of Advanced Studies (DAS) in Data Science“ im Angebot.
Bis genügend Experten für Data Science von den Universitäten kommen, dürfte noch etwas Zeit verstreichen.
Weiterbildung
Fortbildungsmöglichkeiten in Data Science bieten verschiedene Forschungsinstitute und andere Einrichtungen an. Die Fraunhofer-Gesellschaft beispielsweise hält ein umfassendes Seminarprogramm für Data Scientists bereit.
Das Paket richtet sich schwerpunktmäßig an Praktiker und besteht aus zahlreichen Modulen, die abhängig vom Tätigkeitsschwerpunkt (Projektleiter, Entwickler, Analytiker, Sales Manager) kombiniert werden können.
Auch bei Online-Plattformen wie Coursera, Udacity oder edX gibt es Kurse, mit denen sich Data-Science-Grundlagen erlernen lassen. Der Nachteil dieser Weiterbildungen liegt allerdings darin, dass die Abschlüsse nicht zertifiziert sind und es daher nicht garantiert ist, dass sie vom Arbeitgeber akzeptiert werden.
Weitere Infos
- www.iais.fraunhofer.de/datascience.html
Webseite des Fraunhofer-Instituts fur Intelligente Analyse- und Informationssysteme IAIS zum Thema Data Science
- www.bitkom.org/Bitkom/Publikationen/Publikation_527.html
Bitkom-Leitfaden zu Big Data mit Praxisbeispielen
- www.coursera.org
Webseite mit Fortbildungskursen zu Data Science
Huawei Roadshow 2024
Technologie auf Rädern - der Show-Truck von Huawei ist unterwegs
Die Huawei Europe Enterprise Roadshow läuft dieses Jahr unter dem Thema "Digital & Green: Accelerate Industrial Intelligence". Im Show-Truck zeigt das Unternehmen neueste Produkte und Lösungen. Ziel ist es, Kunden und Partner zusammenzubringen.
>>
Roadmap
Estos bringt neue Services und Produkte
Der Software-Hersteller feilt an seinem Partnerprogramm, hat Schlüsselpositionen neu besetzt und kündigt eine ganze Reihe neuer Produkte und Services an. Das ist die Estos-Roadmap bis Ende des Jahres.
>>
Mit KI
Enreach Open Air Partner-Event 2024 in Dortmund
Der Hersteller Enreach lädt Partner am 5. Juni an seinen Firmensitz ein, um mit Ihnen über smarte Sprachassistenten, Conversational AI und weitere Kommunikationslösungen zu diskutieren.
>>
Mainframe
T-Systems gewinnt größten Auftrag in Dänemark
Der dänische IT-Spezialist für den öffentlichen Sektor und moderne Gesellschaften KMD hat T-Systems mit dem Betrieb seiner Mainframe-Infrastruktur beauftragt.
>>