Big Data
19.06.2018
Daten anschaulich darstellen
1. Teil: „Das leisten Tools zur Datenvisualisierung“

Das leisten Tools zur Datenvisualisierung

Big DataBig DataBig Data
Bloomicon / shutterstock.com
Visualisierung erleichtert die Präsentation, Analyse und Interpretation von Daten. com! professional zeigt sechs spannende Visualisierungs-Tools im Vergleich.
Ein Chart sagt mehr als tausend Zahlen, könnte man in Abwandlung eines überstrapazierten Bonmots feststellen. Tatsächlich werden große Zahlenmengen und ihre Zusammenhänge oft erst anschaulich und nachvollziehbar, wenn man sie als Torte, Balken, Linie oder Kurve betrachten kann. Darüber hinaus erleichtert eine verständliche, ansprechende Präsentation die Kommunikation.
Grafische Formate gestatten eine schnelle Zusammenfassung und erlauben es auch themenfremden Betrachtern, die Daten zu interpretieren. So wird aus jedem Mitarbeiter im Unternehmen zwar noch kein Datenwissenschaftler, aber doch ein informierter Diskussionsteilnehmer. Auch wenn es darum geht, Trends aus dem Datenmaterial abzuleiten, bietet die bildliche Aufbereitung wesentliche Vorteile.

Selfservice ist Trumpf

Moderne Datenvisualisierungs-Tools gehen dabei über die Standard-Diagramme, wie man sie aus Excel kennt, hinaus. Das Repertoire umfasst etwa Infografiken, Skalen, geografische Karten, Begriffswolken, Heatmaps und Fieberkurven. So lassen sich selbst komplexeste Wechselwirkungen mit geeigneten Visualisierungen verständlich machen.
Interaktive Grafiken bieten zusätzliche Möglichkeiten. Zusammenhänge lassen sich damit so darstellen, dass auch unterschiedliche Zielgruppen sie schnell verstehen. Die Bilder können interaktive Funktionen umfassen, mit denen Anwender sie verändern oder zur Abfrage und Analyse auf die zugrunde liegenden Daten zugreifen können.
Um aus Daten anschauliche Grafiken zu machen, sind Fachwissen, technische Kenntnisse oder die Anstellung von Grafik- oder Programmier-Profis keine unabdingbaren Vo­raussetzungen mehr. Zahlreiche Tools zeichnen sich besonders durch ihren Selfservice-Ansatz aus, der es jedem Mitarbeiter erlauben soll, eigene Auswertungen zu erstellen. Dabei sind auch Animationen, Interaktionsgrafiken oder Echtzeit-Datenvisualisierungen mittlerweile dank einiger nützlicher Helfer aus dem Web ohne allzu großen Aufwand für jedermann machbar.

Große Bandbreite

Viele der heute verfügbaren Tools sind kostenlos oder verlangen erst für den Zugriff auf fortgeschrittene Funktionen den Abschluss eines Abos mit Monatsgebühr. Das erlaubt es, sich ohne finanziellen Aufwand im Markt umzutun, um die geeignete Lösung zu identifizieren. Denn nicht jedes Tool eignet sich für jeden Zweck.
Etliche Webanwendungen sind so einfach gehalten, dass der Nutzer weder Programmierkenntnisse noch Designwissen mitbringen muss. Dieser Ansatz birgt jedoch automatisch die Gefahr, dass alle mit dem Tool erstellten Arbeiten sich bis zu einem gewissen Grad ähneln.
Beachten sollte man auch, dass die Grafikgötter vor die Visualisierung die Strukturierung der Daten gesetzt haben. Wer seine Datensätze ordentlich als CSV, JSON, TSV, XML oder in einem ähnlichen Format organisiert hat, kann mit den meisten Tools direkt einsteigen.
Im Folgenden finden Sie eine Auswahl unterschiedlicher Datenvisualisierungs-Tools im Überblick. Darunter sind sowohl Spezialisten, die ganz besonders Infografiken oder interaktive Landkarten in Szene setzen, als auch Universal-Tools, mit denen sich bei etwas Einarbeitung jeder Datensatz zum Leuchten bringen lässt.
2. Teil: „Easelly“

Easelly

  • Easelly: Das Tool richtet sich hauptsächlich an Einsteiger und generiert direkt im Browser ansprechende Infografiken.
Infografiken sind ein probates Mittel, um textlastige Inhalte interessant zu gestalten. Sie aufzubauen ist jedoch oft knifflig und zeitaufwendig. Helfen kann ein Infografik-Generator, der diesen Prozess wesentlich einfacher und weniger mühsam macht. Mit Easelly lassen sich direkt im Browser ansprechende Infografiken auf einfachste Weise generieren. Die web­basierte Plattform richtet sich vornehmlich an Einsteiger und versetzt sie mit intuitiv zu benutzenden Werkzeugen in die Lage, ihre eigenen Ideen, Daten und Konzepte umzusetzen.
Dabei hilft eine Vielzahl von fertigen Vorlagen, die in weitem Rahmen abgeändert, ergänzt und umgestaltet werden können. So entstehen etwa Zeitachsen, kommentierte Landkarten, Flussdiagramme, Schrittanweisungen und Ähnliches mit geringem Aufwand und ohne große Vorarbeit.
Man beginnt mit einem leeren Arbeitsbereich oder mit einem der vorgefertigten Templates, die zu verschiedenen Themen und in diversen Formaten angeboten werden. Eine Reihe von Schaltern am oberen Rand des Arbeitsbereichs erlaubt es, Hintergründe, Icons, Fotos, Videos, Charts und weitere Elemente mit der Maus in den Bereich zu ziehen und frei oder anhand eines zuschalt­baren Rasters zu platzieren. Auch eigene Bilder können hochgeladen, platziert und bearbeitet werden.
Zu den Bearbeitungsfunktionen gehören etwa Skalieren, Kopieren, Rotieren, Fixieren und Verlinken, bei einfachen Elementen wie Pfeilen oder Kästen lässt sich außerdem die Farbe ändern, bei den komplexeren Icons ist das allerdings nicht möglich.
Für bestimmte Elemente eröffnen sich mit einem Doppelklick weitere Bearbeitungsmöglichkeiten. So kann etwa Text eingegeben beziehungsweise geändert und formatiert werden. Für Charts öffnet sich ein Formular zur Dateneingabe in Tabellenform, das auch Optionen wie Beschriftung, Einheiten und Legende der Grafik berücksichtigt.
Ist man mit dem Ergebnis zufrieden, wird es gespeichert und kann dann entweder als PDF, PNG- oder JPG-Bild heruntergeladen oder per Weblink geteilt werden. An diesem Punkt wird auch festgelegt, ob die Grafik privat oder öffentlich sein soll. Wer nicht die Öffentlichkeit an seiner Arbeit teilhaben lassen will, benötigt ein Abo der Profi-Edition für 36 Dollar im Jahr. Damit erhält man neben der „Private“-Einstellung auch den vollen Leistungsumfang mit über 800.000 Grafikelementen, 300.000 frei verwendbaren Fotos und Hunderten Vorlagen.
3. Teil: „CARTO“

CARTO

  • CARTO: Ermöglicht mit seinen Drag-and-Drop-Funktionen die Analyse von Standortdaten auch ohne Programmierkenntnisse.
    Quelle:
    CARTO
Auf interaktive Karten ist CARTO spezialisiert, eine cloud­basierte Open-Source-Plattform mit leistungsfähigen Funk­tionen zur Standortbestimmung und räumlichen Analyse. Eine intuitive Drag-and-Drop-Oberfläche unterstützt den Anwender dabei, ansprechende Karten zu erstellen. Dazu braucht er nicht über ausgeprägtes technisches Wissen zu verfügen.
Anders als ältere Lösungen für grafische Informationssysteme soll das Selfservice-Portal eine unkomplizierte Verwendung und Pflege der eigenen Daten ermöglichen, während ein integrierter Wizard komplexe Standort-Apps zu implementieren hilft, ohne dass man selbst eine Zeile Code schreiben müsste. Dieser „CARTO Builder“ erleichtert mit seinen Drag-and-Drop-Funktionen Anwendern ohne Programmierkenntnisse die Analyse von Standortdaten. Widget-basierte Dashboards liefern relevante Erkenntnisse und versuchen sich sogar an Vorhersagen. Eine „Auto Styling“-Funktion, die zugeordnete Daten analysiert, soll Beziehungen und Trends erkennen, um so Rätselraten zu vermeiden. In der Builder-Umgebung lassen sich auch erweiterte standortbasierte Apps erstellen und Ergebnisse direkt aus Dashboards extrahieren, ohne dass Visualisie­rungen oder Originaldaten dafür bearbeitet werden müssten. Daten aus Tabellenkalkulationen, Sensornetzwerken und anderer Unternehmens-Software sind einfach zu verknüpfen.
CARTO bietet benutzerdefinierte Basemaps, Geocoding, Routing, Isolinien und ein sogenanntes Datenobservatorium. Basemaps sind als Rasterkarten auch für hochauflösende Displays (etwa Retina) über Standard-Titel-URLs oder als Vektorkarten (GL) verfügbar. Zur fortlaufenden Aktualisierung der Grundkarten verwendet CARTO Daten von OpenStreetMap oder Drittanbietern. Die Karten verfügen über ein skalierbares Framework und können mit Unterstützung durch CARTO weiter angepasst werden. Raster-Basemaps sind direkt ohne API-Schlüssel verwendbar. CARTO bringt einen integrierten Geocodierer mit PostgreSQL- und PostGIS-Funktionen mit, der Vorwärts- und Rückwärts-Geocodierung ermöglicht. Damit sollen sich auch Datensätze ohne Geodaten in Karten mit genauer Standortidentifizierung umwandeln lassen. Der Routing-Service bietet eine schnelle Kursanalyse mit Bestimmung der kürzesten Strecke und Abbiegeanweisungen, die auf dem eingesetzten Transportmittel basieren. Routing-Ergebnisse können dauerhaft gespeichert werden. Der Service ist global über den Javascript-Client oder über die JSON-API per HTTP verfügbar.
Das integrierte eigene Datenobservato­rium erweitert die vorhandenen Standortdaten um demografische, wirtschaftliche und Immobiliendatensätze, sodass umfassende Berichte über die Merkmale der Anwohnerschaft entstehen.
Angeboten wird der cloudbasierte Service ab 150 Dollar pro Monat bei jährlicher Abrechnung. Der Preis für die Enterprise-Variante mit erweiterten Funktionen und der Möglichkeit zur On-Premise-Installation ist auf Anfrage zu erfahren.
4. Teil: „Infogram“

Infogram

  • Infogram: Das Datenvisualisierungs-Tool hat neben Infografiken auch zahlreiche andere Formate und interaktive Dashboards im Angebot.
Infogram ist eine Datenvisualisierungs-Lösung, die auf Infografiken spezialisiert ist, daneben aber auch Charts, Karten, Berichte und interaktive Dashboards im Angebot hat. Vorgefertigte Designvorlagen, darunter über 500 Karten und mehr als 35 interaktive Diagramme, erleichtern dem Benutzer die Arbeit ebenso wie der einfache Drag-and-Drop-Editor, den man in einer aufgeräumten, intuitiven Bedienoberfläche verwendet. Dabei hat der Anwender meist nur genau die Optionen vor Augen, die er gerade benötigt.
Nach der Auswahl der Vorlage lassen sich die Daten per XLS-, XLSX- oder CSV-Datei importieren. Infogram unterstützt dabei Cloud-Dienste wie OneDrive, Dropbox und Google Drive. Alternativ kann die Eingabe in der integrierten Tabelle des Web-Clients erfolgen oder man beschickt Diagramme per Web-Tool mit Live-Daten. Mit den interaktiven Karten lassen sich Daten aus mehr als 500 Ländern und Gebieten als Symbole, Zeitreihen und Heatmaps einbinden.
  • Visualisierungs-Tools: Die meisten Angebote skalieren anstandslos für jedes ­aktuell gebräuchliche Endgerät.
    Quelle:
    Infogram
Zur Illustration bietet Infogram rund 1 Million Stockfotos und über 500.000 Icons und Symbole an. Wer dennoch nicht das Passende findet, kann eigene Logos, Bilder und Videos hochladen. Sobald Erstellung und Bearbeitung abgeschlossen sind, können Infografiken, Diagramme oder Berichte im PDF-, PNG-, JPG- oder GIF-Format exportiert werden. Außerdem lassen sich die Visualisierungen in sozialen Medien teilen oder mit einer interaktiven HTML-Option in eigene Webseiten einbetten. Infogram kann die Arbeiten online über Integrationen mit Facebook Instant Articles, Medium und WordPress veröffentlichen. Inhalte, die mit einem Gratis-Account erstellt wurden, lassen sich jedoch nur über das Webportal teilen oder online veröffent­lichen. Neben dem kostenlosen Zugang mit eingeschränkter Funktionalität und Projektzahl bietet Infogram drei Business-Preispläne zwischen 25 und 180 Dollar monatlich an, wobei sich durch jähr­liche Zahlungsweise etwa 20 Prozent einsparen lassen. Der Preis für die Enterprise-Edition mit noch einmal erweitertem Leistungsumfang teilt der Anbieter auf Anfrage mit.
5. Teil: „Tableau Online“

Tableau Online

  • Tableau Online: Hierbei handelt es sich um eine gehostete Version der Business-Intelligence-Komponente Tableau Server.
    Quelle:
    Tableau
Tableau ist ein Business-Intelligence-System zur Datenvisualisierung, das ein nahtloses Benutzer­erlebnis vom PC bis zum iPad gewährleisten will. Dashboards lassen sich damit ohne Programmierkenntnisse erstellen und veröffentlichen, um sie mit Partnern, Kollegen oder Kunden zu teilen. Dabei arbeiten mehrere Komponenten zusammen: Tableau Desktop heißt die Selfservice-Analyse-Lösung, mit der sich Daten schnell darstellen und Fragen einfach beantworten lassen sollen. Sie wird verwendet, um unterschiedliche Datenquellen zu verbinden, die Daten zu analysieren und mit wenigen Klicks Berichte zu erstellen. Tableau Server ermöglicht Benutzern die sichere Zusammenarbeit und den Austausch von Einblicken und Informationen über umfassende Dashboards, die in Tableau Desktop oder direkt in Tableau Server erstellt wurden. Dashboards aus Tableau Desktop lassen sich so für jeden Browser oder auf jedem mobilen Gerät veröffentlichen.
Tableau Online schließlich ist eine gehostete Version von Tableau Server. Tableau will damit Business Intelligence schneller und einfacher machen.
  • Tableau: Verfügt über eine integrierte Rechteverwaltung mit abgestuften Zugriffsmöglichkeiten je Grafik.
    Quelle:
    Tableau
Tableau kann Datenquellen live und im Speicher ohne Programmierung verbinden. Zu den erwähnenswerten Konnektoren gehören Amazon Redshift, Cloudera Hadoop, SQL Server, Salesforce, Google Analytics, MongoDB, Dropbox und PDF-Dateien. Der Nutzer kann zwischen Live- und In-Memory-Daten wechseln, automatische Aktualisierungen einrichten und sich über die Tableau-Plattform benachrichtigen lassen, wenn eine Datenverbindung fehlschlägt. Dank Drag-and-Drop-Funktionen sind Daten einfach zu integrieren und aussagekräftige Visualisierungen schnell erstellt. Tableau kann dabei mit jeder Datenquelle vor Ort oder in der Cloud verbunden werden.
Ein Tool namens Device Designer erlaubt es dem Benutzer, Dashboards zu entwerfen, anzupassen und zu veröffentlichen, die für Desktops, Smartphones und Tablets skalierbar sind. Die Dashboards lassen sich darüber hinaus in vorhandene Anwendungen wie Salesforce, SharePoint oder Jive einbetten. Unter der Bezeichnung Tableau Public ist daneben eine kostenlose Version von Tableau Desktop und Tableau Online verfügbar – allerdings ausschließlich für Daten, die öffentlich freigegeben werden sollen. Die Bezahl-Edition von Tableau Online kostet 42 Dollar im Monat bei jährlicher Abrechnung.
6. Teil: „D3.js“

D3.js

  • D3.js: Bietet als datengetriebene Javascript-Bibliothek den universellsten Ansatz unter den hier vorgestellten Lösungen.
Große Datensätze im Web und interaktiv in Szene setzen – dazu eignet sich D3.js, eine datengetriebene Javascript-Bibliothek. Sie übersetzt Rohdaten in Visualisierungen und arbeitet nahtlos mit Microsoft Excel zusammen. D3 steht für Data Driven Documents und die Bibliothek erlaubt es, Daten so an ein Document Object Model (DOM) zu binden, dass die Dokumente von überall aus bearbeitet werden können. Danach lassen sich die Daten transformieren, indem man mit einer Auswahl arbeitet und einzelne Informationsknoten manipuliert.
D3.js ist im Grunde aber weder eine Grafikbibliothek noch eine Datenverarbeitungsbibliothek. Vielmehr liegt D3.js dazwischen und umfasst Tools, die die Verbindung zwischen Daten und Grafiken vereinfachen. So ermöglicht D3.js die einfache Modifikation und Transformation von Knoten, etwa das Formatieren von Attributen, das Registrieren von Event-Listenern, das Ändern von Knoten, das Ändern von HTML- oder Textinhalten und den Zugriff auf das zugrunde liegende DOM.
  • D3.js: In einer aktiven Community findet man als Anwender unzählige Beispieldiagramme und Unterstützung.
Zahlreiche eingebaute Funktionen und die Möglichkeit, neue Funktionen als grafische Primitive zu erstellen, erlauben komplexe Aktivitäten wie das Abrufen geografischer Koordinaten. D3.js nutzt HTML, CSS und SVG, um die Grafiken zu generieren. Dabei sorgen animierte Übergänge mit hohen Bildraten für eine beeindruckende Visualisierung.
Eine große Stärke von D3.js ist seine Flexibilität. Da es nahtlos mit bestehenden Webtechnologien zusammenarbeitet und beliebige Teile des DOM manipulieren kann, ist es jeweils so flexibel wie der clientseitige Webtechnologie-Stack. Damit ist D3.js gegenüber vielen anderen Tools im Vorteil, weil es beinahe jede Form, die der Anwender wünscht, annehmen kann.
Neben innovativen und nützlichen Funktionen zeichnet D3.js eine gute und verständliche Dokumentation aus. Sie ist ein wichtiger Faktor, denn hier gibt es kein Drag-and-Drop-Interface. Javascript-Kenntnisse sind ebenso Vo­raussetzung wie ein eigener Server. D3.js als Java-Bibliothek ist komplett kostenlos.
7. Teil: „Qlik Sense“

Qlik Sense

  • Qlik Sense: Verweist vor allem auf seine assoziative Daten-­Engine, die Daten aus vielen Quellen spielend kombiniert.
    Quelle:
    Qlik
Der Business-Intelligence-Anbieter QlikTech ist vor allem für QlikView bekannt, eine produktionsorientierte Analyseplattform mit Entwicklerfokus, und Qlik Sense, die cloudfähige Selfservice-Variante. Gelobt wird Qlik Sense vor allem für seine assoziative Daten-Engine und exzellente Erweiterbarkeit. So soll es besonders einfach sein, Daten aus unterschiedlichen Quellen zu kombinieren und zeitintensive Aufgaben zu automatisieren. Qlik Sense bietet daneben bewährte Funktionen über eine benutzerfreundliche Drag-and-Drop-Schnittstelle. Die Online-Variante Qlik Sense Cloud wird kostenlos für Arbeitsgruppen von bis zu fünf Benutzern oder für größere Teams als Cloud Business für 15 Dollar pro Nutzer und Monat angeboten. Qlik Sense Desktop ist das Einstiegsprodukt und kann kostenlos heruntergeladen und mit eingeschränktem Zugriff auch verwendet werden. Es greift problemlos auf Desktop-Datenquellen wie Excel- und CSV-Dateien zu. Verbindungen zu Datenbanken im Netzwerk erfordern dagegen etwas Aufwand. Ein Data-Load-Editor erlaubt es, andere Quellen an­zugeben, daneben ist ein Open-Database-Connectivity-Konnektor (ODBC) verfügbar. Sobald die Daten im Zugriff sind, werden sie in eine assoziative In-Memory-En­gine geladen, die sie für höhere Geschwindigkeit komprimiert. Auf diese Weise erzielt Qlik eine sehr gute Leistung, wenn die Daten in den Speicher passen.
Auch die Aussagekraft der Daten wird durch die assoziative Engine sinnvoll unterstützt. So werden Datenquellen etwa farbcodiert, um ihre Beziehung zu bereits verwendeten Quellen anzuzeigen. Zur Darstellung wird nahezu jede Art von Diagramm unterstützt. Dabei stellt Qlik Sense das „Sheet“ oder Blatt in den Mittelpunkt der Arbeit. Ein Blatt kann Diagramme, Tabellen, Bilder und Filter aufnehmen und aus mehreren Visualisierungen bestehen. Die Desktop-Version unterstützt die Verteilung von Visualisierungen per Datei. Desktop-Benutzer können außerdem Visualisierungen in Qlik Sense Cloud hochladen und mit bis zu fünf Benutzern teilen.
Das serverbasierte Qlik Sense Enterprise bietet alle Möglichkeiten der Desktop-Version, dazu kommen Collabora­tion-Funktionen, Skalierbarkeit, Datenverwaltung, Governance und Plattform-Management. Preise erfährt man auf Anfrage. Benutzer erhalten die volle Funktionalität über eine browserbasierte Schnittstelle auch auf mobilen Geräten. Visua­lisierungen lassen sich über dieselbe Schnittstelle erstellen, anzeigen, teilen und verwalten. Eine intelligente Größenanpassung erlaubt die Darstellung auf nahezu jedem Display.
Tabelle:


mehr zum Thema