Sicherheit
23.06.2016
Metadaten auswerten
1. Teil: „Was deine Tweets über dich verraten“

Was deine Tweets über dich verraten

LandkarteLandkarteLandkarte
george studio / Shutterstock.com
Metadaten können sehr viel über User verraten. Wie viel man durch die Kombination der Informationen zweier unabhängiger Online-Dienste über User herausfinden kann, zeigt das Projekt "Tweetmap".
Datenschutz in der vernetzten Welt: Wissen, wie das Haus der Oma eines Users aussieht, obwohl der Twitter-User nie ein Bild davon gepostet hat? Den Namen seiner Freundin kennen, auch wenn er deren Identität nirgendwo preisgegeben hat? Von deren Schwangerschaft wissen, auch wenn sie ihm das noch gar nicht gesagt hat? Das geht doch nicht, denkt wohl der normale User. Doch hier bewahrheitet sich einmal wieder in der Digital-Ära die alte Toyota-Weisheit: Nichts ist unmöglich.
  • Tweetmap: So viele Tweets wurden am 4. Mai 2016 in München abgegeben - alle mit Geodaten versehen
    Quelle:
    Screenshot Tweetmap.inosoft.de
Möglich machen die Transparenz in diesem Fall Metadaten. Neben dem eigentlichen Inhalt werden bei jedem Telefonat, jeder E-Mail oder WhatsApp-Nachricht weitere Informationen übertragen. Diese Daten über Daten oder "Informationen über Inhalte, nicht aber die eigentlichen Inhalte", wie die NSA sie nennt, übermitteln Absender und Empfänger einer Kommunikation. Gesprächsdauer und Standorte der Teilnehmer inklusive.
Und so lassen sich entweder in der reinen Analyse der Metadaten oder in der Kombination mit anderen Internet-Diensten zahlreiche Details über User herausfinden. Wie einfach das geht, hat das Software-Unternehmen Inosoft mit seiner "Tweetmap" jetzt bewiesen.
"Wir wollten uns das Thema Metadaten einfach in einer Feldstudie aus verschiedenen Blickwinkeln anschauen", erklärt Inosoft-Vorstand Thomas Winzer die Motivation für das Projekt. Herausgekommen ist eine interaktive Karte, die Geodaten von Twitter mit Google Maps, Earth und Street View kombiniert. Entwickelt wurde die Tweetmap ohne Mithilfe der Unternehmen, nur mit den öffentlich zur Verfügung stehenden APIs.
Neben den Tweets, die ja immer öffentlich einsehbar sind, gelangen auch die Positionsdaten ins Netz, sobald der Twitter-User sich lokalisieren lässt oder auf automatisches Geotagging umstellt. Über den Browser, der mit der IP-Adresse ein Gebiet eingrenzt, sind diese Daten relativ ungenau. Mit iOS- und Android-Apps funktioniert das Orten des Users via GPS allerdings bis auf wenige Meter.

Wissen, wo ein User wohnt und wann er zuhause ist

Kombiniert man diese Metadaten, also nur Zeit und Ort des abgegebenen Tweets, von Twitter jetzt zum Beispiel mit Google Maps, lässt sich herausfinden, wo der Twitterer wohnt, welche Bars er gerne besucht oder wann er sich auf einer Reise befindet. Aber zum Beispiel auch, wie das Haus seiner Oma aussieht, auch wenn er noch nie ein Bild von diesem getwittert hat. Für dieses Szenario genügt es, wenn er zuerst twittert, dass er sich heute auf Omas Apfelkuchen freut, dann etwas von unterwegs, entlang einer größeren Straße oder einer Bahnlinie zum Beispiel, und dann ein "Angekommen". So lässt sich mit Street View sogar sehen, wie das Haus der Oma aussieht. Kombiniert man diese Erkenntnisse mit Tweets anderer User, kann man außerdem mit großer Wahrscheinlichkeit jede Menge persönlicher Details über sein Netzwerk und Privatleben sagen.
Warum sollte sich allerdings irgendjemand diese Mühe geben, fragt jetzt vielleicht der naive Twitter-Nutzer. "Alle Informationen sind hilfreich, um den User digital erkennbar zu machen", sagt Winzer. Für Unternehmen wie Facebook, Google und Co sind Metadaten sehr interessant. Auch ein Grund, wieso WhatsApp sich zwar als Privatsphäre-Retter gibt, indem Kommunikation standardmäßig verschlüsselt wird, Metadaten aber weiterhin überträgt.
Denn wer, wann, wie lange, von wo aus und wie oft mit wem kommuniziert, ist oft aussagekräftiger als was eigentlich gesagt wird. Und vor allem: "Metadaten sind standardisiert. Sie sind viel vergleichbarer als Kommunikationsdaten", bekräftigt Winzer. Sie sind einfach zu sammeln und zu analysieren - mathematisch, clean, präzise.
2. Teil: „Metadaten sind "Stellvertreter für Content"“

Metadaten sind "Stellvertreter für Content"

Ein anderes Beispiel, was mit Metadaten getrieben werden kann, zeigt Edward Felten, IT-Professor in Princeton: Wenn eine junge Frau zuerst ihren Frauenarzt anruft, dann sofort ihre Mutter, anschließend einen Mann, mit dem sie in den letzten Monaten oft auch spät abends gesprochen hat und ein Familienberatungszentrum, das auch Abtreibungen anbietet, braucht man nicht mehr den Inhalt der einzelnen Gespräche kennen, um zu wissen was los ist.
Felten bezeichnet Metadaten als "Stellvertreter für Content". Denn es geht oft gar nicht darum, einen Sachverhalt mit hundertprozentiger Sicherheit zu kennen, sondern ihn nur mit einer hohen Wahrscheinlichkeit auf Basis des Kontexts zu bestätigen. "Man kann mit Metadaten so viel herausfinden. Zum Beispiel das Netzwerk einer Person, deren Religion, politische Einstellung, den Alltagsablauf. Metadaten lassen sich in millionenfacher Ausführung sammeln und auswerten."
Auch ein Grund, wieso die NSA hauptsächlich Metadaten sammelt. Und das für Geheimdienste und Internet-Unternehmen "Gute" an diesen Daten: User können sie kaum verschlüsseln. Denn die meisten Dienste schicken diese Daten automatisch mit und speichern sie. Teilweise sind sie durch Gesetze dazu verpflichtet. Mit dem Verschlüsselungs-Netzwerk Tor kann man das zwar mit Einschränkungen umgehen, aber reibungslos und in jedem Fall funktioniert die Verschlüsselung auch über das Onion-Routing nicht.

Anbieter könnten auch auf Metadaten verzichten

Und dabei ist die Übertragung von Metadaten nicht nötig, um zu kommunizieren. "Anbieter könnten die Metadaten ebenfalls verschlüsseln oder gar keine Daten mitschicken", so Winzer. "Ich brauche keine Geodaten, um jemanden zu erreichen. Telefonnummer oder E-Mail-Adresse reicht. Und die Verbindungen müssen auch nicht gespeichert und analysiert werden, um einen Verbindungsaufbau zu ermöglichen."
Aktuell ist Winzer kein Unternehmen bekannt, dass die öffentlich zur Verfügung stehenden Metadaten kombiniert, analysiert und zu Geld macht. "Ich kann mir das aber gut vorstellen. Es scheint durchaus attraktiv, die generierten Informationen zu Geld zu machen." Und besonders aufwendig ist das auch nicht: Die Tweetmap habe sein Team an einem Wochenende programmiert. Jeder, der halbwegs gut coden könne, wäre dazu in der Lage, so Winzer. Inosoft habe das allerdings nicht gemacht, um die so gewonnen Daten zu Geld zu machen. Sondern um zu zeigen, was mit den öffentlich zur Verfügung stehenden Informationen alles gemacht werden kann. Und um zu sensibilisieren. Denn oft ist Usern überhaupt nicht bewusst, welche Spuren sie im Netz hinterlassen. Und was man aus dieser Fährte alles herauslesen kann.

mehr zum Thema