Was gibt es zu „Big Data“, das nicht schon „big-time-häufig“ gesagt, geschrieben, irgendwo kopiert und wieder niedergeschrieben wurde? Und damit Big Data erst möglich macht? Eine ganze Menge! Professor Viktor Mayer-Schönberger eröffnete den zweiten Tag der re:publica auf der großen Bühne mit diesem Thema. Nachfolgend fasse ich den Vortrag zusammen – mit Hilfe der ca. 75 Twitterer, die im Raum waren und zitiert, zusammengefasst und kommentiert haben. Wer sich mehr für die Thesen von Viktor Mayer-Schönberger interessiert, dem sei gleich hier sein Interview empfohlen und der Hinweis gestattet, dass man hier auch direkt sein aktuelles Buch gewinnen kann.
Highlight des heutigen Tages auf der #rp14: Viktor Mayer Schönberger. Freiheit und Vorhersage: über die ethischen Grenzen von Big Data.
— Sierralog (@Sierralog) 7. Mai 2014
Mir ging es ähnlich. Der Vortrag wurde direkt mit Stern versehen und unter den Favoriten in der App gespeichert bereits Wochen vor der re:publica. Nicht nur, weil ich bei SAS das Interesse an dem Thema sozusagen im Arbeitsvertrag stehen habe: Mayer-Schönberger ist jemand, der einen direkten Einfluss auf den Umgang mit Big Data hat. Auf globaler Ebene. Es ging mir also ein wenig um das Thema, aber eben auch um die Person, die dort auf der Bühne stand. Wenig verwunderlich, dass ich mit meinem Interesse nicht allein war:
Volle Hütte bei Mayer-Schönberger auf #stage1, der erklärt, warum #bigdata mehr ist als bloß Datenverarbeitung. #rp14 pic.twitter.com/WfLKOijD2D
— Jan Philipp Albrecht (@JanAlbrecht) 7. Mai 2014
Drei Punkte sind im Publikum besonders haften geblieben. Als da wären: die Entwicklung des Datenvolumens, der zeitliche Versatz von Sammeln und Auswerten sowie die Interpretation von Korrelationen. Dabei zeigt sich in dem Vortrag ein Muster: Es beginnt bei wenig kritischen Aussagen und wird zunehmend kritischer. Seine Empfehlungen zur Eingrenzung der negativen Aspekte wurden auch diskutiert. Diese hat er aber in dem Interview mit meinem Kollegen deutlich genauer erklärt. (hier noch mehr und mit - genau, wissen Sie schon - Gewinnspiel)
„Mehr Daten, bitte“
Zunächst einmal plätten die Zahlen, allein schon die bei Google. Die Agentur „We are social“ zitiert: „1 Petabyte: Soviel Daten wie in allen Büchern, Filmen und Co der Library of Congress erhalten sind. Mal 100.“
Pro Tag wohlgemerkt!
Dieser Status quo wurde in einer fast unglaublichen Geschwindigkeit erreicht, Patrick Löwenstein weist darauf hin, dass im Jahr 2000 noch rund 75% der Daten dieser Welt analog waren – jetzt ist es nur noch ein kleines Prozent. Nils Papendorf, Online Manager bei der Haspa, bringt das Fazit von Mayer-Schönberger dann auf einen Punkt:
Google und IBM wissen: Nicht der Algorithmus muss verbessert werden, sondern die Menge der analysierten Daten. Oops! #rp14
— NPapendorf (@NPapendorf) 7. Mai 2014
Und Nils war da nicht allein, u.a. Jolle, Sven Schneider und Lars M. Heitmüller übernehmen das Zitat. So weit ist das noch unkritisch – es passiert eben.
Thema Unschärfe
Wie Mayer-Schönberger bereits schon in unserem Interview sagte, (das mit dem Gewinnspiel, hatte ich das schon erwähnt?) kann oft zum Zeitpunkt der Erhebung gar nicht genau gesagt werden, für welchen Zweck diese Daten erhoben werden.
#bigdata funktioniert wie eine lichtfeldkamera: erst im nachhinein entscheiden, welcher aspekt scharf gestellt sein soll. #rp14
— koriander (@korian_der) 7. Mai 2014
Also wird einfach mal gemacht und danach erst scharf gestellt. Keine Information geht verloren, auch wenn zum Zeitpunkt des Sammelns noch nicht abzusehen ist, was damit eines Tages geschehen soll. Es entstehen immer größere Datensilos, Big Data Lagerstätten, die nicht miteinander verbunden sind.
Die Medaille hat für den sympathischen Wiener zwei Seiten: Einerseits mahnt er an, dass Daten für Auswertungen innerhalb der Unternehmen verwendet werden, die zum Zeitpunkt des Sammelns nicht vorgesehen waren. Auf der anderen Seite stehen die Daten nicht unternehmens- oder institutionsübergreifend zur Verfügung, was Forschung und Entwicklung in vielen Bereichen stark einschränkt (s. dazu seine Ausführungen im Interview über Forschung in der Pharmaindustrie).
Korrelation ist NICHT Kausalität
Kritisch wird es, wenn man das bisher Gesagte weiterdenkt und berücksichtigt, dass es durchaus möglich ist Aussagen über erst noch kommende Ereignisse zu treffen (Predictive Analytics).
Big Data-Auswertungen zeigen große Mengen an Korrelationen, aber erst einmal keine Kausalitäten: Feiner, aber wichtiger Unterscheid. #rp14
— Fabian Kern (@fabian_kern) 7. Mai 2014
Die Frage ist, wie geht man mit dem Wissen um, dass man aus der Auswertung der Daten erhält. Wenn jetzt eine Analyse nahe legt, dass eine Zielperson mit hoher Wahrscheinlichkeit eine Straftat begehen wird – welche Reaktion ist angemessen? Hängt die präventive Reaktion von der möglicherweise noch begehenden Straftat ab. Wann ist eine Gefährdungsansprache ok? Und wie ist es hiermit:
Würdet ihr es als Strafe empfinden, wenn eine Polizeistreife aufgrund von Vorhersage vor eurer Tür parkt bis Tatsituation eintritt? #rp14
— Uschi Fuchs (@YouFox) 7. Mai 2014
Das ist die wesentliche Aufgabe von Herrn Mayer-Schönberger – seine Vision und seine Empfehlung: Wir brauchen einen aktiven Dialog zum Umgang mit Daten und er stößt ihn mit seinem Vortrag an.
Mit diesem Beitrag kommen wir einem Wunsch nach, der auch im Sinne von SAS ist:
Toller Beitrag von @Viktor_MS auf der #Stage1 der #RP14 zur Ethik von #BigData. Wäre schön, wenn polit./ökon. Entscheider zuhören würden.
— Ole Wintermann (@olewin) 7. Mai 2014
Überzeugt hat Mayer-Schönberger, weil er das Thema sachlich, unterhaltsam und trotzdem ausgewogen darstellt. Die Kritik an Big-Data-Anwendungen bekommt ebenso Raum, wie die Chancen, die sich durch die Technologien ergeben. Er leistet einen Beitrag zur Diskussion und löst Lager auf. Diskurs statt Parolen – das wäre mein Fazit des Vortrags.
Noch ein #FF zum Schluss
Einige Blogger und Twitterer fand ich besonders interessant. Die Auswahl gibt nur meine persönliche Meinung wider und ist so getroffen, dass alle Positionen sich wiederfinden sollten. Zusätzlich zu den oben bereits zitierten gilt das für:
- Michael
- thg
- Dorothee Lüke
- Mathias Neumayr
- Dirk Steinmetz
- SimSullen.
- Christian Meurers
- Andrea Kamphuis
- Jens Albers
- Marco Wegleiter
- Michael Firnkes
- Astrid Christofori
- Ekoriander
- Konrad Lischka
- Der Strengst aka DNK
- Alfred Fuhr (der oft, gerne und gekonnt in Twitter und in unserem Blog kommentiert – vielen Dank dafür an dieser Stelle!)
Im Vorfeld der re:publica 2014 haben wir Viktor Mayer-Schönberger befragt zu seinem Vortrag, den Thesen und der Reaktion, die er erwartet. Gedacht ist das Interview als Gesprächsangebot rund um Big Data – ein Anliegen, das wir mit diesem Beitrag fortführen.