Der Begriff bezeichnet in jedem Fall große Datenmengen. Dabei werden sie durch Größe der Datenmenge, Schnelllebigkeit – und dadurch nutzerbedingter Änderbarkeit – Komplexität und eine schwache Strukturierung (im Sinne einer eindeutigen Hierarchie und Kausalität zwischen einzelnen Proben der Datenmenge) definiert. Der Begriff wird allerdings kontextabhängig erweitert und umfasst moderne Technologien am Arbeitsmarkt genauso wie die Entwicklungen im Bereich des Smart Homes. Somit werden die Technologien, die zur Datenerhebung genutzt werden und die erhobenen Daten zu diesem Begriff zusammen gefasst. In der Analyse spielen hingegen vor allem die rohen Daten – also rein digitales Material – eine Rolle. Im Deutschen spricht man von
Big Data – Massendaten.
Diese Daten bergen ein erhebliches Potenzial. Schon dadurch bedingt, dass sich die verfügbare und erzeugte Datenmenge circa alle zwei Jahre verdoppelt, ergibt sich, dass durch Auswertungen derselben beispielsweise interessante Möglichkeiten für Unternehmen entstehen, ihre Kunden besser zu verstehen und ihre internen Prozesse dahingehend zu optimieren.
Dies gilt für alle Unternehmen, die einen nennenswerten Kundenverkehr aufweisen, also zum Beispiel für Betreiber eines öffentlichen Nahverkehrssystems, für sämtliche Händler, Reisebüros, die Gastronomie und viele mehr. Auch die Wissenschaft profitiert nennenswert von der Tatsache, dass die Digitalisierung Inhalte verfügbar macht. So ergeben sich Statistiken, Quellen und natürlich Sammlungen wissenschaftlicher Erkenntnisse.
Wie werden Daten erfasst? Und wie werden sie zur Verwendung strukturiert?
Daten lassen sich über verschiedenste Kanäle erfassen. Besonders praktisch sind Nutzerdaten angelegt: Die Onlinegewohnheiten eines Menschen werden ohnehin von den meisten Websites festgehalten. Es ergeben sich hieraus Nutzerverhalten. Auch Ortungssysteme am Smartphone, im Auto oder Kameras im öffentlichen Raum liefern Informationen, die die Bewegung von Individuen und Gruppen erfassen.
Ebenso wird Big Data durch das Verhalten in sozialen Netzwerken gespeist. Für den Markt sind hier vor allem Präferenzen des Menschen von Interesse. Hier kann auf Einzelaspekte hin eingegangen werden, oder aber auch auf Kohorten – also Zielgruppen, die durch eine Menge x an gemeinsamen Merkmalen definiert werden – zurückgegriffen werden. Durch eine Analyse der Daten lassen sich Korrelationen finden, die Rückschlüsse auf ein potenzielles Konsumverhalten oder Vermeidungsverhalten zulassen können. Neben der Datenerfassung, die Menschen betrifft, spielt auch die Erfassung von objektiv messbaren Phänomenen eine Rolle. Beispiele wären hier beispielsweise der Stromverbrauch beliebiger Prozesse, Wetterdaten, Informationen zur Verspätung von Verkehrsmitteln usw. Es lassen sich grundsätzliche alle Daten nutzen, die in irgendeinem kausalen Zusammenhang mit den beobachteten Prozessen stehen.
Aus der großen Menge an Daten ergibt sich rein logistisch bereits ein Problem: Es sind in vielen Fällen solch große Mengen, dass ein Speichern aller Daten unwirtschaftlich wäre. Auch herrscht oftmals Uneinigkeit darüber, welche Daten relevant sind. Ebenso klafft eine Lücke zwischen personenbezogenen Daten (in Form eines Profils) und allgemein erhobenen Daten, die – getrennt nach Gesichtspunkten – nicht mehr in Profilen zusammenliegen.
Im ersten Fall ergeben sich interessante Analysemöglichkeiten im Bezug auf die einzelne Person. Im zweiten Fall ergeben sich vor allem abstrakte Sammlungen von statistischen Verteilungen. Diese können genutzt werden, um mehrheitsorientiert zu handeln oder zumindest Quellen der Ineffizienz oder Unzufriedenheit zu beseitigen. Sie ermöglichen es aber kaum, die Zusammenhänge zwischen Entscheidungen und Vorlieben von Menschen nachzuzeichnen.
Welche Daten erhoben werden sollen, ist eine relevante Frage, wenn es um die spätere Auswertung gehen soll. Während bei objektiv messbaren Prozessen schlicht alle erforderlichen Daten erhoben und verwendet werden können, sind personenbezogene Daten komplizierter. Außerdem besteht immer die Gefahr mangelnder Repräsentativität, da persönlich preisgegebene Daten immer selektiert sind. Faktoren sind hier die Bereitschaft des Nutzers, Daten zu teilen, die Form der Erhebung und die Quantifizierbarkeit von abstrakten (Denk-)Prozessen.
Gleichsam steht der – verkürzt gesprochen – ausführlichen Durchleuchtung von Menschen der Datenschutz gegenüber. Begrenzt werden alle Maßnahmen der Datenerfassung durch das Gesetz. Allerdings verhält es sich hier so, dass die technischen Möglichkeiten, durch das Gesetz vorgeschriebene Maßnahmen bei der Datenerfassung einzuhalten (zum Beispiel Anonymisierung und die Löschung von Daten) rückgängig zu machen, derart sind, dass das Aushebeln des Datenschutzes theoretisch nicht besonders herausfordernd ist. Der Nutzer ist in der Verantwortung, nur solche Daten preiszugeben, die er für unbedenklich hält. Die Stelle, die die Daten erhebt, ist in der Verantwortung, diese vor dem Zugriff Dritter zu schützen und verantwortungsvoll zu nutzen.
Welche Macht hat Big Data?
Erhobene Daten bergen immer das Potenzial, auf Ereignisse zu reagieren. Bei objektiv messbaren Prozessen ohne Beteiligung der menschlichen Willkürlichkeit ist dies besonders einfach. Die richtigen Schrauben müssen nur eingestellt werden, so dass Prozesse effizienter werden.
Hier sind nicht nur die eigenen Daten wertvoll, sondern auch jene, die aus vergleichbaren Prozessen gewonnen wurden. So lassen sich Kenntnisse vernetzen und gemeinschaftlich anwenden. Das anschließende Einspeisen von Daten nach einer erfolgreichen Steigerung der Produktivität, einer Problemlösung usw. ermöglicht es allen vernetzten Teilnehmern, nachhaltig von neuen Entwicklungen und Techniken zu profitieren. Daten, die aus Nutzergewohnheiten gewonnen werden, haben eine wirtschaftliche Bedeutsamkeit erlangt. Im Bezug auf den Konsum lassen sich Vorhersagen treffen, die Kaufempfehlungen, das Einblenden bestimmter Werbung und vieles mehr beinhalten. Sogar das gezielte Aufstellen von Plakatwerbung lässt sich durch Bewegungsprofilanalysen verbessern. Denn Lauf- und Blickrichtungen im innerstädtischen Individualverkehr geben wertvolle Hinweise auf häufig (beiläufig) betrachtete Stellen. Selbstverständlich lässt sich auch das Verhältnis zwischen Unternehmen und Menschen optimieren. Erhobene Daten lassen nicht nur Rückschlüsse auf die Zufriedenheit, mögliche Fehlerquellen, optimale Platzierung von Waren oder beliebte Produkte zu. In Kombination mit Daten von Finanzdienstleistern, ergeben sich auch wirtschaftliche Profile, die Kunden und Geschäftspartner umfassen.
Hier sind die Möglichkeiten noch lange nicht erschöpft. Da sich aus Datensätzen vieles herauslesen lässt, muss allerdings eine Klarheit darüber herrschen, welche Daten relevant sind. Zudem entwickelt sich der Markt; weg von stationären Händlern und hin zum individuellen Shopping im Onlinebereich. Zudem werden klassische Kanäle für Werbemaßnahmen – also das Fernsehen und Radio – immer weniger genutzt. Die sinnvolle Maßnahme zum Erhalt von Präsenz ist also individuell zugeschnittene Werbung und das Eingehen auf die Wünsche von Menschen.
Big Data bietet die Chance, weltweite Kenntnisse zu verknüpfen, Prozesse zu optimieren und auf Kundenwünsche besser reagieren zu können. Die große Menge verfügbarer Daten stellt die Menschen weltweit allerdings vor die Herausforderung, diese Daten auch richtig anzuwenden. Das bloße Speichern von (personenbezogenen) Massendaten verbietet sich rechtlich und wirtschaftlich. Die gezielte Analyse muss also im Vordergrund stehen. Fest steht jedoch, dass Daten das weltweite Wissen voranbringen, große Prozesse besser verständlich machen können und im Bereich des Marktes unumgänglich sind. Denn in Zeiten der individuellen Erlebniswelten in einer sich stetig mehr vernetzenden und informierenden Welt, ist das schnelle Übermitteln und Abrufen von Informationen umso bedeutender.