Big Data Stand: 07.12.2019

Die andauernde und immer weiter fortschreitende Digitalisierung unserer Welt hat zur Folge, dass man auch etliche Daten digitalisieren muss. Der Begriff Big Data bezeichnet das Zusammenführen von Daten aus unterschiedlichen Quellen, die wiederum für diverse Zwecke genutzt werden können.

Da die Datenmengen so groß und komplex sind, lassen sie sich nicht mehr mit klassischen Verarbeitungssystemen erfassen und in Gigabyte messen, sondern brauchen spezielle Speicherkapazitäten.

Als Big Data wird ein Datenbestand dann bezeichnet, wenn er die folgenden 3 Merkmale aufweisen kann:

  • Volume: die Datenmenge ist groß und nimmt stetig zu
  • Variety: eine große Vielfalt an Datentypen und -quellen
  • Velocity: die Daten werden in einer hohen Geschwindigkeit erzeugt und verarbeitet

Erst wenn diese Faktoren des 3V-Modells auf das Daten-Set zutreffen, kann dieses als Big Data bezeichnet werden.

 

ENTWICKLUNG UND TECHNISCHE VERARBEITUNG

Berechnungen haben ergeben, dass sich das Datenvolumen alle zwei Jahre verdoppelt. Grund dafür ist die Digitalisierung von Daten auf der ganzen Welt – Über die Erfassung von Webzugriffen bis hin zu Forschungsergebnissen aus der Wissenschaft.

Früher wurden die Datensätze noch manuell in Systeme eingepflegt, aber die Datenmengen sind irgendwann zu groß geworden. Heutzutage übernehmen Rechner jegliche Schritte zur Erfassung von Daten und vereinfachen dadurch das Anlegen und die Pflege der Daten.

Um große Datenmengen effizient verarbeiten zu können, braucht man spezielle Verarbeitungssysteme, die parallel auf unzähligen Servern oder Prozessoren gleichzeitig arbeiten kann. Die Systeme müssen außerdem große Datenmengen schnell importieren und abfragen können, mehrere Abfragen gleichzeitig arbeiten und verschiedene Informationstypen bearbeiten können.

 

WOFÜR WIRD BIG DATA VERWENDET?

Unternehmen nutzen Big Data, indem sie große Datensätze auszuwerten und analysieren, woraus sie Erkenntnisse für Marketingmaßnahmen generieren.

Von Big Data profitieren aber nicht nur Unternehmen, die durch das Analysieren von Daten einen enormen Wettbewerbsvorteil haben können. Auch in anderen Bereichen ist der Einsatz von Big Data sinnvoll:

 

 

  • Finanzsektor: Aufdecken von Missbrauch bei Transaktionen (Fraud Detection)
  • Energiesektor: Steuerung von Energieverbrauch
  • Medizin: Medizinische Diagnostik und Vorhersage von möglichen Epidemien
  • Marktforschung: Schnellere Erfassung und Reaktion auf Veränderungen
  • E-Commerce: Upselling und Cross-Selling in Echtzeit
  • SEO: Bessere Optimierung durch Webanalyse-Tools
  • Polizei und Geheimdienste: Schnellere Verbrechensbekämpfung und Prävention

 

 

NACHTEILE VON BIG DATA

Im Zusammenhang mit der Verarbeitung von Massendaten gibt es auch immer wieder massive Kritik – Gerade bei Themen wie der Vorratsdatenspeicherung oder dem Missbrauch von persönlichen Daten. Viele User befürchten, dass ihre Persönlichkeitsrechte verletzt werden können. Webseitenbetreiber müssen deshalb in ihren Datenschutzbestimmungen immer darauf hinweisen, dass Userdaten weiterverarbeitet werden können, sofern das Unternehmen mit Big Data arbeitet.

Ein weiteres Problem ist, dass die Verarbeitungssysteme die Daten nach technischen Aspekten bearbeiten – was wiederum heißt, dass die Daten nicht immer qualitativ hochwertig sind oder entsprechend ausgewertet werden können. Dementsprechend muss auch eine Big Data Analyse mit Bedacht durchgeführt werden. Dazu muss auch regelmäßig eine Datenpflege vorgenommen werden.