Die 3 wichtigsten Schritte für Data Anlaytics

In unserem Beitrag erkären wir, was es mit dem Berg an Legosteinen und Data Analytics auf sich hat.

Die 3 wichtigsten Schritte für Data Analytics

  1. Welche Art von Daten liegen vor?
    Um Daten analysieren zu können ist eine Vorverarbeitung und Bereinigung eine vorgelagerte, wichtige Aufgabe. Nur vollständige Datensätze können aus einem Pool an Daten, dem sogenannten Data Lake, zum Trainieren von KI Modellen verwendet werden. Dabei unterscheidet man zwischen strukturierten und unstrukturierten Daten. In beiden Fällen gilt es, unnötige Werte zu bereinigen bzw. fehlende Werte zu ergänzen, also das relevante Set von Daten auf eine gemeinsame Basis (z.B. Zeiteinheit) zu normalisieren, damit die Verwendung dieser Daten für die Modellierung nicht zu falschen Ergebnissen führt.
  2. Relevante Daten finden
    Die relevanten Daten aus dem Data Lake kann man sich wie die bunten Farben in einem Berg aus Legosteinen vorstellen. Am Anfang lässt sich nichts aus diesem Haufen herauslesen. Durch Sortieren und Arrangieren erkennt man, welche Steine bereits zusammenstecken und welche Steine und Farben unabhängig voneinander verbaut werden können. Das sind dann die interessanten, weil relevanten Farben bzw Daten.
  3. Muster erkennen
    Mit Hilfe von Deep Learning, Machine Learning oder AI/KI lassen sich nun aus den vielen Informationen Muster, sogenannte Pattern, erkennen. Diese Muster erzählen uns im besten Fall eine Geschichte, mit Hilfe derer man sehr schnell erkennen kann, ob alles im grünen Bereich ist oder nicht. Außerdem sind diese Muster Grundlage für weiteres Lernen und den Blick in die Zukunft.

Daten von hoher Qualität sind eine wichtige Voraussetzung für die Brauchbarkeit/Güte von Analysen oder gar Vorhersagemodellen.

Ich will mehr erfahren, bitte nehmen Sie Kontakt mit mir auf!


    Anhang (PDF max. 10 MB)