Gängige Anwendungsfälle für die Datenanalyse
Lernziele
Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Erklären, warum die Datenanalyse in modernen Unternehmen relevant ist
- Erläutern, wie Datenanalyse-Tools in gängigen Szenarien verwendet werden
Nutzen der Datenanalyse für eine komplexe Welt
Was haben Gaming, Handel und soziale Medien gemeinsam? Jede dieser Branchen produziert eine große Menge an Daten, die Unternehmen zur Verbesserung ihrer Services sowie zur Erkennung und Behebung von Problemen nutzen. Im folgenden Video behandelt Raf die gängigen Branchen und Anwendungsfälle, in denen Datenanalyse im Alltag vorkommt.
Sprechen wir hier von 100 Datenzeilen? Oder von 1000? In manchen Fällen können es Hunderttausende sein – oder sogar Millionen! Wie kann man alle diese Daten nutzen?
Im Quiz am Ende dieser Einheit werden Fragen zum Inhalt des Videos gestellt. Schauen Sie es sich unbedingt an, damit Sie die Informationen erhalten, die Sie zur Beantwortung der Fragen am Ende dieser Lektion benötigen.
Abschrift anzeigen
[Raf] Sie kennen jetzt den Unterschied zwischen den verschiedenen Arten von Datenanalysen. Daher möchte ich Ihnen nun einige Beispiele dazu vorstellen, wie Datenanalyse sehr wahrscheinlich schon jetzt Teil Ihres Lebens ist, sowohl als Verbraucher als auch im Berufsleben. Die Datenanalyse ist heute in vielen Branchen anzutreffen. Beispiele sind Gaming, soziale Medien, E-Commerce, Online-Shops, Website-Statistiken, auch Clickstream-Analyse genannt, Empfehlungsmaschinen, Internet of Things oder IoT, Protokollverarbeitung und viele mehr.
Ich möchte Ihnen einige Beispiele dafür geben, wo Datenanalyse in einigen dieser Szenarien nützlich ist, damit Sie verstehen, welchen Zweck die Datenanalyse in diesen Bereichen hat. Nehmen wir an, Sie spielen gerne Computerspiele, so wie ich. Und viele andere.
Wenn Sie also gerne Spiele spielen, auf dem Handy, dem Computer oder einer Spielekonsole, dann kennen Sie vielleicht das Kontrollkästchen, das Sie aktivieren sollen, bevor Sie zu spielen beginnen. Bei diesem Kontrollkästchen steht meist etwas Ähnliches wie "Anonyme Datenstatistiken für Spieleentwickler senden, um das Spielerlebnis zu verbessern". Damit erlauben Sie im Grunde das Sammeln von Informationen darüber, wie Sie das Spiel spielen, um eventuelle Abstürze, Designfehler und andere Daten zu erkennen. Es ist klar, dass in diesem Fall Daten aus dem wirklichen Leben, nämlich, dass Sie das Spiel spielen, in Informationen umgewandelt werden, die den Entwicklern helfen, mögliche Probleme auszuräumen und das Gaming-Erlebnis zu verbessern. Das ist genau der Grund, warum es die Datenanalyse gibt und sie für die moderne Welt so wichtig ist.
Sie fragen sich vielleicht: "Warum ist das heute wichtig? Ich spiele seit meiner Kindheit Spiele, und da gab es das alles nicht. Spiele wurden auf Kassetten verkauft. Die haben wir gekauft, um zu spielen. Fertig." Ganz gewiss. Doch Sie erinnern sich sicherlich auch daran, dass diese Spiele nicht so komplex waren wie die heutigen Spiele. Der Grund dafür ist folgender:
Datenanalyse hilft, Erkenntnisse zu gewinnen, und diese Erkenntnisse helfen, komplexe Probleme zu lösen. Ganz gleich, ob es sich um Spiele, Aktienmärkte, Immobiliendaten, Verkehrsdaten, Mode, Computersysteme oder Webserver- und Sicherheitsprotokolle handelt, die Datenanalyse hilft, Antworten auf komplexe Szenarien zu finden.
Da Speicherkapazität mit jedem Tag günstiger wird, sammeln Unternehmen oftmals Daten, für die sie aktuell noch keine Verwendung haben. Stellt sich jedoch morgen eine neue Frage, kann die Antwort in den Daten stecken, die zuvor gesammelt wurden.
Die Welt von heute ist viel komplexer als noch vor 10 Jahren. Die Hilfe von Computersystemen ist daher aus zwei Hauptgründen unverzichtbar: Skalierbarkeit und datengestützte Entscheidungsfindung. Ein weiterer wichtiger Bestandteil der Datenanalyse ist die Protokollanalyse. Hierauf möchte ich ausführlicher eingehen, da dies der Hauptschwerpunkt dieses Kurses sein wird, und zwar besonders im Hinblick auf Sicherheitsprotokolle.
Wenn wir Protokollanalyse sagen, meinen wir in der Regel die Informationen, die Computersysteme auf der Basis von Ereignissen generieren. Bei einem Ereignis kann es sich um eine HTTP-Anfrage an eine Webseite, Benutzerprotokolldaten, API-Aufrufe oder andere Anfragen handeln. API steht für Application Programming Interface und ist im Prinzip eine Programmierschnittstelle, die die Interaktionen zwischen mehreren Software-Vermittlern definiert.
Die API definiert, welche Art von Aufrufen oder Anfragen gemacht werden können, wie diese gemacht werden, die Datenformate, die verwendet werden sollen, die einzuhaltenden Konventionen usw. Und mit Blick auf die Datenanalyse, ist es gängige Praxis, all diese Aktivitäten irgendwo zu protokollieren.
Ein klassisches Beispiel für die Datenanalyse ist die Verwendung von Webserverprotokollen, um Erkenntnisse über die Besucher einer Website zu gewinnen. Angenommen, jede Anfrage an einen HTTP-Server wird in Dateien in einem Dateisystem protokolliert. Man nennt diese meist Zugriffsprotokolle. Wenn für jeden Besuch Ihrer Website eine neue Zeile im Zugriffsprotokoll hinzugefügt wird, kann man sagen, dass die Anzahl der Zeilen in diesem Protokoll der Anzahl der Anfragen entspricht, die der Webserver bedient hat.
Wenn Sie nur einen Server und eine kleine Website mit ein paar Besuchen pro Minute haben, können Sie einfache Tools wie einen Texteditor verwenden, um diese Dateien zu analysieren und die gesuchten Informationen zu extrahieren. Wenn Sie jedoch mehr tun möchten als nur Zeilen in der Protokolldatei zu zählen, dann ist die Verwendung eines Datenanalyse-Tools unerlässlich.
Wir empfehlen den Einsatz von Datenanalyse-Tools in allen Bereichen, doch wir benötigen professionelle Tools für große Datenmengen, wenn wir Protokolle aggregieren und visualisieren möchten. Stellen Sie sich vor, Sie haben zig Webserver, die Tausende Benutzeranfragen pro Sekunde verarbeiten. Sie können davon ausgehen, dass jede Protokolldatei auf jedem Server ziemlich schnell gefüllt wird. Sie müssen also all diese Daten irgendwo zentral verwalten.
Außerdem benötigen Sie vielleicht eine Möglichkeit, diese Daten in einem Liniendiagramm zu visualisieren, sodass Sie Zacken, auch Abweichungen oder Ausreißer genannt, leichter erkennen können. Die Datenanalyse ist heute auch für die Datensicherheit enorm wichtig. Wenn Sie über Systeme verfügen, die Sicherheitsprotokolle so erstellen, dass Sie schnell darauf zugreifen und Analysen extrahieren können, dann sind Sie klar im Vorteil, wenn Sie feststellen müssen, wann eine Anfrage einging, von wem, ab wann, von wo und wie die Antwort des Systems auf diese Anfrage aussah.
Wenn Sie dann noch eins draufsetzen und eine prädiktive Analyse mit diesen Daten durchführen, können Sie einen Zustand erreichen, in dem fehlerhafte Anfragen an Computersysteme automatisch abgeblockt werden, bevor sie auftreten, oder eine selbstheilende Architektur schaffen, die beginnt, eine Failover-Umgebung aufzubauen, wenn die Leistung einer aktuellen Umgebung nachzulassen beginnt.
Dies kann mithilfe von Tools zur Infrastrukturautomatisierung in der Cloud erreicht werden. Es gibt einen AWS-Service namens AWS CloudTrail, der API-Aktivitäten für ein AWS-Konto aufzeichnet, und einen AWS-Service namens Amazon S3, der ein Speicher-Service ist. Diese beiden möchte ich kurz vorstellen.
Solche Daten speichert CloudTrail jedes Mal, wenn Sie oder andere sich über die AWS Management Console bei Ihrem AWS-Konto anmelden. Die Daten werden in Amazon S3 gespeichert und enthalten Informationen dazu, von wem die Anfrage stammt, von welcher IP-Adresse sie kam, was angefragt wurde, wie die Antwort auf die Anfrage lautet, und andere, nützliche Compliance-Informationen die bei Bedarf im Handumdrehen zu Compliance-Nachweisen werden. Dies macht CloudTrail zu einem Service, der Infrastruktur-Governance, operative Audits und Risikoaudits für Ihr AWS-Konto ermöglicht.
Wenn Sie dazu jedoch jedes Mal CloudTrail-Textdaten durchforsten müssen, kann sich dies als schwierig erweisen. Datenanalysekenntnisse sind sehr hilfreich, um die Möglichkeiten all dieser Compliance-Daten auszuschöpfen. Wenn Sie über Datenvisualisierungs-Tools für die von CloudTrail erzeugten Informationen verfügen, können Sie Sicherheits-Dashboards mit Grafiken und Warnungen zu ungewöhnlichen Aktivitäten erstellen. Wenn Sie plötzlich Protokolle mit Anmeldefehlern sehen, kann dies daran liegen, dass jemand versucht, sich bei Ihrem AWS-Konto anzumelden, oder, dass Sie das Kennwort geändert und vergessen haben.
Ich sage immer, dass Datensicherheitsanalysen nicht nur für Compliance-Berichte gut sind, sondern auch für die Fehlersuche. Wenn Sie dieses Konzept auf Firewall-Pakete, Netzwerkaktivitäten, Load Balancer- und Serverprotokolle und andere Infrastrukturthemen anwenden, können Sie Ausreißer leicht identifizieren und selbst zum Turbo-Problemlöser werden. Überlegen Sie aber immer, wofür Sie die Datenanalyse noch einsetzen könnten und, wie sie Ihnen hilft, tiefere Einblicke in die Vorgänge zu bekommen, ganz gleich, ob es sich um Sicherheit, Produktverbesserungen, besseres Kundenerlebnis oder andere Bereiche der Datenanalyse handelt.
Da die Möglichkeiten grenzenlos sind, werde ich im nächsten Video darüber sprechen, warum die Cloud der ideale Ort dafür ist, der Ihnen einige wichtige Vorteile bietet und Ihnen hilft, die Datenanalyse überall, jederzeit und für Jeden zu ermöglichen.
Haben Sie sich das Video angesehen?
Denken Sie daran: Im Quiz am Ende dieser Einheit werden Ihnen Fragen zum Inhalt des Videos gestellt. Falls Sie das Video noch nicht angesehen haben, sollten Sie das jetzt tun. Dann sind Sie auf die Quizfragen vorbereitet.