Entdecken der Möglichkeiten generativer KI

Lernziele

Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:

Beschreiben der Qualitäten generativer KI-Modelle im Vergleich zu anderen Modellen
Definieren wichtiger Begriffe im Zusammenhang mit KI-Sprachmodellen
Beschreiben der Fähigkeiten generativer KI, die Sprachmodelle nutzt

Künstliche Intelligenz im Rampenlicht

Es ist Ihnen bestimmt schon aufgefallen, dass in letzter Zeit viel über künstliche Intelligenz (KI) diskutiert wird – es ist fast überwältigend. Aber woher kommt das große Interesse? KI ist nicht wirklich neu; viele Unternehmen und Institutionen nutzen KI schon seit Jahren in irgendeiner Form. Dass KI plötzlich in aller Munde ist, wurde wohl durch etwas namens ChatGPT ausgelöst, einen KI-gestützten Chatbot, der etwas kann, was andere nicht können.

ChatGPT kann auf in natürlicher Sprache gestellte Fragen oder Aufgabestellungen reagieren, und die Antworten wirken, als seien sie von einem Menschen geschrieben worden. Und da ChatGPT für die Öffentlichkeit freigegeben wurde, konnten die Menschen aus erster Hand erleben, wie es ist, ein Gespräch mit einem Computer zu führen. Es war überraschend. Es war unheimlich. Es war bewegend. Und das erregt natürlich Aufmerksamkeit.

Ein lächelnder Roboter, der auf einem Stuhl an einem Schreibtisch sitzt. Auf dem Schreibtisch steht ein Laptop. Gezeichnet im Stil einer 2D-Vektorgrafik.

[In DreamStudio auf stability.ai mit KI generierte Bilder. Die Aufgabestellung lautete: "Ein lächelnder Roboter, der auf einem Stuhl an einem Schreibtisch sitzt. Auf dem Schreibtisch steht ein Laptop. Gezeichnet im Stil einer 2D-Vektorgrafik."]

Eine KI, die ein natürliches, menschenähnliches Gespräch führen kann, unterscheidet sich deutlich von dem, was wir in der Vergangenheit an KI gesehen haben. Wie Sie im Badge Künstliche Intelligenz – Grundlagen lernen, gibt es eine Menge spezifischer Aufgaben, für die KI-Modelle trainiert werden. Ein KI-Modell kann zum Beispiel darauf trainiert werden, anhand von Marktdaten den optimalen Verkaufspreis für ein Haus mit drei Schlafzimmern zu prognostizieren. Das ist zwar beeindruckend, aber dieses Modell liefert "nur" eine Zahl. Im Gegensatz dazu können einige KI-Modelle eine unglaubliche Vielfalt von Texten, Bildern und Klängen produzieren, die wir noch nie zuvor gelesen, gesehen oder gehört haben. Diese Art von KI wird als generative KI bezeichnet. Sie birgt ein enormes Potenzial für Veränderungen, und zwar sowohl in der Arbeitswelt als auch in anderen Lebensbereichen.

In diesem Badge erfahren Sie, für welche Aufgaben generative KI-Modelle trainiert werden und welche Technologie hinter dem Training steckt. In diesem Badge geht es zudem darum, wie sich Unternehmen um Spezialgebiete im Ökosystem der generativen KI scharen. Abschließend diskutieren wir einige der Bedenken, die Unternehmen gegenüber generativer KI haben.

Möglichkeiten von Sprachmodellen

Generative KI ist gerade ein brandaktuelles, scheinbar brandneues Thema. In Wirklichkeit trainieren Wissenschaftler generative KI-Modelle aber schon seit Jahrzehnten. Einige haben in den letzten Jahren sogar Schlagzeilen gemacht. Vielleicht erinnern Sie sich an Berichte aus dem Jahr 2018, als ein Unternehmen namens Nvidia ein KI-Modell vorstellte, das zufällige fotorealistische Bilder von menschlichen Gesichtern erzeugen konnte. Die Bilder waren erstaunlich überzeugend. Und obwohl sie nicht perfekt waren, waren sie definitiv in aller Munde. Die generative KI rückte damit langsam ins öffentliche Bewusstsein.

Während Wissenschaftler an KI arbeiteten, die bestimmte Arten von Bildern erzeugen konnte, konzentrierten sich andere auf KI für Sprache. Sie trainierten KI-Modelle für alle möglichen Aufgaben, die mit der Interpretation von Text zu tun hatten. Eine solche Aufgabe wäre beispielsweise, dass Sie die Rezensionen eines Ihrer Produkte als positiv, negativ oder neutral einordnen möchten. Dies erfordert ein Verständnis dafür, wie Wörter im alltäglichen Gebrauch kombiniert werden, und ist damit ein gutes Beispiel für das, was Experten als Verarbeitung natürlicher Sprache oder Natural Language Processing (NLP) bezeichnen. Da es so viele Möglichkeiten gibt, Sprache zu "verarbeiten", beschreibt NLP eine weit gefasste Kategorie von KI. (Weitere Informationen zu NLP finden Sie unter Verarbeitung natürlicher Sprache – Grundlagen.)

Einige KIs für NLP werden anhand riesiger Datenmengen trainiert, das heißt in diesem Fall Texte, die von echten Menschen geschrieben wurden. Das Internet mit seinen Milliarden von Webseiten ist eine hervorragende Quelle für solche Beispieldaten. Da diese KI-Modelle mit so großen Datenmengen trainiert werden, werden sie als große Sprachmodelle (engl. Large Language Models, kurz LLMs) bezeichnet. LLMs erfassen in unglaublicher Detailgenauigkeit die Sprachregeln, für deren Erlernen Menschen Jahre brauchen. Diese LLMs ermöglichen es, einige unglaublich anspruchsvolle Aufgaben im Zusammenhang mit Sprache durchzuführen.

Zusammenfassung

Wenn Sie einen Satz vorgelegt bekommen und verstehen, wie alle Wörter zusammenwirken, um eine Aussage auszudrücken, dann können Sie den Satz wahrscheinlich so neu formulieren, dass er dieselbe Idee transportiert. Da KI-Modelle Syntaxregeln kennen und gelernt haben, welche Wörter gegen andere ausgetauscht werden können, können auch sie eine Neuformulierung erstellen. Die Zusammenfassung eines ganzen Absatzes in einem oder zwei Sätzen ist nur eine andere Art der Neuformulierung. Diese Art von KI-gestützter Zusammenfassung kann in der Praxis sehr hilfreich sein. Man kann damit Besprechungsnotizen aus stundenlangen Aufzeichnungen erstellen. Oder eine Kurzfassung (Abstract) für eine wissenschaftliche Arbeit schreiben. Außerdem ist diese Art von KI das ultimative Tool zum Erstellen von Kurzpräsentationen.

Übersetzung:

LLMs sind wie eine Sammlung von Regeln dafür, wie eine Sprache Wörter zu Aussagen strukturiert. Jede Sprache hat ihre eigenen Regeln. Im Englischen setzen wir normalerweise Adjektive vor Substantive, im Französischen ist das dagegen normalerweise umgekehrt. KI-Übersetzer werden auf beide Regelwerke trainiert. Wenn es also Zeit für die Neuformulierung eines Satzes ist, kann die KI einen zweiten Regelsatz verwenden, um dieselbe Aussage auszudrücken. Und, voilà, schon haben Sie eine großartige Übersetzung. Programmiersprachen sind ebenfalls Sprachen. Sie haben ihr eigenes Regelwerk, so dass die KI einen losen Satz von Anweisungen in echten Code übersetzen kann. Ein persönliches Programmiergerät im Taschenformat kann vielen Menschen eine Menge Türen öffnen.

Fehlerkorrektur:

Selbst den erfahrensten Verfassern unterlaufen gelegentlich grammatikalische oder orthographische Fehler. Die KI erkennt (und korrigiert manchmal automatisch) alles, was nicht stimmt. Das Korrigieren von Fehlern ist auch wichtig, wenn man jemandem beim Sprechen zuhört. Vielleicht entgeht einem das eine oder andere Wort, weil man sich in einer lauten Umgebung befindet, kann den fehlenden Text dann aber aus dem Kontext erschließen. KI kann dies ebenfalls, wodurch Aufgaben, bei denen Sprache in Text umzuwandeln ist (Prinzip "Sprache zu Text"), wie etwa bei Untertiteln, noch präziser ausgeführt werden.

Beantworten von Fragen:

Dies ist der Aufgabenbereich, der die generative KI ins Rampenlicht rückte. KIs wie ChatGPT sind in der Lage, die Intention einer Frage oder Anfrage zu interpretieren Die KI kann dann auf der Grundlage der Anfrage eine große Menge an Text erzeugen. Wenn Sie die KI zum Beispiel bitten, die drei bekanntesten Werke von William Shakespeare in jeweils nur einem Satz zusammenzufassen, erhalten Sie folgende Antwort:

"Romeo und Julia" – Die tragische Geschichte zweier junger Liebenden aus verfeindeten Familien, deren Liebe schließlich zu ihrem vorzeitigen Tod führt.

"Hamlet" – Die Geschichte eines Prinzen, der vom Geist seines Vaters heimgesucht wird und sich mit Rache und den existenziellen Fragen von Leben und Tod auseinandersetzt.

"Macbeth" – Ein erschütternde Tragödie über Ehrgeiz und moralischen Verfall, in dem ein Adliger, getrieben vom Ehrgeiz seiner Frau, mehrere Morde begeht, um den Thron zu erobern.

Sie könnten das Gespräch danach fortsetzen, indem Sie nach weiteren Informationen über Hamlet fragen, als ob Sie sich mit Ihrem Deutschlehrer unterhalten würden. Diese Art der Interaktion ist ein großartiges Beispiel dafür, wie man mit einer einfachen Anfrage bedarfsgerecht Informationen erhält.

Textbasierte Bildgenerierung:

LLMs können in Verbindung mit Bildgenerierungsmodellen verwendet werden. Sie können dann das gewünschte Bild beschreiben, und die KI versucht, es für Sie zu erstellen. Hier ist ein Beispiel für eine Anfrage nach "einer 2D-Linienzeichnung von Julia, die am Fenster eines alten Schlosses steht". Da es sehr viele Beschreibungen und Bilder von Romeo und Julia im Internet gibt, brauchte der KI-Generator keine weiteren Informationen, um ein geeignetes Bild zu erstellen.

Eine 2D-Linienzeichnung von Julia, die am Fenster eines alten Schlosses steht.

[In DreamStudio auf stability.ai mit KI generierte Bilder. Die Aufgabenstellung lautete "Eine 2D-Linienzeichnung von Julia, die am Fenster eines alten Schlosses steht."]

Bei der textbasierten Bildgenerierung können einige KI-Modelle neue Inhalte in bestehende Bilder einfügen. So können Sie beispielsweise die Ränder eines Bildes vergrößern und die KI anhand des Kontexts des Originalbildes die wahrscheinliche Ergänzung zeichnen lassen.

Text zu Sprache:

So wie die KI eine Abfolge von Wörtern in ein Bild umwandeln kann, gibt es auch KI-Modelle, die Text in Sprache umwandeln können. Einige Modelle können Hörproben einer sprechenden Person analysieren. Die KI lernt die einzigartigen Sprachmuster dieser Person und kann sie bei der Umwandlung von Text in neue Audiodaten reproduzieren. Für den zufälligen Zuhörer ist es schwer, den Unterschied zu erkennen.

Dies sind nur einige Beispiele dafür, wie LLMs zur Erstellung neuer Texte, Bilder und Klänge eingesetzt werden. Nahezu jede Aufgabe, die ein Verständnis der Funktionsweise von Sprache erfordert, kann durch KI verbessert werden. KI ist ein unglaublich leistungsfähiges Werkzeug, das Sie sowohl bei der Arbeit als auch in der Freizeit einsetzen können.

Beeindruckende Vorhersagen

Sie haben jetzt eine Vorstellung davon, wozu generative KI in der Lage ist, und deshalb möchten wir an diesem Punkt eines ganz deutlich machen: Der Text, den eine generative KI generiert, ist eigentlich nur eine andere Form der Vorhersage. Doch statt den Wert eines Hauses vorherzusagen, sagt die KI hier eine Abfolge von Wörtern voraus, die für den Leser wahrscheinlich eine Bedeutung und Relevanz haben.

Die Vorhersagen sind zwar beeindruckend, doch sie sind kein Zeichen dafür, dass der Computer "denkt". Er hat weder eine Meinung zu dem Thema, nach dem Sie fragen, noch hat er eigene Absichten oder Wünsche. Wenn es so klingt, als hätte er eine Meinung, dann deshalb, weil er so gut wie möglich vorhersagt, was Sie als Antwort erwarten. Wenn Sie zum Beispiel jemanden fragen: "Möchten Sie lieber Kaffee oder Tee?", wird eine bestimmte Antwort erwartet. Ein gut trainiertes Modell kann eine Antwort vorhersagen, auch wenn es keinen Sinn macht, dass ein Computer ein bestimmtes Getränk möchte.

In der nächsten Einheit lernen Sie einige der Technologien kennen, die generative KI möglich machen.

Geschätzte Zeit

Themen

Benötigen Sie Hilfe?

Einstein – Ressourcen