Optimieren Ihrer Agenten mithilfe einer Teststrategie in fünf Schritten

Lernziele

Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:

Erläutern, warum es wichtig ist, über eine Teststrategie zu verfügen, bevor mit dem Testen begonnen wird.
Beschreiben der aus fünf Schritten bestehenden Strategie zum Testen Ihrer Agenten.

Warum sollte man einer Teststrategie folgen?

Agententests sind die Grundlage für die Veröffentlichung von Agenten, die zuverlässig und vertrauenswürdig sind. Die Tools von Agentforce Studio bieten eine Vielzahl von Möglichkeiten, um sicherzustellen, dass Ihr Agent die Aufgaben verarbeitet, die Sie für ihn vorgesehen haben. Wie Sie in der letzten Lektion gelernt haben, kann es eine Herausforderung sein, die vielen Möglichkeiten gründlich zu testen, wie ein Benutzer mit einem Agenten interagieren kann. Angesichts der vielen Variablen ist es ratsam, vor Beginn eine Teststrategie festzulegen. In dieser Lektion lernen Sie, wie Sie Ihren Agenten testen, nachdem Sie ihn im Agentforce-Generator optimiert haben.

Eine Strategie zum Testen Ihrer Agenten in fünf Schritten

Die Test-Loop für KI-Agenten ist eine schrittweise Strategie, die Sie durch die Feinabstimmung Ihrer Agenten führt, damit sie für Ihre Benutzer bereit sind. Sie erstellen Testszenarien, wählen Auswertungskennzahlen aus und führen automatisierte Tests durch. Anschließend validieren Sie die Ergebnisse und nutzen das Feedback, um Teile Ihres Agenten weiter zu optimieren und dessen Genauigkeit und Leistung zu verbessern.

Die 5-Stufen-Strategie von Agentforce zum Testen von Agenten, die den folgenden Schrittbeschreibungen entspricht.

Schritt 1: Identifizieren von Testszenarien und Erstellen von Testdaten

Nachdem Sie verschiedene Benutzereingaben im Bereich "Preview" (Vorschau) manuell getestet und Ihren Agenten auf Grundlage dieser Antworten überarbeitet haben, können Sie Ihren Agenten in "Test Suites (Beta)" (Test-Suiten (Beta)) einem Batch-Test unterziehen. Der erste Schritt bei Batch-Tests besteht darin, die Arten von Eingaben festzulegen, die Sie testen möchten. Sie können eigene Testszenarien erstellen und hochladen, indem Sie sie in natürlicher Sprache verfassen, oder Sie können in "Test Suites (Beta)" (Test-Suiten (Beta)) auf "Create test suite" (Test-Suite erstellen) klicken, um mithilfe von KI Testfälle zu generieren, wobei die Metadaten Ihres Agenten und die Daten, auf die er zugreifen darf, verwendet werden. Unabhängig davon, ob Sie die Testszenarien selbst schreiben oder KI bitten, sie zu generieren, ist es nützlich zu wissen, was ein gutes Testszenario ausmacht. Deshalb sehen wir uns das jetzt an.

Als Sie Ihren Agenten geplant haben, haben Sie dessen Umfang und Fähigkeiten definiert. Unser Coral Cloud-Serviceagent umfasst beispielsweise diese Unteragenten und Aktionen, die einige der Aufgaben und Tätigkeiten definieren, die der Agent im Zusammenhang mit Erlebnissen ausführt.

Der Unteragent Experience Management (Erfahrungsverwaltung) bearbeitet Kundenanfragen im Zusammenhang mit der Buchung von Erlebnissen in Coral Cloud Resorts, einschließlich Reservierungen, Buchungsänderungen und Beantwortung von Fragen zu Erlebnisdetails.
Die Aktion Create Experience Session Booking (Erfahrungssitzungbuchung erstellen) verwendet einen Flow zum Erstellen einer neuen Erfahrungsbuchung für einen oder mehrere Gäste.

Um Ihnen bei der Erstellung guter Testszenarien zu helfen, überprüfen Sie im Agentforce Builder (Agentforce-Generator) die Unteragenten Ihres Agenten, einschließlich der Felder "Classification Description" (Klassifizierungsbeschreibung) und "Scope" (Umfang), die die Fähigkeiten und Parameter beschreiben, innerhalb derer Ihr Agent arbeiten sollte. Überprüfen Sie auch jede Anweisung, die die Arbeitsweise des Agenten regelt. Schreiben Sie als Nächstes eine Eingabe (oder generieren Sie sie in "Test Suites (Beta)" (Test-Suiten (Beta)), die auf der Grundlage dieser Details testet, um sicherzustellen, dass Ihr Agent in jedem Szenario zuverlässig funktioniert. Für den von uns beschriebenen Unteragenten "Experience Management" (Erfahrungsverwaltung) könnten beispielsweise die folgenden Testszenarien in Frage kommen.

Erzähle mir etwas über das Erlebnis _____________
Gibt es im Juli noch freie Termine für das Erlebnis _____________?
Ich muss meine Buchung ändern.
Ich möchte meine Buchung bestätigen.

Sie benötigen eine Reihe von Szenarien, die alle Arten von Eingaben abdecken, um Ihren Agenten gründlich zu testen. Ein guter Satz von Testeingaben weist diese Attribute auf.

Volume (Umfang): Eine ausreichende Anzahl von Testfällen, um umfassende Abdeckung verschiedener Szenarien und Grenzfälle sicherzustellen.
Diversity (Vielfalt): Eine Vielzahl von Eingaben, Kontexten und Variationen, die die Anpassungsfähigkeit Ihres Agenten in realen Anwendungsfällen testen, einschließlich Eingaben, die nicht in den Aufgabenbereich des Agenten fallen oder die die Schutzvorkehrungen des Agenten herausfordern können.
Quality (Qualität): Klar definierte, genaue und relevante Testfälle, die auf die Zielsetzung des KI-Agenten abgestimmt sind.

"Test Suites (Beta)" (Test-Suiten (Beta)) verwendet CSV-Dateien, um seine Testszenarien zu speichern. Wenn Sie Ihre eigenen Testeingaben schreiben, erstellen Sie Ihre eigene CSV-Datei. Wenn Sie die KI bitten, Testeingaben zu generieren, können Sie diese Tests in eine CSV-Datei herunterladen und unverändert verwenden oder und sie bearbeiten.

Wir empfehlen Ihnen, mit dem Testen zu beginnen, indem Sie 10 oder 20 Testszenarien in "Test Suites (Beta)" (Test-Suiten (Beta)) erstellen und anschließend die CSV-Datei herunterladen, um sie anhand der Parameter Ihres Agenten zu überprüfen. Dadurch können Sie Zeit sparen und diese Szenarien überarbeiten sowie weitere hinzufügen, um sie an die Art der Eingaben anzupassen, die Sie von Ihren Benutzern erwarten. Wenn sich die Leistung Ihres Agenten dann verbessert, können Sie größere Mengen an Testszenarien generieren.

Schritt 2: Festlegen von Auswertungsparametern

Die von "Test Suites (Beta)" (Test-Suiten (Beta)) generierten Testfälle enthalten Einstellungen, die Sie auswählen, während Sie durch die vier Bildschirme des Workflows "New Test" (Neuer Test) geführt werden. Nachdem Sie grundlegende Informationen zu Ihrem Test angegeben haben, wie dessen Namen und den zu testenden Agenten, können Sie Kontextvariablen hinzufügen, die Informationen über den Benutzer oder den Gesprächskontext simulieren. Sie wählen außerdem aus, wie "Test Suites (Beta)" (Test-Suiten (Beta)) die Leistung und Qualität des Agenten bewertet. Es ist ratsam, alle Optionen der Bewertungskriterien zu testen, um sicherzustellen, dass Ihr Agent zuverlässig ist und gute Leistungen erbringt.

Klicken Sie unterhalb des blauen Kastens auf Next (Weiter) oder Previous (Zurück), um die vier Schritte anzuzeigen, die am Generieren von Agententestfällen beteiligt sind.

Wenn Sie den Workflow "Neuer Test" abschließen und auf Generate Test Cases (Testfälle generieren) klicken, wird eine Liste der Tests angezeigt, die den von Ihnen gewählten Kriterien entsprechen. Wenn Sie eine CSV-Datei mit von Ihnen erstellten Testeingaben hochgeladen haben, werden sie in der Liste angezeigt. Ein Testfall überprüft, wie der Agent Eingaben verarbeitet, die als Äußerungen bezeichnet werden. Jeder Testfall enthält diese Elemente:

Utterance (Äußerung): Die an den Agenten gerichtete Abfrage
Expected Subagent (Erwarteter Unteragent): Der relevante Unteragent, den der Agent auswerten soll
Expected Actions (Erwartete Aktionen): Die verwandten Aktionen, die der Agent ausführen soll
Expected Response (Erwartete Antwort): Das gewünschte Ergebnis, in einfacher Sprache beschrieben

"Test Suites (Beta)" (Test-Suiten (Beta)) mit Feldern jedes Testszenarios, das zur Laufzeit ausgewertet wird.

Schritt 3: Ausführen der Tests und Auswerten der Ergebnisse

Sobald Sie den Workflow "Neuer Test" abgeschlossen haben klicken Sie auf Run Test Suite (Test-Suite ausführen), um die Tests auszuführen und ihre Ergebnisse anzuzeigen. Sie können die Testergebnisse für die eigentliche "Agent Response" (Agentenantwort) und für jedes der Evaluationskriterien prüfen, die Sie im Workflow "New Test" (Neuer Test) ausgewählt haben.

Schritt 4: Prüfen Ihrer Ergebnisse

Generierte Tests decken zwar viele Szenarien ab und zeigen, ob sie bestanden wurden oder nicht, es ist jedoch trotzdem wichtig, dass ein Mensch die Antworten überprüft, um sicherzustellen, dass sie mit der Art und Weise übereinstimmen, wie Benutzer mit dem Agenten interagieren und wie der Agent reagieren sollte, und dass keine toxischen oder unerwünschten Ergebnisse entstehen. Die Überprüfung der Eingaben und Antworten in diesem Schritt kann auch übersehene Feinheiten aufdecken, wie z. B. Unstimmigkeiten im Tonfall oder kontextspezifische Ungenauigkeiten.

Ein abgeschlossener Batch-Test mit bestandenen und fehlgeschlagenen Tests in "Test Suites (Beta)" (Test-Suiten (Beta))

Schritt 5: Prüfung der Ergebnisse und Iteration

Vergessen Sie nicht, dass Testen ein iterativer Vorgang ist. Sie verwenden Testergebnisse, um Ihre Unteragenten, Maßnahmen und Anweisungen zu verfeinern, bis Sie ein akzeptables Maß an Genauigkeit erreicht haben. Tests können auch dabei helfen, veraltete Daten aufzudecken, auf die Ihr Agent Zugriff hat, oder Berechtigungen, die angepasst werden müssen.

Erneutes Testen Ihrer Agenten

Agenten entwickeln sich weiter, und das Gleiche gilt für Ihr Unternehmen, daher sind erneute Tests wichtig, um Genauigkeit und Vertrauenswürdigkeit aufrecht zu erhalten. Es gibt viele Faktoren, die sich auf die Leistung Ihrer Agenten auswirken können, darunter Änderungen an den von Ihrem Agenten verwendeten Daten, Berechtigungen, Aktualisierungen seiner Unteragenten, Aktionen, Prompts oder Änderungen an Features der verwandten Produkte oder an Geschäftsprozessen. Durch fortgesetzte Tests kann sich Ihr Agent weiterentwickeln und bleibt so auch bei sich ändernden Geschäftszielen relevant.

Nachbetrachtung

Testen ist die Grundlage für die Entwicklung zuverlässiger, effizienter und vertrauenswürdiger KI-Agenten. Durch Befolgen einer Teststrategie stellen Sie sicher, dass Ihre Agentforce-Agenten vertrauenswürdig sind und Ihren Benutzern hilfreich zur Seite stehen.

Ressourcen

Szenario für das Quiz

Maria ist Agentforce-Administratorin bei einer großen Hotelkette, Global Stay Resorts. Sie wurde damit beauftragt, einen KI-Agenten zu optimieren, der für die Bearbeitung von Kundenreservierungen entwickelt wurde. Der Agent wurde manuell im Agentforce-Generator getestet, und Maria ist nun bereit, eine umfassendere Teststrategie zu implementieren, um dessen Zuverlässigkeit und Genauigkeit vor der vollständigen Einführung sicherzustellen. Sie konzentriert sich insbesondere darauf, verschiedene Benutzereingaben zu antizipieren und sicherzustellen, dass die Antworten des Agenten mit der Markenbotschaft und den Geschäftsprozessen des Unternehmens übereinstimmen.

Geschätzte Zeit

Themen

Benötigen Sie Hilfe?

Agentforce – Ressourcen