Arten von KI-Agenten und ihre Verwendung: Eine detaillierte Erklärung

Zusammenfassung:

Es gibt sieben verschiedene Arten von KI-Agenten, von einfachen reaktiven Agenten bis hin zu Multi-Agenten-Systemen.
Derzeit konzentrieren sich führende KI-Unternehmen vor allem auf die Entwicklung zielbasierter Agenten und lernender Agenten.
In Zukunft werden wir möglicherweise wirklich autonome KI-Agenten sehen, die mit anderen KI-Agenten interagieren können, um mehrere Aufgaben zu erfüllen.

Es ist klar, dass aktionsgesteuerte KI-Agenten die KI-Revolution anführen werden, und erste Anzeichen dafür sind bereits vorhanden. Von KI-gestützten Chatbots bis hin zu KI-Agenten, die Ihre E-Mails lesen und Termine buchen können: Wir stehen kurz vor dem Eintritt in das Agentenzeitalter. Um KI-Agenten besser zu verstehen, habe ich verschiedene Arten von KI-Agenten im Detail erklärt. Darüber hinaus habe ich führende Unternehmen und bereits auf dem Markt erhältliche KI-Agenten aufgelistet. Also, fangen wir an.

1. Agenten mit einfachen Reaktionen

Beginnen wir mit dem einfachsten Typ von KI-Agenten: Agenten mit einfachen Reaktionen. Wie der Name schon sagt, führen diese Agenten Aktionen auf der Grundlage aktueller Informationen aus und befolgen dabei eine „Wenn-Dann“-Bedingung. Beispielsweise schaltet ein Thermostat die Heizung ein, wenn die Temperatur unter einen bestimmten Wert fällt. Es führt einfach eine Aktion aus, wenn die Bedingung erfüllt ist.

Allerdings gibt es bei dieser Art von KI-Agenten mehrere Einschränkungen. Dabei werden nur aktuelle Informationen (auch „Wahrnehmungen“ oder Wahrnehmung genannt) berücksichtigt. Es merkt sich keine vorherigen Temperaturwerte und berücksichtigt auch keine zukünftigen Werte – es reagiert nur auf Grundlage der aktuellen Temperatur.

Einfache reaktive Agenten haben kein Gedächtnis und handeln nur, wenn die Umgebung vollständig beobachtbar ist – ein Zustand, in dem alle für eine Entscheidung erforderlichen Informationen verfügbar sind. Daher ist keine interne Darstellung oder kein internes Modell der Welt vorhanden.

2. Modellbasierte reflektierende Agenten

Als nächstes verbessern modellbasierte reflektierende Agenten die Leistung einfacher reflektierender Agenten. Dieser Agententyp verfügt über eine interne Darstellung der Welt und hat daher ein Gedächtnis. Im Wesentlichen verfolgen diese Agenten Aktionen und deren Auswirkungen auf die Welt und aktualisieren das interne Modell/die interne Darstellung. Beispielsweise merkt sich ein selbstfahrendes Auto beim Navigieren durch den Verkehr die Standorte der Fahrzeuge, selbst wenn diese sich von ihrem aktuellen Standort wegbewegt haben. Diese interne Repräsentation ermöglicht fundiertere Entscheidungen.

Nun erstellt der Agent basierend auf früheren Beobachtungen und aktuellen Informationen eine interne Darstellung der Welt und führt die gewünschte Aktion aus. Dies bedeutet, dass modellbasierte reflexive Agenten in teilweise beobachtbaren Umgebungen agieren können. Im Wesentlichen wird das interne Modell verwendet, um die nächste Aktion vorherzusagen. Dieses Modell basiert auf fortschrittlichen Algorithmen der künstlichen Intelligenz.

3. Zielbasierte Agenten

Wie der Name schon sagt, sind zielorientierte Agenten ergebnisorientierte Agenten, d. h. sie ziehen zukünftige Aktionen in Betracht, die sie dem endgültigen Ziel näher bringen. Diese Agenten können Nachforschungen anstellen, Operationen planen und verschiedene Aktionsfolgen in Betracht ziehen, die sie zum gewünschten Ziel führen. Zielorientierte Agenten berücksichtigen bei ihren Handlungen zukünftige Konsequenzen.

Beispielsweise muss ein GPS, das Ihre Route plant, alle Straßen suchen und berücksichtigen, die zum Ziel führen. Dabei werden alle möglichen Routen auf Grundlage von Entfernung, Dauer, aktuellem Verkehr usw. berücksichtigt. Auf Grundlage dieser Informationen plant und wählt der zielbasierte Agent nun den besten Weg, um das gewünschte Ziel zu erreichen. Dieser Agententyp ist für KI-Anwendungen, die eine strategische Planung erfordern, unerlässlich.

4. Leistungsorientierte Agenten

Nutzenbasierte Agenten sind eine Art zielbasierter Agenten, sie sind jedoch nicht an ein bestimmtes Ziel gebunden. Zielorientierte Agenten denken beispielsweise nur in Kategorien des Erreichens oder Nichterreichens eines Ziels – binär. Nutzenbasierte Agenten berücksichtigen jedoch unterschiedliche Zustände der Welt, bewerten unterschiedliche Ergebnisse auf der Grundlage komplexer Präferenzen und wählen dann die Aktion, die ihren „Nutzen“ maximiert.

Dieser Agententyp funktioniert, indem er verschiedenen Aktionssequenzen eine numerische Punktzahl zuweist und nur die Aktion auswählt, die die höchste Nutzenpunktzahl liefert. Nutzenbasierte Agenten werden für Situationen entwickelt, in denen der Ausgang ungewiss ist. Beispielsweise kann das Ziel eines KI-gestützten Handelssystems darin bestehen, den Gewinn zu maximieren, es muss jedoch auch berücksichtigen, wie viel Risiko der Benutzer tolerieren kann und wie die aktuellen Marktbedingungen sind. Dies erfordert eine sorgfältige Analyse der potenziellen Risiken und Erträge.

Im Wesentlichen berücksichtigen nutzenbasierte Agenten unterschiedliche Präferenzen und bewerten Ergebnisse, bevor sie eine Entscheidung treffen. Ihr Ziel besteht nicht nur darin, das Ziel zu erreichen, sondern verschiedene Faktoren auszugleichen, um die optimale Vorgehensweise zu finden. Das heißt, sie versuchen, den „erwarteten Nutzen“ auf der Grundlage einer umfassenden Beurteilung der Umstände zu maximieren.

5. Lernende Agenten: Leistungssteigerung in KI-Systemen

Per Definition sind lernende Agenten in der Lage, ihre Leistung im Laufe der Zeit zu verbessern, indem sie aus vergangenen Erfahrungen lernen. Die beste Eigenschaft von Learning Agents ist ihre Fähigkeit, sich an unbekannte Umgebungen anzupassen und ihre Aktionen auf der Grundlage von Feedback zu optimieren. In lernenden Agenten gibt es eine „kritische“ Komponente, die Feedback zur Leistung des Agenten liefert, was für den Lernprozess von entscheidender Bedeutung ist.

Um ein Beispiel zu veranschaulichen, betrachten Sie die Funktionsweise von Spamfiltern für E-Mails. Spamfilter verfügen zunächst über einen grundlegenden Regelsatz. Wenn Sie jedoch weiterhin E-Mails als Spam markieren, lernt der Agent über die bereitgestellten Bewertungen („Kritiker“) und passt sein Verhalten an. Nun werden diese E-Mails künftig automatisch als Spam markiert und in einen anderen Ordner verschoben. Dieser Prozess basiert auf fortschrittlichen Algorithmen aus dem Bereich des maschinellen Lernens.

6. Pyramidenagenten

Hierarchische Agenten sind ein Agententyp, der komplexe Ziele in Unterziele aufteilt. Es gibt viele komplexe Aufgaben, die mehrstufige Verfahren und Problemlösungen erfordern. In solchen Fällen werden Aufgaben in kleinere, überschaubarere Teilprobleme zerlegt, die in einer Hierarchie organisiert sind. Jetzt werden diese Aufgaben an Agenten auf niedrigerer Ebene delegiert und Agenten auf höherer Ebene kontrollieren die Strategie und das Endergebnis.

Wenn Sie beispielsweise einen KI-Roboter bitten, das Abendessen zuzubereiten, plant und teilt der Agent auf höchster Ebene die Aufgabe auf, beispielsweise die Zubereitung von Nudeln und Soße. Diese Aufgaben werden dann weiter unterteilt, beispielsweise das Einschalten des Herds und das Einfüllen von Wasser in die Pfanne. Auf diese hierarchische Weise wird die Aufgabe nun von einer Ebene zur nächsten erledigt. Dieser Ansatz ermöglicht die effiziente und effektive Durchführung komplexer Aufgaben, was bei fortgeschrittenen KI-Anwendungen von entscheidender Bedeutung ist.

7. Multi-Agenten-Systeme

Schließlich kommen wir zu Multi-Agenten-Systemen (MAS), die mehrere unabhängige Agenten kombinieren, um ein gemeinsames Ziel zu erreichen. Diese Systeme ermöglichen es mehreren Agenten, miteinander zu kommunizieren, zu interagieren, mögliche Aktionen zu koordinieren, zu verhandeln und zu kooperieren. In solchen Systemen agiert jeder Agent unabhängig und verfügt über seine eigene Entscheidungsbefugnis.

Um Konflikte zu vermeiden und ein gemeinsames Ziel zu erreichen, müssen jedoch alle Agenten einem gemeinsamen Protokoll für Multi-Agenten-Systeme entsprechen. In einem Lieferkettensystem gibt es beispielsweise mehrere Agenten, die den Bestand verfolgen, ein anderer Agent erstattet der Einkaufsabteilung auf Grundlage der Bestandsanforderungen Bericht, ein Logistikagent sucht die beste Versandroute usw. Multiagentensysteme sind eine effektive Lösung für komplexe Probleme, die Koordination und Zusammenarbeit zwischen unabhängigen Einheiten erfordern.

Aktuelle KI-Agenten führender Technologieunternehmen

Auf dem Markt sind bereits viele Arten von KI-Agenten erhältlich. Unternehmen wie OpenAI, Google, Microsoft, Anthropic, Salesforce und viele andere entwickeln KI-Agenten und Frameworks, um die Leistungsfähigkeit zielgerichteter KI effektiv zu nutzen. Nachfolgend finden Sie einige KI-Agenten, die Sie ausprobieren können. Bedenken Sie dabei, dass diese Tools noch immer kontinuierlich weiterentwickelt und verbessert werden.

OpenAI

OpenAI ist das erste Unternehmen, das Operator-KI-Agent Verbraucherorientiert. Es handelt sich um einen Agenten, der mithilfe eines Computers Aufgaben im Web automatisiert. Ein Bediener kann mit Webbrowsern interagieren und Aktionen durch Klicken, Tippen und Wischen ausführen. Sie können damit Formulare ausfüllen, Flugtickets buchen, Lebensmittel bestellen und vieles mehr. Er ist jedoch noch nicht vollständig autonom. Sie müssen Zahlungen manuell abschließen und bei Bedarf CAPTCHAs eingeben. Dieser Agent ist ein wichtiger Schritt in Richtung der Entwicklung einer KI, die komplexe Aufgaben effizient erledigen kann.

Der Operator fällt wahrscheinlich in die Kategorie der zielbasierten und lernenden Agenten. Es ist zielorientiert und lernt aus der Interaktion mit Websites. Darüber hinaus Der Deep Research Agent von OpenAI Führt komplexe mehrstufige Forschungsaufgaben aus und analysiert Text, Bilder und PDF-Dateien, um einen umfassenden Bericht zu erstellen. Ich würde sagen, es ist eine Kombination aus einem zielbasierten Agenten, einem lernenden Agenten und einem hierarchischen Agenten, der Aufgaben in kleinere Unteraufgaben zerlegt. Diese Funktionen machen es zu einem leistungsstarken Tool für Forscher und Analysten.

Darüber hinaus sagt OpenAI, dass die neuesten o3 und o4-mini Es handelt sich nicht nur um KI-Modelle, sondern um agentenähnliche KI-Systeme. Diese neuen KI-Systeme verhalten sich wie Agenten und können mit einer Vielzahl von Tools interagieren, darunter Websuche, Python-Interpreter, Bildanalyse und Plus. Es handelt sich um modell- und zielbasierte Agenten. Diese Systeme stellen einen bedeutenden Fortschritt in den KI-Fähigkeiten dar.

Schließlich ist das neueste Codex CLI-Tool von OpenAI, mit dem Entwickler Code vom Terminal aus lesen, bearbeiten und ausführen können, eine weitere Art von KI-Agent. Es kann automatisch Fehler beheben, neue Funktionen erstellen und Dateien ändern. Auch hier handelt es sich um einen zielbasierten Agenten, der mit dem Learning-Agenten erstellt wurde. Dieses Tool steigert die Produktivität von Entwicklern erheblich.

Google

Bisher hat Google nur Deep Research AI Agent auf Gemini, der ähnlich wie der Agent von OpenAI funktioniert. Er kann im Internet surfen, die benötigten Informationen zusammenstellen und diese zusammenstellen, um einen umfassenden Bericht zu jedem beliebigen Thema zu erstellen. Ich klassifiziere diesen Agenten als einen zielbasierten, lernenden Agenten, was ihn zu einem Fortschritt im Bereich der künstlichen Intelligenz macht.

Als nächstes stellte Google das Projekt Mariner vor, das sich noch in der Entwicklung befindet. Dieses Projekt funktioniert wie der Operator AI-Agent von OpenAI und kann Aufgaben im Chrome-Browser automatisieren. Es kann den aktiven Bildschirm analysieren und Aktionen auf Websites ausführen. Laut Google wird der Agent von vertrauenswürdigen Testern getestet und in naher Zukunft veröffentlicht.

Darüber hinaus hat Google Agent2Agent (A2A)-Protokoll Neu ist, dass mehrere KI-Agenten miteinander kommunizieren können. Es handelt sich dabei nicht um einen Agenten selbst, sondern um einen Standard/Framework, der Multi-Agenten-Systeme (MAS) ermöglicht.

Anthropisch

Genau wie OpenAI hat Anthropic seinen KI-Agenten „Computer Use“ vorgestellt, der sich derzeit in der Betaphase befindet und mit Desktop-Computerumgebungen interagieren kann. Es kann den Bildschirm analysieren, klicken, tippen und Dateivorgänge ausführen. Es ist nicht nur auf Webbrowser beschränkt, sondern kann auch Aktionen auf Betriebssystemebene ausführen. Es versteht sich von selbst, dass es sich hierbei um einen zielorientierten, lernenden Agenten handelt.

Darüber hinaus hat Anthropic vor Kurzem ein Suchtool mit Workspace on Cloud-Integration veröffentlicht. Es kann eine Verbindung zu Ihrem Gmail, Kalender und Drive sowie zum Internet herstellen, um Recherchen durchzuführen und Erkenntnisse zu gewinnen. Ebenso ist Claude Code ein Proxy-Codierungstool, das im Terminal ausgeführt wird. Versteht die Codebasis und kann Dateien ändern, Tests ausführen und auch mit Git interagieren. Beide sind zielbasierte Agenten.

Schließlich entwickelte Anthropic das Model Context Protocol (MCP), einen offenen Standard für die Verbindung von KI-Modellen mit externen Datenquellen, wodurch KI-Agenten zuverlässig auf API-losen Diensten arbeiten können. Obwohl es kein Agent ist, ermöglicht es die Kommunikation zwischen KI-Modellen, Tools, Websites und anderen Datenquellen. Sie können herausfinden, wie Einrichten von MCP in der Cloud unter Windows und macOS.

Microsoft

Im Bereich Verbraucherdienste hat Microsoft mehrere neue KI-Agenten für seinen Chatbot Copilot angekündigt. Ein Agent kann Umfassende Recherche in Copilot Führen Sie mehrstufige Recherchen durch, um umfassende Berichte zu bestimmten Themen zu erstellen. Darüber hinaus kann es Copilot-Aktionen Buchen Sie Tickets, nehmen Sie Reservierungen vor und kaufen Sie Produkte im Internet. Es funktioniert jedoch nur auf Partner-Websites.

Für Unternehmen hat Microsoft kürzlich den Computer Use AI-Agenten in Copilot Studio angekündigt. Es kann direkt mit Websites und Desktop-Anwendungen interagieren, um Aktionen auszuführen, und ist nicht auf spezielle APIs angewiesen. Microsoft hat außerdem den Security Copilot-Agenten vorgestellt, der bei Phishing-Warnungen, Datensicherheit und Identitätsmanagement hilft, wesentlichen Komponenten der Cybersicherheit von Unternehmen.

Microsoft hat mehrere Copilot-Agenten für Unternehmenskunden entwickelt und Sie können sogar einen benutzerdefinierten KI-Agenten für Ihren Workflow erstellen. Sie können in Copilot Studio loslegen und MCP-Server, APIs und externe Quellen verbinden, um Aufgaben zu automatisieren, die Arbeitsproduktivität zu steigern und potenzielle Fehler zu reduzieren.

Salesforce

Neben Microsoft hat Salesforce die Agentforce-Plattform für Unternehmenskunden entwickelt, die autonome und anpassbare KI-Agenten bereitstellt. Geschäftsbenutzer können auf Agentforce mehrere KI-Agenten erstellen, bereitstellen und verwalten, um Leads zu generieren, den Vertrieb zu optimieren, das Marketing zu verwalten und vieles mehr. Agentforce ist eine führende Plattform für die Automatisierung von Geschäftsprozessen mithilfe künstlicher Intelligenz.

Salesforce behauptet, dass Agentforce-Agenten im Gegensatz zu Microsofts Copilot Aktionen basierend auf vordefinierten Ereignissen oder Auslösern autonom ausführen können. Agentforce-Agenten können Datensätze in der Datenbank aktualisieren, E-Mails senden, Besprechungen buchen, anstehende Fälle lösen usw. Diese Funktionen machen Agentforce zu einem leistungsstarken Tool zur Automatisierung von Kundendienst- und Vertriebsaufgaben.

Dies sind also die Arten von KI-Agenten, die Sie erkunden können, und Sie können die derzeit auf dem Markt verfügbaren KI-Agenten finden. In Zukunft werden KI-Agenten zu einem wesentlichen Bestandteil des Interneterlebnisses, sei es auf Verbraucher- oder Unternehmensseite. Der Markt für KI-Agenten dürfte in den kommenden Jahren ein erhebliches Wachstum verzeichnen, angetrieben durch die steigende Nachfrage nach Automatisierung und verbesserter Effizienz.