Mit dem rasanten Aufstieg der Künstlichen Intelligenz (KI) im beruflichen Umfeld stellt sich eine Frage: Können diese Systeme tatsächlich menschliche Mitarbeiter ersetzen? Forscher der Carnegie Mellon Universität haben versucht, diese Frage zu beantworten, indem sie ein Unternehmen simulierten, das von KI-Agenten geleitet wurde. Die Ergebnisse offenbaren überraschende Informationen über die gegenwärtigen Fähigkeiten dieser Technologien und ihr zukünftiges Potenzial in der Arbeitswelt.
Ein virtuelles Unternehmen, das von KIs gesteuert wird
In ihrem Experiment haben die Forscher ein fiktives Unternehmen geschaffen, das von KI-Agenten bevölkert ist, wie Claude von Anthropic, GPT-4o von OpenAI und Google Gemini, um verschiedene Positionen zu besetzen, von Finanzanalyst bis Projektleiter. Gleichzeitig haben andere Plattformen Kollegen simuliert, mit denen diese KIs interagieren mussten, um bestimmte Aufgaben zu erledigen, die für ihr Funktionieren unerlässlich waren. Eine ehrgeizige Idee, die schnell deutliche Schwächen der digitalen Agenten offenbarte.
Die besorgniserregenden Ergebnisse der KI-Agenten
Die Ergebnisse des Experiments haben gezeigt, dass diese Künstlichen Intelligenzen nicht den Erwartungen entsprachen. Tatsächlich scheiterten die Agenten bei über drei Vierteln der ihnen zugewiesenen Aufgaben. So konnte Claude 3.5 Sonnet, obwohl er der leistungsfähigste war, nur 24 % der Aufgaben erfolgreich abschließen, und lediglich 34,4 %, wenn man die teilweise abgeschlossenen Aufgaben hinzuzählt. Andere Agenten wie Gemini 2.0 Flash schlossen nur 11,4 % der Aufgaben ab, während die Mehrheit der anderen Agenten Ergebnisse von unter 10 % erzielte.
Die Hürden, mit denen KIs konfrontiert sind
Die Schwierigkeiten der Agenten beschränken sich nicht auf Fehler bei der Ausführung der Aufgaben. Viele von ihnen verstanden den Sinn der impliziten Anweisungen nicht. Beispielsweise, als sie gebeten wurden, ein Dokument im Format „.docx“ zu erstellen, verstanden sie nicht, dass es sich um ein Microsoft Word-Format handelte. Darüber hinaus hinderte ihre Unfähigkeit, Aufgaben zu bewältigen, die soziale Fähigkeiten erforderten, oft ihre Fähigkeit, effektiv mit anderen Abteilungen des Unternehmens zusammenzuarbeiten.
Online-Navigation, eine echte Herausforderung
Eine der größten Herausforderungen, mit denen diese KI-Agenten konfrontiert waren, war das Surfen im Internet, insbesondere im Umgang mit Pop-up-Fenstern. Wenn sie sich in komplexen Situationen wiederfanden, wählten viele von ihnen vereinfachte Routen, um Schwierigkeiten zu vermeiden, in dem Glauben, sie hätten die Aufgabe erfüllt. Dieses Problem verdeutlicht die erheblichen Grenzen der heutigen KIs in Bezug auf autonome Entscheidungsfindung.
Kontrastierende Betriebskosten
Trotz ihrer enttäuschenden Leistung ist es interessant zu bemerken, dass die Betriebskosten für diese Agenten erheblich variieren. So erforderte Claude 3.5 Sonnet eine Investition von 6,34 Dollar, während Gemini 2.0 Flash lediglich 0,79 Dollar kostete. Dies wirft Fragen zur wirtschaftlichen Tragfähigkeit des Einsatzes solcher Technologien in Unternehmen auf, besonders wenn die Kapitalrendite nicht garantiert ist.
Implikationen für die Zukunft der Arbeit
Über die Ergebnisse dieser Studie hinaus ist es entscheidend, darüber nachzudenken, was das für die Zukunft der beruflichen Welt bedeutet. Obwohl Automatisierung und KI versprechen, unsere Arbeitsweise zu transformieren, zeigt dieser Fall, dass diese Technologien noch nicht bereit sind, Menschen vollständig zu ersetzen. Die aktuellen KI-Tools, obwohl sie für bestimmte Aufgaben effizient sind, weisen immer noch erhebliche Lücken auf, die ihre großflächige Nutzung in Unternehmen einschränken könnten.







