AutoGPT ist, wie oben erwähnt, eine experimentelle Open-Source Schnittstelle für GPT-4. Im Gegensatz zu ChatGPT, kann AutoGPT ohne menschliches Zutun, völlig selbstständig arbeiten. Der Hauptunterschied ist also die Autonomie. Statt einen menschlichen Agenten, wird dieser durch die AI ersetzt.
Um das mal mit ChatGPT zu vergleichen. Nehmen wir mal an, Du planst ein Interviewtag. Folgenden Prompt würdest Du dann in ChatGPT stellen "Helfe mir, einen Interviewtag für Bewerber zu organisieren". ChatGPT würde möglicherweise eine Liste von Dingen erstellen, die Du berücksichtigen solltest. Und hier könnte ChatGPT Vorschläge zu Interviewort, Räumlichkeiten, Einladungen, Speisen und Getränke und vieles mehr unterbreiten.
Auto-GPT hingegen würde (möglicherweise) andere Ergebnisse liefern. Es würde nicht nur einen Interviewort oder die Räumlichkeiten planen und vorschlagen, sondern wenn der Nutzer Auto-GPT auffordert, die Einladungen der Bewerber anzugehen und zu versenden, dann würde dies sogar Auto-GPT machen.
Und Auto-GPT kann noch viel mehr! Es könnte sogar beispielsweise sogar nach "Give-Aways" für Bewerber suchen und diese eigenständig bestellen! Wahnsinn oder?
Und Agent-GPT? Wie zuvor erläutert ist Agent-GPT eine benutzerfreundliche Anwendung. Man hat ein Eingabefenster und kann dort die Prompts eingeben. Es basiert auf derselben Technologie wie ChatGPT, kann aber - im Gegensatz zu Auto-GPT, nicht ohne menschlichen Input arbeiten. Und 100% autonom ist es auch nicht - was für mich persönlich aber irgendwie nach einer Erleichterung klingt :-).
Für unsere Aufgaben reicht jedoch Agent-GPT allemal und wir beginnen mit dem Einstieg.
Wir beginnen mit einem kleinen Experiment. Zuerst rufen wir die Seite agentgpt.reworkd.ai/de auf. Die Anmeldung kann auch beispielsweise mit einem Google Account durchgeführt werden.
Im Feld Name kannst Du einen beliebigen Namen eingeben. Im Feld Ziel habe ich zu folgendes Eingegeben:
"Denke wie ein Recruiter und erstelle einen booleschen Suchstring für einen Mobile App Developer mit Fokus Kotlin. Nenne mindestens 3 weitere Programmiersprachen die im Zusammenhang eines Mobile App Developers stehen."
Rechts von der Eingabemaske siehst Du die "Current Tasks". Bedeutet sobald Du hier den Starten Button drückst, legt Agent-GPT los und liefert Dir Ergebnisse. Gleichzeitig kannst Du dann ablesen, welche Tasks bzw. Aufgaben Agent-GPT aktuell abarbeitet.
Durch die Eingabe folgender Parameter teile ich Agent-GPT mit, dass ich einen booleschen Suchstring für einen Mobile App Developer erstellt haben möchte. Gleichzeitig sollte dieser mindestens 3 weitere Programmiersprachen enthalten, und diese sollten auch im Zusammenhang stehen.
D.h. so könnte an dieser Stelle beispielsweise SQL weniger Sinn machen. (*Ausnahme z.B. SQL-Lite bei Android - wir gehen aber an dieser Stelle eher von anderen Programmiersprachen für die Mobile App Entwicklung aus, die eine höhere Priorisierung haben sollten)
Und jetzt schauen wir uns mal die Ausgabe an. Das tolle an Agent-GPT ist, dass Du den Verlauf bzw. die abzuarbeitende Aufgaben mitverfolgen kannst. In diesem Experiment war es tatsächlich zu schnell, um alles lesen zu können bzw. die Tasks mitzuverfolgen.
Aber schauen wir uns mal einen Auszug der Zwischenergebnisse an. Interessant ist, dass Agent-GPT "denkt". Bedeutet, wir können die Schritte nachvollziehen. So erläutert uns Agent-GPT, wie er das übergeordnete Ziel erreicht. D.h.
"Um das übergeordnete Ziel zu erreichen, möchte ich wie ein Recruiter denken und einen booleschen Suchstring für einen Mobile App Developer mit Fokus auf Kotlin erstellen. Zusätzlich soll ich drei weitere Programmiersprachen nennen, die im Zusammenhang mit einem Mobile App Developer stehen."
Agent-GPT extrahiert die Variablen und erläutert was sich dahinter verbirgt. Beispielsweise werden neben Kotlin noch weitere Programmiersprachen wie Swift und Java berücksichtigt. Und das Gute daran, auch hier erklärt Agent-GPT was sich beispielsweise hinter der Programmiersprache Swift verbirgt.
Und jetzt schauen wir uns mal die Zwischenergebnisse an. Der erste Suchstring zu einem gewissen Grad korrekt. Lediglich die Anführungszeichen sind bei einem einzelnen Wort (hier Kotlin) nicht notwendig.
Der zweite Suchstring enthält auch doppelte Klammern - und auch das ist nicht korrekt. Gut finde ich jedoch, dass neben Java oder Swift auch React Native berücksichtigt wird.
Wenn wir aber weiter runterscrollen, dann stellen wir fest, dass der dargestellte Suchstring korrekt ist (mit Ausnahme Anführungszeichen Kotlin)! Diese könntest Du beispielsweise mit der X-Ray Suche in einer Suchmaschine verwenden. Auch hier erläutert Agent-GPT nochmals was sich hinter den Programmiersprachen Java, Swift und Javascript verbirgt.
Auch erläutert die Anwendung, dass man zusätzliche Kenntnisse berücksichtigen könnte. Die hier vorgeschlagenen Programmiersprachen decken sich übrigens mit dem was ich bisher in Mobile App Developer Profilen gesehen haben. D.h. es werden keine Programmiersprachen vorgeschlagen, die nicht ins Profil eines Mobile App Entwicklers passen könnten, vorgeschlagen (z.B. Rust).
Vorteil? Nun ich finde es immer spannend neue Tools auszuprobieren. Und zugegebenermaßen finde ich die Abarbeitung von Task sehr spannend!
Und im Gegensatz zu Auto-GPT übernimmt Agent-GPT nicht die Kontrolle über Deinen Internetbrowser oder installiert irgendwelche Pakete. Aber grundsätzlich gilt immer: Bei der Nutzung von Agent-GPT solltest Du niemals (sensible) Unternehmensinformationen oder personenbezogene Daten eingeben bzw. abfragen!
Was aber auch vorteilhaft ist: Du kannst den gesamten Verlauf hinterher downloaden. Ob als PDF Skript, Bild oder rein im Kopierformat. Letzteres kannst Du dann sogar in einem Word Programm oder in einem Texteditor übertragen.
Aktuell ist Agent-GPT in der Beta Version verfügbar. Ich nenne Dir abschließend gerne mal die Pros und Cons:
Pros:
Cons:
Zu bemängeln habe ich wirklich - Stand jetzt - wenig. Vermutlich liegt das aber daran, dass ich eine gewisse Affinität für alles Neue aus dem Tech Sektor habe. Bitte bedenke aber bei der Nutzung (und das gilt ausnahmslos für sämtliche KI Systeme) weder (sensible) Unternehmensinformationen noch personenbezogene Daten einzugeben bzw. abzufragen.
Und wenn Du Lust auf mehr bekommen hast - ab September starte ich einen weiteren Video on Demand Kurs zum Thema Künstliche Intelligenz, willst Du dabei sein?