Tägliche KI-Agenten und AI-Agents Forschung: Bleiben Sie mit unseren 2025 Science Papers Up-to-Date!: Herzlich willkommen zu Ihrem täglichen, hochaktuellen Überblick über die neuesten wissenschaftlichen Veröffentlichungen im Bereich KI-Agenten und AI-Agents! Wir präsentieren Ihnen hier die spannendsten 2025 Forschungsergebnisse zu intelligenten Software-Agenten, Multi-Agentensystemen, agentenbasierter KI und allen verwandten Themen. Unser Fokus liegt darauf, Ihnen die neuesten Entwicklungen in der Welt der autonomen Systeme und des Reinforcement Learning schnell und effizient zugänglich zu machen.
KI-Agenten und AI-Agents – 2025 Science Papers Daily: Ihr täglicher Vorteil
Bei uns finden Sie nicht einfach eine Liste von Veröffentlichungen. Wir kuratieren und verdichten für Sie die relevantesten Papers, damit Sie keine Zeit mit der Durchsicht unzähliger arXiv-Uploads, Konferenzbeiträge und Journal-Publikationen verschwenden. Die aktuellsten wissenschaftlichen Fortschritte in der KI-Forschung stellen wir stets ganz oben auf der Seite, sodass Sie auf einen Blick sehen, welche neuen Erkenntnisse gerade veröffentlicht wurden. Weiter unten finden Sie dann die Zusammenfassungen der vorangegangenen Tage – ideal, um Ihren Wissensstand chronologisch aufzufrischen und die Entwicklungen der letzten Tage nachzuvollziehen.
- Kompakte Zusammenfassungen: Keine Informationsflut! Anstatt sich durch Hunderte von Papers zu kämpfen, erhalten Sie bei uns eine präzise Übersicht über die neuesten Entwicklungen im Bereich der KI-Agenten.
- Zeitgewinn durch Kuratierung: Mit wenigen Absätzen pro Paper erfassen Sie schnell die Relevanz für Ihre Forschung, Ihr Projekt oder Ihr persönliches Interesse an agentenbasierten Systemen.
- Trends und Innovationen erkennen: Die agentenbasierte KI-Forschung ist ein hochdynamischer Bereich mit rasanten Fortschritten, insbesondere in den Bereichen generative Agenten, kollaborative Robotik, Multi-Agenten-Verhandlungen, Vision-Language-Modelle und LLM-basierte Anwendungen. Hier entdecken Sie frühzeitig die neuesten Trends in Multi-Agentensystemen und deren bahnbrechende Anwendungen.
- Lückenlose Aktualität: Tägliche Updates zu KI-Papers! Wir durchforsten täglich die neuesten Veröffentlichungen, um sicherzustellen, dass Sie keine bahnbrechenden Entdeckungen und arXiv KI-Agenten Papers verpassen.
- Wachsendes Archiv: Mit der Zeit entsteht hier ein umfassendes Archiv, das Sie für tiefergehende Recherchen und zum Nachschlagen älterer, aber relevanter Arbeiten nutzen können. Ideal für einen Deep Dive in die KI-Agenten Forschung oder um ältere, aber immer noch interessante Arbeiten nachzuschlagen.
Ihre Anlaufstelle für KI-Agenten Forschung
Wir möchten Ihnen mit diesem Service eine verlässliche Anlaufstelle bieten, an der Sie sich über die neuesten Forschungsergebnisse im Bereich der KI-Agenten informieren können, ohne von der schieren Menge an Publikationen überwältigt zu werden. Ob Sie in diesem Gebiet forschen, sich mit Kolleg*innen austauschen oder einfach nur die technologischen Entwicklungen verfolgen wollen: Unsere Zusammenfassungen sollen Ihnen helfen, auf dem Laufenden zu bleiben und Ihre eigene KI-Agenten Forschung zu inspirieren.
Top 5 Forschungsergebnisse zu KI-Agenten im Januar 2025
…werden Anfang Februar 2025 veröffentlicht.
Die Liste unten wird täglich aktualisiert, wobei die neuesten Einträge immer ganz oben stehen. So können Sie schnell erkennen, was die Community gerade diskutiert, und gleichzeitig tiefer scrollen, um einen umfassenden Überblick über die Entwicklung im Bereich der KI-Agenten und AI-Agents zu erhalten. Bleiben Sie am Ball, wenn Sie keine wichtigen Entwicklungen verpassen wollen!
Zusammenfassung der AI-Agents – 2025 Science Papers Daily der tägliche Blick auf die Forschung zu KI-Agenten
Wöchentlich erstellen wir eine Zusammenfassung, um Trends besser zu verstehen. Diese Zusammenfassungen gibt es im Folgenden:
Woche 1
2025 – Woche 1 – Zusammenfassung aller ArXiv Veröffentlichungen zum Thema KI-Agenten
Woche 2
KI-Agenten-bezogene arXiv-Veröffentlichungen vom 24.1.2025
1) GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration
- Es wird ein Ansatz vorgestellt, bei dem ein KI-Agent eigenständig Oberflächen (GUIs) erkundet.
- Durch selbstständiges Lernen werden Aktionen im Interface korrekt zugeordnet und ausgeführt.
- Das Ziel ist eine robuste Anpassungsfähigkeit an neue oder unbekannte Nutzeroberflächen.
Link: https://arxiv.org/abs/2501.13896
2) EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents
- Das Paper beschreibt ein LLM-basiertes Agentensystem, das Unternehmensdaten in großen Wissensgraphen durchsucht und aufbereitet.
- Der Agent interagiert in natürlicher Sprache und nutzt KI-Methoden, um relevante Informationen zu extrahieren.
- Ziel ist die Unterstützung von Nutzern bei komplexen Recherchen in umfangreichen, vernetzten Datenbeständen.
Link: https://arxiv.org/abs/2501.13731
3) Scalable Safe Multi-Agent Reinforcement Learning for Multi-Agent System
- Hier wird ein Verfahren für sicheres und skalierbares Multi-Agenten-Verstärkungslernen vorgestellt.
- Mehrere Agenten lernen kollaboratives oder kooperatives Verhalten, ohne sicherheitskritische Zustände zu verletzen.
- Die Autoren legen dabei besonderen Wert auf effiziente Trainingsmethoden für reale Anwendungen.
Link: https://arxiv.org/abs/2501.13727
4) Explainable AI-aided Feature Selection and Model Reduction for DRL-based V2X Resource Allocation
- Das Paper beschreibt einen Deep-Reinforcement-Learning-Agenten für Ressourcenallokation im Fahrzeug-zu-Alles- (V2X-) Umfeld.
- Durch erklärbare KI-Verfahren werden die wichtigsten Eingabefaktoren identifiziert und das Modell kompakter gestaltet.
- Ziel ist eine effiziente, nachvollziehbare und performante Zuteilung knapper Netzwerkressourcen.
Link: https://arxiv.org/abs/2501.13545
5) BMG-Q: Localized Bipartite Match Graph Attention Q-Learning for Ride-Pooling Order Dispatch
- Vorgestellt wird ein Multi-Agenten-Framework, das mittels Q-Learning Fahrgastanfragen passend auf Fahrzeuge verteilt.
- Die Autoren verwenden ein spezielles bipartites Matching, um Dispatch-Entscheidungen effizient zu treffen.
- Ziel ist die Optimierung von Wartezeiten und Auslastung in Ride-Pooling-Systemen.
Link: https://arxiv.org/abs/2501.13448
6) AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback
- Dieses Paper zeigt ein System, das KI-Agenten mithilfe von Sprachrepräsentationen an menschliche Präferenzen anpasst.
- Ziel ist es, Agenten so zu empfehlen oder zu gestalten, dass sie mit menschlichem Feedback optimal übereinstimmen.
- Dazu werden Techniken aus dem Natural Language Processing genutzt, um die Bewertungen und Hinweise der Menschen zu verstehen.
Link: https://arxiv.org/abs/2501.13333
7) SRMT: Shared Memory for Multi-agent Lifelong Pathfinding
- Die Autoren stellen eine geteilte Speicherarchitektur vor, in der mehrere Agenten dauerhaft Pfade planen und koordinieren können.
- Die Lösung lernt fortwährend, was für eine verbesserte Skalierbarkeit und Effizienz in Langzeit-Szenarien sorgt.
- So sollen etwa Roboterflotten oder Logistiksysteme robuster agieren und ihre Routen dynamisch anpassen können.
Link: https://arxiv.org/abs/2501.13200
8) A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy
- Ein hierarchisches RL-System, bei dem mehrere UAVs (Drohnen) mithilfe eines Führer-Gefolgsmann-Ansatzes kooperieren.
- Die Hierarchie ermöglicht eine bessere Aufgabenteilung, indem ein übergeordneter Agent taktische Ziele vorgibt und andere Agenten deren Umsetzung übernehmen.
- Dies verspricht effizientere und koordinierte Aktionen in simulierten Luftkampfszenarien.
Link: https://arxiv.org/abs/2501.13132
KI-Agenten-bezogene arXiv-Veröffentlichungen vom 23.1.2025
1. Boosting MCTS with Free Energy Minimization
- Das Paper kombiniert Monte Carlo Tree Search (MCTS) mit dem Prinzip der Freien-Energie-Minimierung.
- Ziel ist es, die Exploration und Exploitation eines Such-Agents zu verbessern.
- Diese Methode könnte insbesondere in komplexen Planungs- oder Spielumgebungen neue Wege eröffnen.
Link: https://arxiv.org/abs/2501.13083
2. Offline Critic-Guided Diffusion Policy for Multi-User Delay-Constrained Scheduling
- Hier wird ein Reinforcement-Learning-Ansatz vorgestellt, der mithilfe eines Offline-Kritikers Richtlinien (Policies) für verzögerungskritische Ressourcenplanung lernt.
- Der Fokus liegt darauf, mehrere Nutzer effizient zu bedienen, indem ein Diffusionsmodell als Policy eingesetzt wird.
- Dieses Verfahren erlaubt Agenten eine bessere Entscheidungsfindung in Echtzeitszenarien.
Link: https://arxiv.org/abs/2501.12942
3. Kimi k1.5: Scaling Reinforcement Learning with LLMs
- Das Paper präsentiert einen Ansatz, um Reinforcement Learning mithilfe großer Sprachmodelle (LLMs) zu skalieren.
- Dabei werden LLMs als Teilkomponenten eines umfassenden Lern-Agents eingesetzt, um komplexe Zustände und Aktionen zu verarbeiten.
- Ziel ist es, effizienter und schneller zu lernen, ohne an Flexibilität einzubüßen.
Link: https://arxiv.org/abs/2501.12599
4. R2D2: Remembering, Reflecting and Dynamic Decision Making for Web Agents
- Dieses Paper beschreibt einen Web-Agenten, der Gedächtnisstrukturen und Reflexionsmechanismen kombiniert, um bessere Entscheidungen im Web zu treffen.
- Ein Schwerpunkt liegt auf dynamischen Anpassungen und kontinuierlichem Lernen während Interaktionen im Internet.
- So kann der Agent komplexe Aufgaben auf Webseiten verstehen und erledigen.
Link: https://arxiv.org/abs/2501.12485
5. Control-ITRA: Controlling the Behavior of a Driving Model
- Vorgestellt wird ein Ansatz zur Verhaltenssteuerung eines autonomen Fahrmodells mittels KI-Methoden.
- Ein zentraler Punkt ist die Interpretierbarkeit der Kontrollentscheidungen, die die Sicherheit erhöhen soll.
- Dadurch kann das Fahrzeug-”Agentensystem” sein Fahrverhalten an dynamische Verkehrssituationen anpassen.
Link: https://arxiv.org/abs/2501.12408
6. FinSphere: A Conversational Stock Analysis Agent Equipped with Quantitative Tools based on Real-Time Database
- Hier wird ein KI-Agent beschrieben, der in natürlicher Sprache über Finanzdaten interagiert und Aktien analysiert.
- Der Agent verbindet Echtzeit-Datenbanken mit quantitativen Werkzeugen für fundierte Anlageentscheidungen.
- Damit kann er menschlichen Nutzern automatisierte Börsenanalysen und -prognosen liefern.
Link: https://arxiv.org/abs/2501.12399
7. Attention-Driven Hierarchical Reinforcement Learning with Particle Filtering for Source Localization in Dynamic Fields
- Dieses Paper kombiniert hierarchisches Reinforcement Learning mit Partikelfiltern, um Agenten bei der Quellensuche in dynamischen Umgebungen zu unterstützen.
- Der Fokus liegt auf einer effizienten Positionsbestimmung und Navigation in wechselnden Feldern (z. B. Strömungen oder Verteilungen).
- Der Agent kann dadurch seine Suche adaptiv anpassen und Ressourcen besser nutzen.
Link: https://arxiv.org/abs/2501.13084
8. AdaWM: Adaptive World Model based Planning for Autonomous Driving
- Das Paper stellt ein adaptives Weltmodell vor, das einem autonomen Fahr-Agenten bei der Planung in komplexen Verkehrssituationen hilft.
- Durch kontinuierliche Anpassung an Umweltveränderungen kann der Agent robust navigieren.
- Ziel ist, sicheres und effizientes autonomes Fahren zu gewährleisten.
Link: https://arxiv.org/abs/2501.13072
9. Optimizing Return Distributions with Distributional Dynamic Programming
- Dieser Ansatz erweitert klassisches Q-Learning um eine Verteilungsperspektive, damit der Agent nicht nur Erwartungswerte, sondern die komplette Rückgabelandschaft berücksichtigt.
- Das führt zu einer feineren Steuerung von Risiko und Unsicherheit im Lernprozess.
- Somit können Agenten Entscheidungen treffen, die besser zur jeweiligen Aufgabenstellung passen.
Link: https://arxiv.org/abs/2501.13028
10. MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking
- Das Paper untersucht das Problem, dass RL-Agenten durch Kurzsichtigkeit (Myopie) ungeplante Belohnungsschlupflöcher ausnutzen.
- Mit der vorgestellten Methode „MONA“ werden myopische Strategien teils durch zusätzliche, langfristige Bewertungen korrigiert.
- Auf diese Weise soll „Reward Hacking“ minimiert werden und die Handlungen des Agenten stabiler werden.
Link: https://arxiv.org/abs/2501.13011
11. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
- Dieses Paper setzt auf RL, um große Sprachmodelle (LLMs) besser zum logischen Schlussfolgern zu bringen.
- Ein spezielles Belohnungsschema fördert präzisere Zwischenschritte im Reasoning-Prozess.
- Dadurch könnten AI-Agenten in Sprachaufgaben fundiertere Antworten generieren.
Link: https://arxiv.org/abs/2501.12948
12. Reinforcement learning Based Automated Design of Differential Evolution Algorithm for Black-box Optimization
- Das Paper kombiniert Reinforcement Learning mit einer Evolutionären Strategie, um neue Varianten des Differential-Evolution-Algorithmus zu entwerfen.
- Ein Agent identifiziert dabei selbstständig, welche Operatoren und Parameter gut funktionieren.
- Dadurch lässt sich für Black-Box-Optimierungsprobleme ein effizienterer Lösungsweg finden.
Link: https://arxiv.org/abs/2501.12881
13. Drone Carrier: An Integrated Unmanned Surface Vehicle for Autonomous Inspection and Intervention in GNSS-Denied Maritime Environment
- Vorgestellt wird ein autonomes Trägersystem (USV) mit Drohne, das ohne GPS-Navigation (GNSS-Denied) arbeitet.
- Der Agent muss seine Umgebung eigenständig erkennen und inspizieren, um Interventionen durchzuführen.
- Damit können maritime Inspektionsaufgaben automatisiert und sicherer gestaltet werden.
Link: https://arxiv.org/abs/2501.12869
14. To Measure or Not: A Cost-Sensitive, Selective Measuring Environment for Agricultural Management Decisions with Reinforcement Learning
- Hier wird ein RL-Agent beschrieben, der Entscheidungen im landwirtschaftlichen Kontext trifft und selbst bestimmt, wann Messungen lohnend sind.
- Dies senkt die Kosten für unnötige Datenerhebungen und steigert zugleich die Qualität der agrarwirtschaftlichen Entscheidungen.
- So können Landwirte ihre Ressourcen gezielter einsetzen.
Link: https://arxiv.org/abs/2501.12823
15. HEPPO: Hardware-Efficient Proximal Policy Optimization — A Universal Pipelined Architecture for Generalized Advantage Estimation
- Dieses Paper zeigt eine hardwareoptimierte Variante des bekannten PPO-Verfahrens für Reinforcement Learning.
- Der Agent nutzt ein pipeliniertes Design, um schnelle, ressourcenschonende Entscheidungen zu treffen.
- Dadurch wird RL auch auf kostengünstiger Hardware mit hohem Durchsatz praktikabel.
Link: https://arxiv.org/abs/2501.12703
16. NBDI: A Simple and Efficient Termination Condition for Skill Extraction from Task-Agnostic Demonstrations
- In diesem Paper wird ein Kriterium entwickelt, wann ein RL-Agent das Erlernen einer Fertigkeit aus Demonstrationen beenden sollte.
- So können Agenten selbständig erkennen, wann sie genügend Erfahrung gesammelt haben, um eine Fähigkeit zu meistern.
- Dies vereinfacht und beschleunigt die Konstruktion von Skill Libraries für komplexe Aufgaben.
Link: https://arxiv.org/abs/2501.12668
17. Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors
- Die Autoren setzen Inverse Reinforcement Learning ein, um Tierverhalten zu analysieren und die zugrundeliegenden „Belohnungsfunktionen“ zu identifizieren.
- Dabei wird berücksichtigt, dass sich die Belohnungsfunktionen im Zeitverlauf ändern („switching rewards“) und vom Verlauf abhängen.
- Dieses Verfahren könnte in der Verhaltensforschung oder Robotik zum Nachahmen biologischer Strategien dienen.
Link: https://arxiv.org/abs/2501.12910
18. Adaptive Data Exploitation in Deep Reinforcement Learning
- Das Paper fokussiert auf Strategien, um in RL-Systemen Daten effizienter zu nutzen und Overfitting zu vermeiden.
- Hierzu werden adaptive Mechanismen eingeführt, die entscheiden, wann neue Daten erfasst und wann alte Daten erneut verwendet werden.
- Dadurch kann ein Agent robuster trainiert und die Lerngeschwindigkeit gesteigert werden.
Link: https://arxiv.org/abs/2501.12620
19. Reinforcement Learning Constrained Beam Search for Parameter Optimization of Paper Drying Under Flexible Constraints
- Ein RL-gestützter Algorithmus wird vorgestellt, um Strahlersysteme (Beam) beim Trocknen von Papier effizient zu steuern.
- Der Agent muss dabei verschiedene Nebenbedingungen, wie Stromverbrauch oder Trocknungsqualität, gegeneinander abwägen.
- So wird eine dynamische und ressourcenschonende Prozesssteuerung ermöglicht.
Link: https://arxiv.org/abs/2501.12542
20. Interaction Dataset of Autonomous Vehicles with Traffic Lights and Signs
- Das Paper liefert einen Datensatz, der das Verhalten autonomer Fahr-Agenten im Zusammenspiel mit Ampeln und Verkehrsschildern erfasst.
- Damit können Agenten trainiert und validiert werden, um sicher und regelkonform im Straßenverkehr zu navigieren.
- Dieser Datensatz bildet eine realistische Grundlage für Entwicklungs- und Testzwecke.
Link: https://arxiv.org/abs/2501.12524
21. FREYR: A Framework for Recognizing and Executing Your Requests
- FREYR ist ein KI-Framework, das Benutzereingaben versteht und automatisch entsprechende Aktionen ausführt – im Prinzip ein universeller Agent.
- Es nutzt kontextbewusste Interpretationsmechanismen, um Befehle sicher und nachvollziehbar abzuarbeiten.
- Damit könnten viele Arten von Alltagsaufgaben oder Systemsteuerungen automatisiert werden.
Link: https://arxiv.org/abs/2501.12423
KI-Agenten-bezogene arXiv-Veröffentlichungen vom 22.1.2025
1. UI-TARS: Pioneering Automated GUI Interaction with Native Agents
- Bietet ein System zur automatisierten Interaktion mit grafischen Benutzeroberflächen (GUIs) mithilfe sogenannter „Native Agents“.
- Zeigt auf, wie diese Agenten selbstständig GUI-Elemente erkennen und Aktionen ausführen können.
- Verspricht Verbesserungen bei der Effizienz und Zuverlässigkeit von Test- und Automatisierungsszenarien.
Link: arXiv:2501.12326
2. Episodic memory in AI agents poses risks that should be studied and mitigated
- Diskutiert, wie KI-Agenten mit episodischem Gedächtnis potenzielle Risiken bezüglich Datenschutz und Fehlverhalten aufweisen.
- Analysiert verschiedene Formen von speicherbasierten Angriffen und möglichen Sicherheitslücken.
- Schlägt Methoden vor, um solche Risiken frühzeitig zu erkennen und zu minimieren.
Link: arXiv:2501.11739
3. Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training
- Beschreibt ein Verfahren, bei dem Sprachmodelle als autonome Agenten durch wiederholtes Selbsttraining lernen, besser zu reflektieren.
- Nutzt Feedback-Schleifen, um den Denkprozess und die Entscheidungsfindung kontinuierlich zu verbessern.
- Demonstriert vielversprechende Resultate bei komplexen Aufgaben, die kognitive Fähigkeiten erfordern.
Link: arXiv:2501.11425
4. ColorGrid: A Multi-Agent Non-Stationary Environment for Goal Inference and Assistance
- Führt eine mehragentige Umgebung ein, in der Ziele dynamisch und nicht-stationär sind.
- Zeigt, wie Agenten kollaborativ Ziele erschließen und sich gegenseitig unterstützen können.
- Liefert damit eine Testplattform für Forschung an adaptiven und lernfähigen Multi-Agenten-Systemen.
Link: arXiv:2501.10593
5. Adaptive Target Localization under Uncertainty using Multi-Agent Deep Reinforcement Learning with Knowledge Transfer
- Beschäftigt sich mit der Mehragenten-Lokalisierung von Zielen in unsicheren Umgebungen.
- Setzt auf Deep Reinforcement Learning und Techniken zum Wissenstransfer zwischen den Agenten.
- Verbessert damit die Effizienz und Genauigkeit kooperativer Such- und Lokalisierungsaufgaben.
Link: arXiv:2501.10924
6. Learn-by-interact: A Data-Centric Framework for Self-Adaptive Agents in Realistic Environments
- Stellt einen datenorientierten Ansatz vor, bei dem KI-Agenten sich in realitätsnahen Umgebungen selbstständig an neue Situationen anpassen.
- Nutzt Interaktionen zur kontinuierlichen Verbesserung, ohne auf massive, vorab annotierte Datensätze angewiesen zu sein.
- Vereinfacht das Deployment von lernfähigen Agenten in sich dynamisch ändernden Szenarien.
Link: arXiv:2501.10893
7. Graph Coloring to Reduce Computation Time in Prioritized Planning
- Zeigt eine graphenbasierte Herangehensweise, um die Rechenzeit bei der Pfadplanung für mehrere Agenten zu reduzieren.
- Nutzt Färbungsalgorithmen, um Konflikte zwischen Agentenpfaden effizient zu erkennen und zu vermeiden.
- Hilft damit, große und komplexe Multi-Agenten-Planungsprobleme schneller und robuster zu lösen.
Link: arXiv:2501.10812
8. Simultaneous Computation with Multiple Prioritizations in Multi-Agent Motion Planning
- Untersucht, wie mehrere Priorisierungsstrategien gleichzeitig genutzt werden können, um Multi-Agenten-Bewegungsplanung zu verbessern.
- Liefert ein Framework, in dem Agenten ihre Routen koordinieren, ohne auf eine starre Hierarchie angewiesen zu sein.
- Verspricht höhere Flexibilität und Robustheit in Echtzeitumgebungen.
Link: arXiv:2501.10781
9. Cooperative Search and Track of Rogue Drones using Multiagent Reinforcement Learning
- Entwickelt ein mehragentiges System, das mithilfe von Reinforcement Learning gemeinsam nach Drohnen sucht und sie verfolgt.
- Berücksichtigt dabei Unsicherheiten in der Umgebung sowie eine mögliche Gegenwehr der gesuchten Drohnen.
- Zielt auf effektive Zusammenarbeit von Agenten in sicherheitskritischen Szenarien ab.
Link: arXiv:2501.10396
10. Beyond the Sum: Unlocking AI Agents Potential Through Market Forces
- Setzt sich mit der Idee auseinander, LLM-basierte Agenten kollaborativ über Marktmechanismen zu koordinieren.
- Zeigt auf, wie sich die „Intelligenz“ eines Agenten-Kollektivs steigern lässt, wenn man sie ökonomischen Prinzipien unterordnet.
- Diskutiert dabei theoretische Modelle und praktische Anwendungsszenarien.
Link: arXiv:2501.10388
11. GTDE: Grouped Training with Decentralized Execution for Multi-agent Actor-Critic
- Beschreibt einen Multi-Agenten-Ansatz im Kontext von Actor-Critic-Methoden, der Training in Gruppen nutzt, während die Ausführung dezentral bleibt.
- Ermöglicht es den Agenten, voneinander zu lernen und dennoch eigenständig zu agieren.
- Bietet bessere Skalierbarkeit für kooperative Aufgaben im Vergleich zu rein zentralen Lernverfahren.
Link: arXiv:2501.10367
KI-Agenten-bezogene arXiv-Veröffentlichungen vom 20.1.2025
1. Titel: Infrastructure for AI Agents
arXiv-ID: 2501.10114
Beschreibung
- Dieses Paper diskutiert grundlegende Anforderungen und Designprinzipien für eine robuste Infrastruktur, die KI-Agenten unterstützt.
- Es werden zentrale Komponenten wie Kommunikation, Sicherheitsmechanismen und Schnittstellen beschrieben, die für den Einsatz verschiedener Agententypen notwendig sind.
- Die Arbeit beleuchtet zudem organisatorische und rechtliche Aspekte, um die Einführung von KI-Agenten im industriellen Maßstab zu erleichtern.
Link zum Paper: https://arxiv.org/abs/2501.10114
2. Titel: LLM Reasoner and Automated Planner: A new NPC approach
arXiv-ID: 2501.10106
Beschreibung
- In diesem Paper wird ein Konzept vorgestellt, wie Large Language Models als KI-Agenten zur Steuerung von NPCs (Non-Player Characters) eingesetzt werden können.
- Die Autoren kombinieren Reasoning-Fähigkeiten von LLMs mit einem automatisierten Planer, um NPCs in virtuellen Umgebungen eine höhere Handlungsfreiheit und Glaubwürdigkeit zu verleihen.
- Damit sollen sowohl die Interaktivität in Spielen als auch mögliche Anwendungen in anderen simulationsbasierten Kontexten verbessert werden.
Link zum Paper: https://arxiv.org/abs/2501.10106
3. Titel: ForestProtector: An IoT Architecture Integrating Machine Vision and Deep Reinforcement Learning for Efficient Wildfire Monitoring
arXiv-ID: 2501.09926
Beschreibung
- Das Paper beschreibt einen KI-Agenten-Ansatz, der mittels Deep Reinforcement Learning und Bildverarbeitung Waldbrände frühzeitig erkennen und darauf reagieren soll.
- Ein zentralisiertes Agenten-Framework überwacht Sensordaten, trifft autonome Entscheidungen und kann Ereignisse priorisieren, um Schäden zu minimieren.
- Diese Lösung legt besonderen Wert auf die Integration in bestehende IoT-Systeme und skalierbare Datenerfassung in Echtzeit.
Link zum Paper: https://arxiv.org/abs/2501.09926
4. Titel: Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems
arXiv-ID: 2501.10332
Beschreibung
- Dieses Paper zeigt, wie generative KI-Agenten in Bildungssystemen automatisiert Schülerantworten erzeugen können, um Trainingsdaten anzureichern.
- Dabei werden realistische Lernendenreaktionen simuliert, um KI-gestützte Tutor- oder Bewertungssysteme zu verbessern.
- Die Studie legt dar, wie dadurch personalisierte Feedback-Mechanismen und adaptive Lernumgebungen effizienter entwickelt werden können.
Link zum Paper: https://arxiv.org/abs/2501.10332
5. Titel: Universal Actions for Enhanced Embodied Foundation Models
arXiv-ID: 2501.10105
Beschreibung
- Die Autor*innen schlagen eine vereinheitlichte Aktionsdarstellung für KI-Agenten vor, damit Roboter und andere verkörperte Systeme komplexe Anweisungen besser umsetzen können.
- Sie fokussieren sich darauf, wie multimodale Eingaben (z.B. Sprache) mit Aktionsempfehlungen verknüpft werden, um das Spektrum ausführbarer Aufgaben zu erweitern.
- Ihr Ansatz soll die Lern- und Generalisierungsfähigkeit von Embodied Foundation Models im praktischen Einsatz steigern.
Link zum Paper: https://arxiv.org/abs/2501.10105
6. Titel: SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning
arXiv-ID: 2501.10074
Beschreibung
- Das Paper kombiniert räumliches Denken (Spatial Reasoning) mit einem Chain-of-Thought-Ansatz, um KI-Agenten in simulierten 2D- und 3D-Umgebungen effektiver navigieren und Aufgaben ausführen zu lassen.
- Ein Schwerpunkt liegt auf der präzisen Übersetzung natürlicher Sprachbefehle in agentenbasierte Aktionsabfolgen.
- Dadurch sollen Embodied Agents menschenähnliches Planen und Problemlösen erlernen, was für Robotik- und Simulationsanwendungen interessant ist.
Link zum Paper: https://arxiv.org/abs/2501.10074
7. Titel: SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning
arXiv-ID: 2501.09905
Beschreibung
- Hier wird ein KI-Agent vorgestellt, der auf Bein-Robotern langhorizontige Aufgaben durch Visuomotorik erlernt, erst in einer Simulation und später in der realen Umgebung.
- Das System nutzt eine hierarchische Steuerung, um komplexe Manipulations- und Bewegungsabfolgen selbstständig zu planen und auszuführen.
- Besondere Beachtung findet die robuste Übertragung (Sim-to-Real Transfer), damit das in der Simulation Gelernte zuverlässig in der Praxis funktioniert.
Link zum Paper: https://arxiv.org/abs/2501.09905
KI-Agenten-bezogene arXiv-Veröffentlichungen vom 17.1.2025
- YETI (YET to Intervene) Proactive Interventions by Multimodal AI Agents in Augmented Reality Tasks
- Dieses Paper präsentiert YETI, einen multimodalen KI-Agenten, der proaktive Interventionen in Augmented Reality-Aufgaben durchführt.
- YETI nutzt verschiedene Modalitäten wie Bild und Text, um die Benutzerintention zu verstehen und entsprechende Maßnahmen einzuleiten.
- Das Paper beschreibt die Architektur und die experimentelle Evaluation von YETI und zeigt seine Fähigkeit, die Benutzererfahrung in AR-Anwendungen zu verbessern.
- Link zum Paper
- SOP-Agent: Empower General Purpose AI Agent with Domain-Specific SOPs
- Dieses Paper stellt den SOP-Agenten vor, einen KI-Agenten, der allgemeine Fähigkeiten mit domänenspezifischen Standardarbeitsanweisungen (SOPs) kombiniert.
- Der SOP-Agent integriert diese SOPs, um seine Handlungen in spezifischen Bereichen zu führen und die Genauigkeit und Effizienz zu erhöhen.
- Das Paper demonstriert die Anwendung des SOP-Agenten in verschiedenen Szenarien und hebt die Vorteile der SOP-Integration hervor.
- Link zum Paper
- Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
- Dieses Paper bietet einen Überblick über Agentic RAG, eine Weiterentwicklung der Retrieval-Augmented Generation, bei der KI-Agenten den Abruf und die Generierung steuern.
- Es untersucht, wie Agenten den Retrieval-Prozess dynamisch anpassen und die Relevanz und Qualität der generierten Antworten verbessern können.
- Das Paper diskutiert die verschiedenen Ansätze und Herausforderungen von Agentic RAG und bietet Einblicke in zukünftige Forschung.
- Link zum Paper
- Authenticated Delegation and Authorized AI Agents
- Dieses Paper befasst sich mit der Herausforderung der sicheren Delegierung von Aufgaben an KI-Agenten in einem dezentralen System.
- Es schlägt eine Methode zur authentifizierten Delegation vor, die sicherstellt, dass nur autorisierte Agenten auf bestimmte Ressourcen zugreifen oder Aktionen ausführen können.
- Das Paper diskutiert die architektonischen und sicherheitsrelevanten Aspekte dieser Delegationsmethode.
- Link zum Paper
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Dieses Paper stellt AutoLoop vor, ein System, das durch Agenten-basiertes Curriculum Learning die Feinabstimmung von visuellen SLAM-Systemen beschleunigt.
- AutoLoop nutzt KI-Agenten, um automatisch die optimale Reihenfolge von Trainingsdaten auszuwählen, um die Leistung von SLAM-Modellen zu verbessern.
- Das Paper zeigt, dass AutoLoop die Lernzeit reduziert und gleichzeitig die Genauigkeit von SLAM-Modellen erhöht.
- Link zum Paper
- ADAGE: A generic two-layer framework for adaptive agent based modelling
- Das Paper präsentiert ADAGE, einen generischen zweischichtigen Rahmen für adaptive agentenbasierte Modellierung.
- ADAGE ermöglicht die Modellierung von Agenten, die sich an ihre Umgebung anpassen können.
- Es stellt einen Rahmen bereit, der ein breites Spektrum von Anwendungen in verschiedenen Bereichen unterstützt.
- Link zum Paper
- Platform-Aware Mission Planning
- Dieses Paper befasst sich mit der plattformbewussten Missionsplanung unter Berücksichtigung der spezifischen Fähigkeiten und Beschränkungen von Agenten.
- Es werden Methoden zur automatisierten Planung von Missionen unter Berücksichtigung der zugrunde liegenden Hardware- und Softwareplattformen vorgestellt.
- Das Paper zeigt, wie eine solche plattformbewusste Planung die Effizienz und Robustheit von Agenten in realen Anwendungen verbessern kann.
- Link zum Paper
- Solving the unsolvable: Translating case law in Hong Kong
* Dieses Paper untersucht den Einsatz von KI-Agenten für die Übersetzung von Rechtstexten in Hongkong.
* Es präsentiert die Entwicklung eines mehrsprachigen KI-Agenten der in der Lage ist, Rechtstexte mit hoher Genauigkeit zu übersetzen.
* Das Paper hebt die Herausforderungen und das Potenzial von KI für komplexe Übersetzungsaufgaben hervor. - Decompose-ToM: Enhancing Theory of Mind Reasoning in Large Language Models through Simulation and Task Decomposition
- Dieses Paper stellt Decompose-ToM vor, eine Methode zur Verbesserung der „Theory of Mind“ (ToM) Fähigkeiten von Large Language Models (LLMs).
- Decompose-ToM nutzt Simulationen und Aufgabenzerlegung um LLMs zum besseren Verständnis von Überzeugungen und Absichten anderer zu trainieren.
- Das Paper demonstriert die Effektivität dieser Methode zur Steigerung der ToM-Fähigkeiten in LLMs.
- Link zum Paper
Liste der arXiv-Veröffentlichungen zu KI-Agenten 16.01.2025
2025-01-16, die sich mit dem Thema KI-Agenten befassen, wie gewünscht formatiert:
- Titel: Leveraging Large Language Models as Knowledge-Driven Agents for Reliable Retrosynthesis Planning
Link:https://arxiv.org/abs/2501.08897
Beschreibung:- Dieses Papier untersucht die Verwendung von Large Language Models (LLMs) als wissensgesteuerte Agenten für die Planung von Retrosynthesen.
- Es wird gezeigt, wie LLMs verwendet werden können, um zuverlässigere und effizientere Retrosynthesewege zu generieren.
- Die Studie demonstriert die Fähigkeit von LLMs, komplexe chemische Zusammenhänge zu verstehen und zu nutzen.
- Titel: Personality Modeling for Persuasion of Misinformation using AI Agent
Link:https://arxiv.org/abs/2501.08985
Beschreibung:- Dieses Paper untersucht, wie KI-Agenten mit Persönlichkeitsmodellen eingesetzt werden können, um Desinformation zu bekämpfen.
- Es werden unterschiedliche Persönlichkeitsansätze untersucht, um Menschen von Falschinformationen zu überzeugen.
- Die Ergebnisse geben Einblicke, wie KI-gestützte Methoden zur Verbesserung der Informationsintegrität eingesetzt werden könnten.
- Titel: Leveraging LLM Agents for Translating Network Configurations
Link:https://arxiv.org/abs/2501.08760
Beschreibung:- Dieses Papier untersucht die Nutzung von Large Language Model (LLM) Agenten für die Übersetzung von Netzwerkkonfigurationen.
- Es wird gezeigt, wie LLMs komplexe Konfigurationsdaten interpretieren und automatisch in verschiedene Formate übersetzen können.
- Der Ansatz zielt darauf ab, die Effizienz und Genauigkeit bei der Verwaltung von Netzwerkkonfigurationen zu verbessern.
- Titel: LAMS: LLM-Driven Automatic Mode Switching for Assistive Teleoperation
Link:https://arxiv.org/abs/2501.08558
Beschreibung:- Dieses Papier stellt LAMS vor, ein System, das LLMs verwendet, um automatisch zwischen verschiedenen Modi in der assistiven Teleoperation zu wechseln.
- Das System nutzt das semantische Verständnis von LLMs, um den Kontext der Aufgaben des Benutzers zu interpretieren und dynamisch den passenden Modus auszuwählen.
- Diese Methode vereinfacht die Teleoperation und verbessert die Benutzererfahrung durch Anpassung an die aktuellen Aufgaben und Ziele.
- Titel: Doc-Guided Sent2Sent++: A Sent2Sent++ Agent with Doc-Guided memory for Document-level Machine Translation
Link:https://arxiv.org/abs/2501.08523
Beschreibung:- In diesem Artikel wird ein neuer Ansatz für die maschinelle Dokumentenübersetzung vorgestellt.
- Der Ansatz verwendet einen Sent2Sent++-Agenten mit einem dokumentengeleiteten Gedächtnis.
- Diese Methode verbessert die Konsistenz und den Kontext der Übersetzungen von maschinellen Dokumenten.
- Titel: AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL
Link:https://arxiv.org/abs/2501.08600
Beschreibung:- Das Paper stellt AutoRestTest vor, ein Werkzeug für automatisiertes Testen von REST APIs.
- Es kombiniert Large Language Models (LLMs) mit Multi-Agent Reinforcement Learning (MARL).
- Die Methode wird dazu genutzt, effektivere und umfassendere Tests für REST APIs zu erstellen.
- Titel: How Developers Interact with AI: A Taxonomy of Human-AI Collaboration in Software Engineering
Link:https://arxiv.org/abs/2501.08774
Beschreibung:- Dieses Paper analysiert die Interaktionen zwischen Softwareentwicklern und KI-Systemen.
- Es wird eine Taxonomie der Mensch-KI-Kollaboration im Software Engineering vorgeschlagen.
- Das Ziel ist es, ein besseres Verständnis für die Rolle von KI bei der Unterstützung von Entwicklern zu erlangen.
- Titel: Networked Agents in the Dark: Team Value Learning under Partial Observability
Link:https://arxiv.org/abs/2501.08778
Beschreibung:- Dieser Artikel untersucht das Lernen von Teamwerten unter partieller Beobachtbarkeit in Multi-Agenten-Systemen.
- Es werden Methoden vorgestellt, die es Agenten ermöglichen, den Beitrag jedes Teammitglieds zu bewerten, auch wenn sie nur begrenzte Informationen haben.
- Die Studie untersucht, wie agenten in diesen Szenarien besser zusammenarbeiten und bessere Ergebnisse erzielen können.
- Titel: Modeling Discrimination with Causal Abstraction
Link:https://arxiv.org/abs/2501.08429
Beschreibung:- Dieser Artikel untersucht Diskriminierung mithilfe von kausalen Abstraktionen.
- Es werden Methoden entwickelt, um die Ursachen und Mechanismen von Diskriminierung zu verstehen.
- Das Paper zeigt, wie kausale Modelle verwendet werden können, um Diskriminierung effektiver anzugehen.
Liste der arXiv-Veröffentlichungen zu KI-Agenten 15.01.2025
1.
Titel: Cooperative Patrol Routing: Optimizing Urban Crime Surveillance through Multi-Agent Reinforcement Learning
Link: arXiv:2501.08020
Beschreibung:
- Stellt einen Multi-Agenten-Ansatz vor, um Überwachungsrouten in städtischen Gebieten zu optimieren.
- Nutzt gemeinsames Verstärkungslernen, damit mehrere KI-Agenten koordiniert Verbrechen aufdecken.
- Verspricht effektivere Verteilung knapper Ressourcen in der Sicherheitspolizei.
2.
Titel: LLM-Ehnanced Holonic Architecture for Ad-Hoc Scalable SoS
Link: arXiv:2501.07992
Beschreibung:
- Beschreibt eine holonische, also hierarchisch organisierte System-of-Systems-Architektur für KI-Agenten.
- Nutzt Large Language Models (LLMs), um dynamische Zusammenarbeit mehrerer Agenten zu ermöglichen.
- Erleichtert so die flexible Skalierung und Selbstorganisation in komplexen Anwendungsszenarien.
3.
Titel: Governing AI Agents
Link: arXiv:2501.07913
Beschreibung:
- Analysiert rechtliche und ethische Ansätze, um intelligente Agenten und ihre Interaktionen zu regulieren.
- Diskutiert die Verantwortungsübernahme von KI-Agenten in komplexen Entscheidungsprozessen.
- Bietet Empfehlungen für Governance-Strukturen, die KI-Agenten effektiv kontrollieren sollen.
4.
Titel: Flow: A Modular Approach to Automated Agentic Workflow Generation
Link: arXiv:2501.07834
Beschreibung:
- Zeigt, wie sich Workflows in Unternehmen mit KI-Agenten automatisieren lassen.
- Führt einen modularen Baukasten ein, in dem Agenten unterschiedliche Aufgaben selbstständig zuweisen und steuern.
- Ermöglicht dadurch effizientere Abläufe und reduziert manuelle Interaktionen.
5.
Titel: Agent-Centric Projection of Prompting Techniques and Implications for Synthetic Training Data for Large Language Models
Link: arXiv:2501.07815
Beschreibung:
- Untersucht, wie KI-Agenten Prompting-Techniken anwenden können, um hochwertigen Trainings-Content zu generieren.
- Zeigt, wie ein agentenorientierter Fokus neue Möglichkeiten für LLM-Feinabstimmungen eröffnet.
- Diskutiert potenzielle Vorteile und Risiken synthetisch erzeugter Trainingsdaten.
6.
Titel: Visual Language Models as Operator Agents in the Space Domain
Link: arXiv:2501.07802
Beschreibung:
- Stellt vor, wie visuelle Sprachmodelle als agentenhafte Operatoren für Aufgaben in der Weltraumforschung eingesetzt werden.
- Betont die Fähigkeit solcher Agenten, komplexe Bilder und Szenarien zu interpretieren und eigenständig zu handeln.
- Zeigt Potenziale für automatisiertes Monitoring und Analyse in der Raumfahrt.
7.
Titel: PokerBench: Training Large Language Models to become Professional Poker Players
Link: arXiv:2501.08328
Beschreibung:
- Entwickelt ein Framework, das LLMs zu Poker-Agenten ausbildet und Strategien trainiert.
- Zeigt, wie Sprachmodelle durch Interaktion, Regelkenntnis und Strategieanpassung wettbewerbsfähig spielen können.
- Bietet neue Einblicke in die Verknüpfung von natürlicher Sprachverarbeitung und agentenbasiertem Spielverhalten.
8.
Titel: Engineering LLM Powered Multi-agent Framework for Autonomous CloudOps
Link: arXiv:2501.08243
Beschreibung:
- Beschreibt die Integration von Large Language Models in ein Multi-Agenten-System für automatisierte Cloud-Operationen.
- Zeigt, wie unterschiedliche Agenten verteilte Cloud-Ressourcen überwachen und dynamisch verwalten können.
- Vereinfacht somit Infrastrukturverwaltung und Skalierung in Echtzeit.
9.
Titel: Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning
Link: arXiv:2501.08234
Beschreibung:
- Präsentiert einen Multi-Agenten-RL-Ansatz, der Ticketpreise in Hochgeschwindigkeitszügen dynamisch optimiert.
- Ermöglicht jeder Agentin (bzw. jedem Agenten) eine adaptive Preisstrategie unter Wettbewerbsbedingungen.
- Verspricht gesteigerte Effizienz und Gewinnmaximierung bei gleichzeitiger Berücksichtigung der Kundennachfrage.
10.
Titel: Talk to Right Specialists: Routing and Planning in Multi-agent System for Question Answering
Link: arXiv:2501.07814
Beschreibung:
- Nutzt ein mehrteiliges Agenten-System, das ankommende Fragen an die jeweils „besten Spezialisten“ weiterleitet.
- Zeigt, wie eine koordinierte Planung unter Agenten schnellere und präzisere Antworten erzielt.
Liste der arXiv-Veröffentlichungen zu KI-Agenten 14.01.2025
- Lifelong Learning of Large Language Model based Agents: A Roadmap
- Beschreibt einen Ansatz, wie KI-Agenten auf Basis großer Sprachmodelle ihre Fähigkeiten fortlaufend verbessern können.
- Behandelt das Problem der Wissenserhaltung über mehrere Aufgaben hinweg.
- Skizziert Herausforderungen und mögliche Zukunftsstrategien für nachhaltiges Lernen in Agentensystemen.
Link: https://arxiv.org/abs/2501.07278
- PoAct: Policy and Action Dual-Control Agent for Generalized Applications
- Führt ein Agentenmodell ein, das sowohl auf Policy-Ebene (Strategie) als auch auf Action-Ebene (Handlungen) lernt.
- Ermöglicht eine flexible Anpassung an vielfältige Aufgaben, indem Steuerung und Aktionen entkoppelt betrachtet werden.
- Zeigt Vorteile in unterschiedlichen Anwendungsszenarien, etwa in komplexen Multi-Step-Umgebungen.
Link: https://arxiv.org/abs/2501.07054
- LLMs Model Non-WEIRD Populations: Experiments with Synthetic Cultural Agents
- Untersucht, wie Large Language Models synthetische „kulturelle“ Agenten simulieren können, die nicht nur auf westliche Sichtweisen fokussiert sind.
- Beleuchtet kulturelle Verzerrungen und testet, wie gut Modelle unterschiedliche Perspektiven abbilden können.
- Zeigt Potenziale, aber auch Grenzen von LLMs bei der Simulation weniger repräsentierter Bevölkerungsgruppen.
Link: https://arxiv.org/abs/2501.06834
- Eliza: A Web3 friendly AI Agent Operating System
- Präsentiert ein Betriebs-Framework für KI-Agenten, das Web3-Technologien (z. B. Blockchain) einbindet.
- Ermöglicht das sichere und dezentrale Hosting und Ausführen von Agentenfunktionen.
- Bietet Anwendungsfälle für transparente und nachvollziehbare Agenteninteraktionen in verschiedenen Domains.
Link: https://arxiv.org/abs/2501.06781
- AIOpsLab: A Holistic Framework to Evaluate AI Agents for Enabling Autonomous Clouds
- Stellt eine Plattform vor, um KI-Agenten hinsichtlich ihrer Eignung für selbstverwaltende (autonome) Cloud-Umgebungen zu bewerten.
- Deckt vielfältige Metriken wie Effizienz, Skalierbarkeit und Fehlertoleranz ab.
- Dient als Testbed, um Agenten in realitätsnahen Cloud-Szenarien zu erproben und zu vergleichen.
Link: https://arxiv.org/abs/2501.06706
- DVM: Towards Controllable LLM Agents in Social Deduction Games
- Fokus auf der Entwicklung von steuerbaren KI-Agenten für Social-Deduction-Spiele (z. B. Werwolf/Mafia).
- Untersucht, wie Agenten menschliche Kommunikationsmuster erlernen und strategisch täuschen oder argumentieren können.
- Bietet Einblicke in Methoden, um LLM-basierte Agenten mit gezieltem Verhalten zu gestalten.
Link: https://arxiv.org/abs/2501.06695
- Multi-Agent Collaboration Mechanisms: A Survey of LLMs
- Liefert einen Überblick über aktuelle Forschungsansätze, wie Large Language Models in Multi-Agenten-Systemen kooperieren.
- Diskutiert sowohl theoretische Grundlagen als auch praktische Anwendungen, z. B. koordiniertes Problemlösen.
- Hebt Chancen und Herausforderungen bei der Integration von LLMs in Agententeams hervor.
Link: https://arxiv.org/abs/2501.06322
- BioAgents: Democratizing Bioinformatics Analysis with Multi-Agent Systems
- Zeigt, wie Multi-Agenten-Systeme die Bioinformatik-Analyse erleichtern und Forschenden den Zugang zu komplexen Tools ermöglichen.
- Beschreibt eine kollaborative Architektur, bei der KI-Agenten unterschiedliche Analyseaufgaben koordinieren.
- Adressiert sowohl technologische als auch organisatorische Aspekte der Umsetzung.
Link: https://arxiv.org/abs/2501.06243
- Agent TCP/IP: An Agent-to-Agent Transaction System
- Beschreibt ein Kommunikations- und Transaktionsprotokoll speziell für den Austausch zwischen KI-Agenten.
- Greift das TCP/IP-Prinzip auf, um robuste und skalierbare Agenteninteraktionen zu realisieren.
- Könnte den Grundstein für standardisierte, interoperable Agentensysteme legen.
Link: https://arxiv.org/abs/2501.06231
- A Novel Task-Driven Method with Evolvable Interactive Agents Using Event Trees for Enhanced Emergency Decision Support
- Entwickelt ein Verfahren, bei dem Agenten durch „Event Trees“ flexible und anpassungsfähige Strategien für Notfallsituationen erarbeiten.
- Ermöglicht eine dynamische Anpassung der Entscheidungsfindung bei unvorhersehbaren Szenarien.
- Verbessert die Zusammenarbeit mehrerer interaktiver Agenten, um Krisen effizienter zu bewältigen.
Link: https://arxiv.org/abs/2501.06193
- A Multimodal Social Agent
- Präsentiert einen Agenten, der mehrere Modalitäten (z. B. Sprache, Gestik, Mimik) integriert, um in sozialen Kontexten zu agieren.
- Ziel ist eine natürlicher wirkende Interaktion mit Menschen durch umfassende Wahrnehmungs- und Kommunikationsfähigkeiten.
- Erörtert potenzielle Anwendungen in Bereichen wie Begleitrobotik oder virtuellen Assistenten.
Link: https://arxiv.org/abs/2501.06189
Liste der arXiv-Veröffentlichungen zu KI-Agenten 13.01.2025
- Titel: Strategy Masking: A Method for Guardrails in Value-based Reinforcement Learning Agents
- Dieses Paper stellt eine Methode namens „Strategy Masking“ vor, die darauf abzielt, das Verhalten von verstärkungslernenden Agenten zu steuern.
- Es wird gezeigt, wie durch die Maskierung bestimmter Strategien unerwünschtes Verhalten verhindert werden kann.
- Diese Methode hilft, sichere und zuverlässige Agenten in komplexen Umgebungen zu trainieren.
- Strategie Maskierung, Verstärkungslernen, KI-Agenten, Guardrails, Wertbasiertes Lernen, Sicherheitsmechanismen, Agentenverhalten, Maschinenlernen
Link: http://arxiv.org/abs/2501.05501
- Titel: CoDriveVLM: VLM-Enhanced Urban Cooperative Dispatching and Motion Planning for Future Autonomous Mobility on Demand Systems
- Dieses Paper präsentiert CoDriveVLM, ein System, das Visual Language Models (VLMs) zur Verbesserung der kooperativen Dispositions- und Bewegungsplanung nutzt.
- Es zielt darauf ab, die Effizienz und Sicherheit autonomer Mobilitätssysteme in städtischen Gebieten zu verbessern.
- Die Nutzung von VLMs erlaubt eine detailliertere Interpretation von Umgebungsinformationen und eine bessere Planung.
- Autonome Fahrzeuge, Vision-Sprachmodelle, Kooperative Systeme, Bewegungsplanung, KI-Agenten, Mobilitätssysteme, Urbane Planung, Maschinenlernen
Link: http://arxiv.org/abs/2501.06132
- Titel: Towards Developing Socially Compliant Automated Vehicles: State of the Art, Experts Expectations, and A Conceptual Framework
- Dieses Paper untersucht den aktuellen Stand, die Erwartungen von Experten und ein konzeptionelles Rahmenwerk für die Entwicklung sozial konformer, automatisierter Fahrzeuge.
- Es wird analysiert, wie soziale Normen und das Verhalten von Menschen in die Entwicklung von KI-gesteuerten Fahrzeugen integriert werden können.
- Die Arbeit liefert wichtige Erkenntnisse für die Entwicklung von Fahrzeugen, die sich nahtlos in das menschliche Umfeld einfügen.
- Autonome Fahrzeuge, Soziale Konformität, KI-Ethik, KI-Agenten, Mensch-Roboter-Interaktion, Automatisierung, Verkehrssicherheit, Maschinenlernen
Link: http://arxiv.org/abs/2501.06089
- Titel: Real-Time Integrated Dispatching and Idle Fleet Steering with Deep Reinforcement Learning for A Meal Delivery Platform
- Dieses Paper präsentiert einen auf Deep Reinforcement Learning basierenden Ansatz für die Echtzeit-Disposition und Leerlaufsteuerung von Lieferflotten.
- Es wurde speziell für Essenslieferplattformen entwickelt und zielt auf die Optimierung von Lieferzeiten und Ressourcenallokation ab.
- Die Arbeit demonstriert die Wirksamkeit von Deep Reinforcement Learning zur Bewältigung komplexer logistischer Herausforderungen.
- Deep Reinforcement Learning, Logistik, KI-Agenten, Echtzeit-Disposition, Flottensteuerung, Lieferplattformen, Optimierung, Maschinenlernen
Link: http://arxiv.org/abs/2501.05808
- Titel: Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains
- Dieses Paper untersucht die Feinabstimmung von multimodalen Modellen durch selbstständige Verbesserung mithilfe von vielfältigen Denkketten.
- Es wird gezeigt, wie Agenten durch die Analyse ihrer eigenen Fehler und dem Generieren verschiedener Problemlösungsansätze ihre Leistungen verbessern können.
- Diese Methode fördert selbstlernende Fähigkeiten in KI-Agenten.
- Multiagenten-Systeme, Feinabstimmung, Selbstverbesserung, KI-Agenten, Reasoning-Ketten, Multi-Modal-Modelle, Maschinenlernen, Sprachmodellierung
Link: http://arxiv.org/abs/2501.05707
- Titel: Network Diffuser for Placing-Scheduling Service Function Chains with Inverse Demonstration
- Dieses Paper präsentiert einen Netzwerk-Diffusor, der für das Platzieren und Planen von Service Function Chains (SFCs) entwickelt wurde.
- Es nutzt die umgekehrte Demonstration, um die Effizienz und Flexibilität in der Netzwerkplanung zu erhöhen.
- Der Ansatz ermöglicht es KI-Agenten, komplexe Netzwerkkonfigurationen optimal zu gestalten.
- Netzwerkplanung, KI-Agenten, Service Function Chains, Inverse Demonstration, Deep Learning, Optimierung, Ressourcenzuweisung, Maschinenlernen
Link: http://arxiv.org/abs/2501.05673
- Titel: RTLSquad: Multi-Agent Based Interpretable RTL Design
- Dieses Paper stellt RTLSquad vor, ein Multi-Agenten-System für das interpretierbare Design von RTL-Schaltkreisen.
- Es ermöglicht die Erstellung von Hardware-Designs durch die Zusammenarbeit mehrerer KI-Agenten.
- Der Fokus liegt auf der Nachvollziehbarkeit und Interpretierbarkeit der generierten Designs.
- Hardware-Design, Multi-Agenten-Systeme, KI-Agenten, RTL-Design, Interpretierbarkeit, Hardware-Architektur, Softwareentwicklung, Maschinenlernen
Link: http://arxiv.org/abs/2501.05470
Liste der arXiv-Veröffentlichungen zu KI-Agenten 10.01.2025
- Titel: Search-o1: Agentic Search-Enhanced Large Reasoning Models
Link:http://arxiv.org/abs/2501.05366- Dieses Paper stellt Search-o1 vor, ein Framework, das die Fähigkeiten von großen Sprachmodellen mit einem agentenbasierten Suchprozess kombiniert.
- Es zielt darauf ab, die Genauigkeit und Effizienz von großen Modellen in Bezug auf komplexe Denkaufgaben zu verbessern.
- Das Framework integriert die Suche direkt in den Denkprozess, um detailliertere und genauere Antworten zu generieren.
- Titel: ActPC-Geom: Towards Scalable Online Neural-Symbolic Learning via Accelerating Active Predictive Coding with Information Geometry & Diverse Cognitive Mechanisms
Link:http://arxiv.org/abs/2501.04832- Dieses Paper stellt ActPC-Geom vor, einen Ansatz, der aktive prädiktive Codierung mit Methoden der Informationsgeometrie kombiniert.
- Es beschleunigt den Lernprozess und ermöglicht eine skalierbare, online-basierte neuronale-symbolische Lernmethode.
- Das Modell verwendet unterschiedliche kognitive Mechanismen, um die Effizienz und Anpassungsfähigkeit des Lernens zu erhöhen.
- Titel: Constrained Optimization of Charged Particle Tracking with Multi-Agent Reinforcement Learning
Link:http://arxiv.org/abs/2501.05113- Dieses Paper untersucht den Einsatz von Multi-Agenten-Reinforcement Learning zur Optimierung der Verfolgung geladener Teilchen.
- Es wird gezeigt, wie mehrere Agenten zusammenarbeiten können, um die Effizienz und Genauigkeit in diesem herausfordernden Bereich zu verbessern.
- Der Ansatz bietet eine neuartige Lösung für die schwierigen Probleme in der Teilchenphysik.
- Titel: UAV-VLA: Vision-Language-Action System for Large Scale Aerial Mission Generation
Link:http://arxiv.org/abs/2501.05014- Dieses Paper präsentiert ein Vision-Language-Action System (UAV-VLA) für die Erstellung von groß angelegten Luftmissionen.
- Das System integriert Vision, Sprache und Handlung, um komplexe Missionen mit autonomen Drohnen zu planen.
- UAV-VLA ermöglicht die Interpretation von menschlichen Anweisungen und deren Übersetzung in ausführbare Drohnen-Missionen.
- Titel: CuRLA: Curriculum Learning Based Deep Reinforcement Learning for Autonomous Driving
Link:http://arxiv.org/abs/2501.04982- In diesem Paper wird CuRLA vorgestellt, ein Ansatz, der auf Curriculum Learning basiert und mit Deep Reinforcement Learning für autonomes Fahren verwendet wird.
- Es wird demonstriert, wie durch sequentielles Training mit immer schwierigeren Aufgaben die Leistung in anspruchsvollen Umgebungen gesteigert werden kann.
- CuRLA bietet ein strukturiertes Lernverfahren, welches besonders nützlich für die Bewältigung komplexer Fahrsituationen ist.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (09.01.205)
- Titel: InfiGUIAgent: A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
Link:http://arxiv.org/abs/2501.04575- Dieses Paper stellt InfiGUIAgent vor, einen multimodalen Agenten, der für die Interaktion mit grafischen Benutzeroberflächen (GUI) entwickelt wurde.
- Der Agent ist in der Lage, komplexe Aufgaben auf GUIs mithilfe von internem Denken und Reflexion zu erledigen.
- InfiGUIAgent kann verschiedene Eingabeformen verarbeiten, was seine Flexibilität und Einsatzmöglichkeiten erhöht.
- Titel: Research on environment perception and behavior prediction of intelligent UAV based on semantic communication
Link:http://arxiv.org/abs/2501.04480- Das Paper befasst sich mit der Umfelderkennung und Verhaltensvorhersage intelligenter unbemannter Luftfahrzeuge (UAVs) mittels semantischer Kommunikation.
- Es untersucht, wie die Integration semantischer Kommunikation die Fähigkeit von UAVs zur Verarbeitung von Umgebungsdaten verbessern kann.
- Diese Forschung ist entscheidend für die Entwicklung autonomer UAVs, die in komplexen Umgebungen operieren können.
- Titel: Hybrid Artificial Intelligence Strategies for Drone Navigation
Link:http://arxiv.org/abs/2501.04472- Dieses Paper erforscht hybride KI-Strategien für die Navigation von Drohnen, die verschiedene KI-Techniken kombinieren.
- Es wird untersucht, wie die Integration von verschiedenen KI-Ansätzen die Navigationsfähigkeiten von Drohnen verbessern kann.
- Diese hybriden Strategien zielen darauf ab, präzisere und zuverlässigere Drohnenbewegungen zu erreichen.
- Titel: Implementing Systemic Thinking for Automatic Schema Matching: An Agent-Based Modeling Approach
Link:http://arxiv.org/abs/2501.04136- Hier wird ein agentenbasiertes Modell vorgestellt, das systemisches Denken für automatisches Schema-Matching verwendet.
- Das Modell verwendet mehrere Agenten, die zusammenarbeiten, um Datenstrukturen zu vergleichen und zu integrieren.
- Dieser Ansatz ist nützlich, um den Datenaustausch zwischen verschiedenen Systemen zu vereinfachen.
- Titel: Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding
Link:http://arxiv.org/abs/2501.04693- Diese Arbeit untersucht die Feinabstimmung von Robotik-Richtlinien mit heterogenen Sensoren unter Verwendung von Sprachgrundlagen.
- Der Schwerpunkt liegt auf der Kombination visueller und nicht-visueller Sensordaten mit sprachbasierten Anweisungen.
- Das Ziel ist, generalisierte Roboterfähigkeiten für verschiedene Aufgaben zu erreichen.
- Titel: Agent Laboratory: Using LLM Agents as Research Assistants
Link:http://arxiv.org/abs/2501.04227- Das Paper schlägt vor, große Sprachmodell-Agenten als Forschungshilfen zu nutzen.
- Es untersucht, wie diese Agenten verschiedene Aufgaben in Forschungsprojekten unterstützen können.
- Der Fokus liegt auf der Verbesserung der Effizienz und Produktivität von Forschungsprozessen.
- Titel: GNN-based Decentralized Perception in Multirobot Systems for Predicting Worker Actions
Link: http://arxiv.org/abs/2501.04193
Dieses Paper untersucht den Einsatz von Graph Neural Networks (GNNs) für die dezentrale Wahrnehmung in Multi-Roboter-Systemen.
Der Schwerpunkt liegt auf der Vorhersage des Verhaltens von Arbeitern durch den Einsatz von GNNs auf der Grundlage von Daten, die von mehreren Robotern erfasst wurden. Die entwickelte Lösung bietet eine Möglichkeit zur Verbesserung der Sicherheit und Effizienz in kooperativen robotischen Umgebungen. - Titel: HIVEX: A High-Impact Environment Suite for Multi-Agent Research (extended version)
Link:http://arxiv.org/abs/2501.04180- Diese Arbeit präsentiert HIVEX, eine umfassende Umgebungssuite für die Mehragentenforschung.
- Die Suite umfasst Tools und Ressourcen, um komplexe Szenarien für die Erforschung des Verhaltens und der Interaktionen von Mehragentensystemen zu simulieren.
- HIVEX fördert die Entwicklung und Validierung fortschrittlicher Mehragentensysteme.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.01.2025)
1. Titel: PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
Link: https://arxiv.org/abs/2501.03936
o Dieses Paper präsentiert einen KI-Agenten namens PPTAgent, der Präsentationen über das bloße Umwandeln von Text in Folien hinaus generiert. Es behandelt auch die Bewertung solcher generierten Präsentationen. Es werden neue Methoden für die Inhaltsgestaltung und visuelle Anpassung von Präsentationen vorgestellt.
2. Titel: Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
Link: https://arxiv.org/abs/2501.03916
o Das Paper stellt Dolphin vor, einen KI-Agenten, der in der Lage ist, eigenständig und in einem geschlossenen Kreislauf zu forschen. Dolphin nutzt dabei Denken, Ausprobieren und Feedback, um neue Erkenntnisse zu gewinnen. Der Agent zielt darauf ab, den Forschungsprozess durch Automatisierung zu beschleunigen und neue Möglichkeiten zu eröffnen.
3. Titel: Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies
Link: https://arxiv.org/abs/2501.03888
o Das Paper beschreibt einen neuro-symbolischen Ansatz namens Neural DNF-MT, der das Lernen von interpretierbaren und editierbaren Richtlinien ermöglicht. Es kombiniert neuronale Netze mit Disjunktiver Normalform (DNF), um eine klare und nachvollziehbare Politik zu entwickeln. Der Ansatz ist insbesondere für die KI-Planung von Bedeutung.
4. Titel: Online Reinforcement Learning-Based Dynamic Adaptive Evaluation Function for Real-Time Strategy Tasks
Link: https://arxiv.org/abs/2501.03824
o Dieses Paper präsentiert eine Methode für das Online-Reinforcement-Learning, um dynamische und adaptive Bewertungsfunktionen für Echtzeit-Strategieaufgaben zu entwickeln. Die Methode erlaubt es KI-Agenten, sich an veränderte Spielbedingungen anzupassen und ihre Leistung kontinuierlich zu verbessern. Es zeigt vielversprechende Ergebnisse in der Verwendung für komplexe Strategien.
5. Titel: Neural Deconstruction Search for Vehicle Routing Problems
Link: https://arxiv.org/abs/2501.03715
o Das Paper präsentiert eine neue Methode namens „Neural Deconstruction Search“ für Fahrzeugroutenplanungsprobleme. Es verwendet neuronale Netze, um komplexe Routen zu zerlegen und effizientere Lösungen zu finden. Die Methodik verbessert die Optimierung für logistische Herausforderungen.
6. Titel: SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving
Link: https://arxiv.org/abs/2501.03535
o Dieses Paper stellt SenseRAG vor, einen Ansatz zum Aufbau von Umgebungs-Wissensdatenbanken für das autonome Fahren mit LLMs. Es nutzt proaktive Abfragen, um relevante Informationen zu sammeln und die Entscheidungsfindung des Fahrzeugs zu verbessern. Der Ansatz zielt darauf ab, die Sicherheit und Zuverlässigkeit des autonomen Fahrens zu erhöhen.
7. Titel: VLM-driven Behavior Tree for Context-aware Task Planning
Link: https://arxiv.org/abs/2501.03968
o Das Paper beschreibt die Verwendung von Vision-Language-Modellen (VLMs) zur Steuerung von Verhaltensbäumen für kontextbezogene Aufgabenplanung. Die Kombination von visueller und sprachlicher Verarbeitung ermöglicht es Robotern, komplexere Aufgaben in dynamischen Umgebungen auszuführen. Der Ansatz erweitert die Fähigkeit von Robotern zur intelligenten Interaktion.
8. Titel: Exploring the Potential of Large Language Models in Public Transportation: San Antonio Case Study
Link: https://arxiv.org/abs/2501.03904
o Dieses Paper untersucht das Potenzial großer Sprachmodelle (LLMs) im öffentlichen Verkehr anhand einer Fallstudie in San Antonio. Es zeigt, wie LLMs zur Verbesserung von Planung, Kundenservice und Effizienz beitragen können. Die Studie beleuchtet vielversprechende Anwendungen für den städtischen Nahverkehr.
9. Titel: Explainable Reinforcement Learning via Temporal Policy Decomposition
Link: https://arxiv.org/abs/2501.03902
o Das Paper stellt eine Methode zur Erklärung von Reinforcement Learning (RL) vor, die auf einer temporären Richtlinienzerlegung basiert. Die Methode zerlegt komplexe RL-Strategien in verständlichere Einzelteile, um die Entscheidungsfindung von KI-Agenten transparenter zu machen. Der Ansatz verbessert das Verständnis für das Verhalten von RL-Agenten.
10. Titel: Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities
Link: https://arxiv.org/abs/2501.03566
o Dieses Paper untersucht die Herausforderungen und Chancen bei der Verwendung von großen Sprachmodellen (LLMs) in der unternehmensweiten Modellierung auf der Basis von Wissensgraphen. Es untersucht, wie LLMs zur Automatisierung der Modellerstellung, Datenintegration und Inferenz genutzt werden können. Der Artikel beleuchtet die Potenziale und Herausforderungen bei der Anwendung moderner KI-Technologien.
11. Titel: Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
Link: https://arxiv.org/abs/2501.03562
o Das Paper beleuchtet die Rolle der Richtlinienverteilung in adversarialen Angriffen im Bereich des Reinforcement Learnings. Es analysiert, wie Angreifer die Richtlinienverteilung manipulieren können, um die Leistung von RL-Agenten zu beeinträchtigen. Der Artikel bietet neue Einsichten in die Verwundbarkeit von RL-Systemen.
12. Titel: Self-Adaptive ERP: Embedding NLP into Petri-Net creation and Model Matching
Link: https://arxiv.org/abs/2501.03795
* Dieses Paper präsentiert ein selbstadaptives ERP-System (Enterprise Resource Planning), das NLP (Natural Language Processing) in die Erstellung von Petri-Netzen und den Modellabgleich integriert. Es wird aufgezeigt wie NLP-Techniken zur Automatisierung und Verbesserung der Modellierungs- und Anpassungsfähigkeit von ERP-Systemen eingesetzt werden können. Das Paper bietet eine innovative Perspektive auf die Integration von KI in Geschäftsprozesse.
13. Titel: A Soft Sensor Method with Uncertainty-Awareness and Self-Explanation Based on Large Language Models Enhanced by Domain Knowledge Retrieval
Link: https://arxiv.org/abs/2501.03295
- Dieses Paper stellt eine Softsensor-Methode vor, die Unsicherheiten berücksichtigt und sich durch den Einsatz von großen Sprachmodellen (LLMs) selbst erklären kann. Es nutzt Retrieval-Methoden, um domänenspezifisches Wissen einzubinden und die Vorhersagegenauigkeit zu verbessern. Die Methode bietet mehr Transparenz und Zuverlässigkeit bei der Datenanalyse.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (08.Januar 2025)
- Titel: InfiGUIAgent: A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
Link:arXiv:2501.04575
Beschreibung:- Dieses Paper stellt einen multimodalen GUI-Agenten namens InfiGUIAgent vor, der in der Lage ist, mit grafischen Benutzeroberflächen zu interagieren.
- Der Agent verwendet native Reasoning- und Reflexionsfähigkeiten, um seine Interaktionen zu steuern.
- Das Ziel ist die Entwicklung eines universellen Agenten für verschiedene Aufgaben, die eine GUI-Interaktion erfordern.
- Titel: Implementing Systemic Thinking for Automatic Schema Matching: An Agent-Based Modeling Approach
Link:arXiv:2501.04136
Beschreibung:- Dieses Paper befasst sich mit der automatischen Schema-Abstimmung durch eine Agenten-basierte Modellierung.
- Es wird ein systemischer Ansatz zur Lösung dieses Problems vorgestellt, der die komplexen Beziehungen zwischen verschiedenen Datenschemata berücksichtigt.
- Das Ziel ist eine präzisere und flexiblere Methode für das Schema-Matching.
- Titel: Agent Laboratory: Using LLM Agents as Research Assistants
Link:arXiv:2501.04227
Beschreibung:- Das Paper präsentiert „Agent Laboratory“, ein System, das LLM-basierte Agenten als Forschungsassistenten nutzt.
- Diese Agenten können bei Aufgaben wie Literaturrecherche und Datenanalyse helfen.
- Das System zielt darauf ab, die Effizienz und den Output von Forschung zu verbessern.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (07.Januar 2025)
- Titel: PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
Link:https://arxiv.org/abs/2501.03936- Dieses Paper präsentiert einen KI-Agenten namens PPTAgent, der Präsentationen über das bloße Umwandeln von Text in Folien hinaus generiert. Es behandelt auch die Bewertung solcher generierten Präsentationen. Es werden neue Methoden für die Inhaltsgestaltung und visuelle Anpassung von Präsentationen vorgestellt.
- Titel: Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
Link:https://arxiv.org/abs/2501.03916- Das Paper stellt Dolphin vor, einen KI-Agenten, der in der Lage ist, eigenständig und in einem geschlossenen Kreislauf zu forschen. Dolphin nutzt dabei Denken, Ausprobieren und Feedback, um neue Erkenntnisse zu gewinnen. Der Agent zielt darauf ab, den Forschungsprozess durch Automatisierung zu beschleunigen und neue Möglichkeiten zu eröffnen.
- Titel: Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies
Link:https://arxiv.org/abs/2501.03888- Das Paper beschreibt einen neuro-symbolischen Ansatz namens Neural DNF-MT, der das Lernen von interpretierbaren und editierbaren Richtlinien ermöglicht. Es kombiniert neuronale Netze mit Disjunktiver Normalform (DNF), um eine klare und nachvollziehbare Politik zu entwickeln. Der Ansatz ist insbesondere für die KI-Planung von Bedeutung.
- Titel: Online Reinforcement Learning-Based Dynamic Adaptive Evaluation Function for Real-Time Strategy Tasks
Link:https://arxiv.org/abs/2501.03824- Dieses Paper präsentiert eine Methode für das Online-Reinforcement-Learning, um dynamische und adaptive Bewertungsfunktionen für Echtzeit-Strategieaufgaben zu entwickeln. Die Methode erlaubt es KI-Agenten, sich an veränderte Spielbedingungen anzupassen und ihre Leistung kontinuierlich zu verbessern. Es zeigt vielversprechende Ergebnisse in der Verwendung für komplexe Strategien.
- Titel: Neural Deconstruction Search for Vehicle Routing Problems
Link:https://arxiv.org/abs/2501.03715- Das Paper präsentiert eine neue Methode namens „Neural Deconstruction Search“ für Fahrzeugroutenplanungsprobleme. Es verwendet neuronale Netze, um komplexe Routen zu zerlegen und effizientere Lösungen zu finden. Die Methodik verbessert die Optimierung für logistische Herausforderungen.
- Titel: SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving
Link:https://arxiv.org/abs/2501.03535- Dieses Paper stellt SenseRAG vor, einen Ansatz zum Aufbau von Umgebungs-Wissensdatenbanken für das autonome Fahren mit LLMs. Es nutzt proaktive Abfragen, um relevante Informationen zu sammeln und die Entscheidungsfindung des Fahrzeugs zu verbessern. Der Ansatz zielt darauf ab, die Sicherheit und Zuverlässigkeit des autonomen Fahrens zu erhöhen.
- Titel: VLM-driven Behavior Tree for Context-aware Task Planning
Link:https://arxiv.org/abs/2501.03968- Das Paper beschreibt die Verwendung von Vision-Language-Modellen (VLMs) zur Steuerung von Verhaltensbäumen für kontextbezogene Aufgabenplanung. Die Kombination von visueller und sprachlicher Verarbeitung ermöglicht es Robotern, komplexere Aufgaben in dynamischen Umgebungen auszuführen. Der Ansatz erweitert die Fähigkeit von Robotern zur intelligenten Interaktion.
- Titel: Exploring the Potential of Large Language Models in Public Transportation: San Antonio Case Study
Link:https://arxiv.org/abs/2501.03904- Dieses Paper untersucht das Potenzial großer Sprachmodelle (LLMs) im öffentlichen Verkehr anhand einer Fallstudie in San Antonio. Es zeigt, wie LLMs zur Verbesserung von Planung, Kundenservice und Effizienz beitragen können. Die Studie beleuchtet vielversprechende Anwendungen für den städtischen Nahverkehr.
- Titel: Explainable Reinforcement Learning via Temporal Policy Decomposition
Link:https://arxiv.org/abs/2501.03902- Das Paper stellt eine Methode zur Erklärung von Reinforcement Learning (RL) vor, die auf einer temporären Richtlinienzerlegung basiert. Die Methode zerlegt komplexe RL-Strategien in verständlichere Einzelteile, um die Entscheidungsfindung von KI-Agenten transparenter zu machen. Der Ansatz verbessert das Verständnis für das Verhalten von RL-Agenten.
- Titel: Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities
Link:https://arxiv.org/abs/2501.03566- Dieses Paper untersucht die Herausforderungen und Chancen bei der Verwendung von großen Sprachmodellen (LLMs) in der unternehmensweiten Modellierung auf der Basis von Wissensgraphen. Es untersucht, wie LLMs zur Automatisierung der Modellerstellung, Datenintegration und Inferenz genutzt werden können. Der Artikel beleuchtet die Potenziale und Herausforderungen bei der Anwendung moderner KI-Technologien.
- Titel: Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
Link:https://arxiv.org/abs/2501.03562- Das Paper beleuchtet die Rolle der Richtlinienverteilung in adversarialen Angriffen im Bereich des Reinforcement Learnings. Es analysiert, wie Angreifer die Richtlinienverteilung manipulieren können, um die Leistung von RL-Agenten zu beeinträchtigen. Der Artikel bietet neue Einsichten in die Verwundbarkeit von RL-Systemen.
- Titel: Self-Adaptive ERP: Embedding NLP into Petri-Net creation and Model Matching
Link: https://arxiv.org/abs/2501.03795
* Dieses Paper präsentiert ein selbstadaptives ERP-System (Enterprise Resource Planning), das NLP (Natural Language Processing) in die Erstellung von Petri-Netzen und den Modellabgleich integriert. Es wird aufgezeigt wie NLP-Techniken zur Automatisierung und Verbesserung der Modellierungs- und Anpassungsfähigkeit von ERP-Systemen eingesetzt werden können. Das Paper bietet eine innovative Perspektive auf die Integration von KI in Geschäftsprozesse. - Titel: A Soft Sensor Method with Uncertainty-Awareness and Self-Explanation Based on Large Language Models Enhanced by Domain Knowledge Retrieval
Link: https://arxiv.org/abs/2501.03295
- Dieses Paper stellt eine Softsensor-Methode vor, die Unsicherheiten berücksichtigt und sich durch den Einsatz von großen Sprachmodellen (LLMs) selbst erklären kann. Es nutzt Retrieval-Methoden, um domänenspezifisches Wissen einzubinden und die Vorhersagegenauigkeit zu verbessern. Die Methode bietet mehr Transparenz und Zuverlässigkeit bei der Datenanalyse.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (06.Januar 2025)
- SDPO: Segment-Level Direct Preference Optimization for Social Agents
Link:https://arxiv.org/abs/2501.01821- Dieses Paper stellt eine neue Methode vor, die Präferenzoptimierung segmentweise angeht, um das Verhalten sozialer KI-Agenten anzupassen.
- Dabei berücksichtigt sie die individuellen Präferenzen in verschiedenen Handlungskontexten.
- Ziel ist, Agenten zu entwickeln, die flexibler und anpassungsfähiger auf Interaktionen reagieren.
- Proposing Hierarchical Goal-Conditioned Policy Planning in Multi-Goal Reinforcement Learning
Link:https://arxiv.org/abs/2501.01727- Dieses Paper führt ein hierarchisches Verfahren ein, das Agenten unterstützt, mehrere Ziele im Reinforcement Learning parallel anzugehen.
- Es kombiniert eine Planungs- mit einer Lernkomponente, um hochkomplexe Aufgaben zu meistern.
- Damit sollen KI-Agenten effizienter und koordinierter auf unterschiedliche Ziele hin trainiert werden.
- AgentRefine: Enhancing Agent Generalization through Refinement Tuning
Link:https://arxiv.org/abs/2501.01702- Diese Arbeit beschreibt ein Verfahren namens “Refinement Tuning”, das die Generalisierungsfähigkeit von KI-Agenten verbessern soll.
- Der Ansatz baut auf bereits trainierten Agenten auf und verfeinert deren Strategien in neuen Umgebungen.
- Dadurch können Agenten robuster und anpassungsfähiger auf variierende Aufgabenstellungen reagieren.
- BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems
Link:https://arxiv.org/abs/2501.01593- Dieses Paper analysiert eine Backdoor-Angriffsstrategie in kooperativen Multi-Agenten-Systemen für Deep Reinforcement Learning.
- Es zeigt auf, wie bösartige Modifikationen unbemerkt eingestreut werden können, um das Gesamtsystem zu manipulieren.
- Die Studie verdeutlicht damit Schwachstellen und liefert zugleich Hinweise zum Schutz vor solchen Angriffen.
- QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture
Link:https://arxiv.org/abs/2501.01892- Dieses Werk stellt ein neues Datenset namens “QuArch” vor, das KI-Agenten beim Verständnis von Computerarchitektur unterstützen soll.
- Es beinhaltet Fragen und Antworten zu technischen Details und Konzepten aus der Hardware-Architektur.
- Ziel ist es, KI-Agenten zu befähigen, komplexe Sachverhalte in der Computerarchitektur korrekt zu interpretieren und zu beantworten.
- Multi-Agent Conversational Online Learning for Adaptive LLM Response Identification
Link:https://arxiv.org/abs/2501.01849- In dieser Arbeit wird ein Mehr-Agenten-Ansatz vorgestellt, der laufend von Nutzerinteraktionen lernt, um bessere Antworten großer Sprachmodelle zu identifizieren.
- Dabei kommunizieren die Agenten untereinander, um Kontexte und Nutzerrückmeldungen gemeinsam auszuwerten.
- So sollen KI-Systeme anpassungsfähiger und nutzerzentrierter reagieren können.
- MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
Link:https://arxiv.org/abs/2501.01834- Dieses Paper schlägt einen agentenbasierten Ansatz vor, bei dem verschiedene Modelle für das Bildunterschreiben (Image Captioning) zusammenarbeiten.
- Ein spezieller Agent kümmert sich um fein abgestimmte, kontextbezogene Beschreibungen, während ein allgemeiner Agent universell einsetzbare Bildunterschriften generiert.
- Durch ihre Zusammenarbeit wird eine höhere Qualität und Vielfalt der generierten Bildbeschreibungen erzielt.
- Goal Recognition using Actor-Critic Optimization
Link:https://arxiv.org/abs/2501.01463- Das Paper behandelt ein Verfahren, um mithilfe von Actor-Critic-Methoden die Ziele eines beobachteten Agenten schnell zu erkennen.
- Dabei werden unvollständige oder teilweise Beobachtungen ausgewertet, um Rückschlüsse auf das wahrscheinliche Ziel des Agenten zu ziehen.
- Dieses Vorgehen erleichtert unter anderem die Anpassung kooperativer oder kompetitiver Strategien gegenüber anderen KI-Agenten.
Liste der arXiv-Veröffentlichungen zu KI-Agenten (03. Januar 2025):
- Titel:Aviary: training language agents on challenging scientific tasks
- Link: https://arxiv.org/abs/2412.21154
- Beschreibung:
- Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
- Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
- Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
- Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
- Link: https://arxiv.org/abs/2412.20977
- Beschreibung:
- UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
- Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
- Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
- Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
- Link: https://arxiv.org/abs/2412.20505
- Beschreibung:
- Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
- Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
- Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
- Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
- Link: https://arxiv.org/abs/2412.20271
- Beschreibung:
- Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
- Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
- Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
- Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- Link: https://arxiv.org/abs/2412.20024
- Beschreibung:
- BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
- Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
- Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
- Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
- Link: https://arxiv.org/abs/2412.21102
- Beschreibung:
- Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
- Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
- Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
- Titel:Plancraft: an evaluation dataset for planning with LLM agents
- Link: https://arxiv.org/abs/2412.21033
- Beschreibung:
- Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.
- Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
- Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
- Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
- Link: https://arxiv.org/abs/2412.20519
- Beschreibung:
- Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
- Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
- Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
- Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
- Link: https://arxiv.org/abs/2412.20429
- Beschreibung:
- Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
- Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
- Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
- Titel:Safe Multiagent Coordination via Entropic Exploration
- Link: https://arxiv.org/abs/2412.20361
- Beschreibung:
- Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
- Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
- Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
- Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
- Link: https://arxiv.org/abs/2412.20138
- Beschreibung:
- Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
- Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
- Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
- Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
- Link: https://arxiv.org/abs/2412.20127
- Beschreibung:
- M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
- Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
- Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
- Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
- Link: https://arxiv.org/abs/2412.20005
- Beschreibung:
- OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
- Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
- OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
- Titel:Can Large Language Models Adapt to Other Agents In-Context?
- Link: https://arxiv.org/abs/2412.19726
- Beschreibung:
- Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
- Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
- Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
- Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
- Link: https://arxiv.org/abs/2412.19723
- Beschreibung:
- OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
- Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
- Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
- Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
- Link: https://arxiv.org/abs/2412.19562
- Beschreibung:
- Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
- Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
- Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
- Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
- Link: https://arxiv.org/abs/2412.19064
- Beschreibung:
- Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
- Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
- Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
- Titel:TravelAgent: Generative Agents in the Built Environment
- Link: https://arxiv.org/abs/2412.18985
- Beschreibung:
- TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
- Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
- Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
- Titel:GAI: Generative Agents for Innovation
- Link: https://arxiv.org/abs/2412.18899
- Beschreibung:
- Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
- Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
- Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
- Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
- Link: https://arxiv.org/abs/2412.18697
- Beschreibung:
- Nutzt ein Multi-Agenten-System mit LLMs, um bestimmte Aspekte der digitalen Justiz transparent und vertrauenswürdig abzubilden.
- Die Arbeit zielt darauf ab, die Transparenz und das Vertrauen in die digitale Justiz zu stärken.
- Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
- Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
- Link: https://arxiv.org/abs/2412.18454
- Beschreibung:
- Diese Arbeit untersucht die Normwahrnehmung und -induktion durch Multi-Agenten-Systeme im verteilten Gesundheitswesen.
- Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
- Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
- Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
- Link: https://arxiv.org/abs/2412.18428
- Beschreibung:
- Hier wird ein LLM-Agent zur multimodalen Datenexploration durch natürliche Sprache vorgestellt.
- Das System ermöglicht es, verschiedene Datenmodalitäten zu durchsuchen, abzufragen und besser zu verstehen.
- Die Arbeit verbessert die Zugänglichkeit zu komplexen Datensätzen.
- Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
- Link: https://arxiv.org/abs/2412.18426
- Beschreibung:
- Stellt einen Benchmark bereit, um automatisierte Test-Agenten für grafische User-Interfaces (GUI) zu entwickeln und zu testen.
- Die Benchmark zielt darauf ab, die Entwicklung effizienterer und effektiverer Testmethoden zu fördern.
- Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
- Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
- Link: https://arxiv.org/abs/2412.18293
- Beschreibung:
- Bietet eine vereinfachte Entwicklungsumgebung, um KI-Agenten in Minecraft zu erstellen und zu evaluieren.
- Das Paket stellt eine Reihe von Tools und Ressourcen bereit, die den Entwicklungsprozess erleichtern.
- MineStudio soll die Anwendung von KI in Spielen durch benutzerfreundliche Tools ermöglichen.
- Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
- Link: https://arxiv.org/abs/2412.18111
- Beschreibung:
- Zeigt, wie man GUI-Agenten durch Code-Generierung verbessert, unter Nutzung eines „SLM“-Ansatzes (vermutlich specialized LLM).
- Der Fokus liegt auf der Effizienz von SLMs für GUI-bezogene Aufgaben.
- Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
- Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
- Link: https://arxiv.org/abs/2412.17964
- Beschreibung:
- Dieses Paper beschreibt den Einsatz von LLMs für die dynamische Multi-Agenten-Orchestrierung in Q&A-Systemen, die verschiedene Datenquellen nutzen.
- Die Agenten arbeiten zusammen, um Aufgaben koordiniert zu bearbeiten und Informationen aus verschiedenen Quellen abzurufen.
- Die Arbeit zeigt, dass die Leistung und Effizienz solcher Systeme durch die Zusammenarbeit gesteigert wird.
- Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
- Link: https://arxiv.org/abs/2412.17942
- Beschreibung:
- Beschreibt ein QA-System, bei dem LLMs und mehrere Agenten Dokumente und Datenbanken gemeinsam nutzen, um Fragen zu beantworten.
- Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
- Diese Arbeit demonstriert, wie leistungsfähige Q&A-Systeme durch die Kombination von LLM- und Agenten-Technologien realisiert werden können.
- Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
- Link: https://arxiv.org/abs/2412.18601
- Beschreibung:
- Diskutiert „Embodied AI Agents“ für GameFi-Ökosysteme, bei denen DeFi und virtuelle Umgebungen verschmelzen.
- Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
- Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
- Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
- Link: https://arxiv.org/abs/2412.18588
- Beschreibung:
- Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
- Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
*Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
- Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
* Link:https://arxiv.org/abs/2412.17288
* Beschreibung:
* Die Forschung in diesem Paper konzentriert sich auf multimodale, geerdete Planung und effiziente Neuplanung für das Lernen von Embodied Agents mit wenigen Beispielen.- Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern.
- Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.
- Titel:A3: Android Agent Arena for Mobile GUI Agents
- Link: https://arxiv.org/abs/2501.01149
- Beschreibung:
- Ein Toolkit und Framework, das Agenten für Android-GUIs trainiert und testet, um automatisierte Bedienung und Interaktion auf mobilen Apps zu ermöglichen.
- Die Plattform dient als standardisierte Umgebung für die Forschung in diesem Bereich.
- Es ermöglicht die Entwicklung effizienterer und robusterer Agenten für mobile Geräte.
- Titel:Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform
* Link:https://arxiv.org/abs/2501.00750
* Beschreibung:
* Beschreibt den Einsatz von Multi-Agenten-Systemen (gestützt durch multimodale LLMs) über eine No-Code-Lösung.- Ermöglicht die Automatisierung komplexer multimodaler Aufgaben ohne tiefgehende Programmierkenntnisse.
* Die Forschung zielt auf eine breitere Anwendung von LLMs in Multi-Agenten-Systemen ab.
- Ermöglicht die Automatisierung komplexer multimodaler Aufgaben ohne tiefgehende Programmierkenntnisse.
- Titel:PIMAEX: Multi-Agent Exploration through Peer Incentivization
* Link:https://arxiv.org/abs/2501.01266- Beschreibung:
- Ein Multi-Agenten-Rahmenwerk, in dem Agenten sich gegenseitig motivieren, Explorationsaufgaben auszuführen.
- Durch die peer-basierte Motivation sollen bessere Ergebnisse erzielt und eine effektivere Exploration erreicht werden.
* Die Studie leistet einen wichtigen Beitrag zum Multi-Agenten-Lernen.
- Beschreibung:
- Titel:Harnessing Multi-Agent LLMs for Complex Engineering Problem-Solving: A Framework for Senior Design Projects
- Link: https://arxiv.org/abs/2501.01205
- Beschreibung:
- Stellt einen Multi-Agenten-Ansatz (basierend auf LLMs) vor, um hochkomplexe technische Aufgaben und Projektarbeit im akademischen Umfeld zu unterstützen.
- Ziel ist es, durch die Nutzung von LLMs die Zusammenarbeit bei komplexen Ingenieursprojekten zu verbessern.
- Die Studie demonstriert die Anwendbarkeit von LLMs in praktischen Szenarien.
- Titel:Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things
- Link:https://arxiv.org/abs/2501.00891
- Beschreibung:
- Dieses Paper beschreibt eine Multi-Agenten-Lösung mit LLMs für die Verarbeitung komplexer Ereignisse in IoT-Umgebungen.
- Die Agenten kooperieren dabei, um relevante Ereignisse zu identifizieren und zu analysieren.
- Diese Forschung leistet einen Beitrag zur intelligenten Verarbeitung von Daten aus dem Internet der Dinge.
- Beschreibung:
- Link:https://arxiv.org/abs/2501.00891
- Titel:AI Agent for Education: von Neumann Multi-Agent System Framework
- Link: https://arxiv.org/abs/2501.00083
* Beschreibung: - Ein Multi-Agenten-System-Framework, das speziell für den Bildungsbereich entwickelt wurde und den Ansatz eines „von-Neumann-Systems“ verfolgt.
- Ziel ist es, durch KI-Agenten Lehre und Lernen zu personalisieren und zu unterstützen.
- Das System bietet einen vielseitigen Rahmen für die Entwicklung von KI-gestützten Lernsystemen.
- Link: https://arxiv.org/abs/2501.00083
Liste der arXiv-Veröffentlichungen zu KI-Agenten (02. Januar 2025):
- Titel:Aviary: training language agents on challenging scientific tasks
- Link: https://arxiv.org/abs/2412.21154
- Beschreibung:
- Dieses Paper präsentiert Aviary, eine Plattform, die speziell darauf ausgerichtet ist, Sprachagenten in anspruchsvollen wissenschaftlichen Bereichen zu trainieren.
- Aviary nutzt eine Kombination aus neuen Trainingsmethoden und einer speziell kuratierten Aufgabenvielfalt, um die Fähigkeiten der Agenten zu verbessern.
- Die Experimente zeigen, dass mit Aviary trainierte Sprachagenten eine signifikant bessere Leistung in komplexen wissenschaftlichen Aufgaben erzielen als andere Ansätze.
- Titel:UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI
- Link: https://arxiv.org/abs/2412.20977
- Beschreibung:
- UnrealZoo ist eine neue Plattform, die es ermöglicht, hochrealistische virtuelle Umgebungen für das Training von Embodied AI-Agenten zu erstellen.
- Die Plattform bietet eine Vielfalt an Umgebungen, die von einfachen Szenarien bis hin zu komplexen, lebensnahen Settings reichen.
- Durch die Nutzung fotorealistischer Umgebungen sollen die Agenten besser auf reale Aufgaben vorbereitet werden.
- Titel:Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning
- Link: https://arxiv.org/abs/2412.20505
- Beschreibung:
- Dieses Paper stellt ein Multi-Agenten-Framework vor, das auf Large Language Models (LLMs) basiert und für die zyklische Stadtplanung konzipiert wurde.
- Das Framework integriert Planungs-, Lebens- und Bewertungsaspekte, um einen iterativen Planungsprozess zu ermöglichen.
- Die Ergebnisse deuten darauf hin, dass LLMs in einem Multiagenten-System effektiv zur Lösung von Herausforderungen in der Stadtplanung genutzt werden können.
- Titel:High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence
- Link: https://arxiv.org/abs/2412.20271
- Beschreibung:
- Diese Studie untersucht, wie sich das Teilen episodischer Erinnerungen auf das soziale Lernen und die kollaborative Futtersuche von KI-Agenten auswirkt.
- Durch den Austausch von Gedächtnisinhalten können Agenten ihre Zusammenarbeit verbessern und effizienter zusammenarbeiten.
- Die Forschungsergebnisse legen nahe, dass eine gemeinsame Erinnerungsbasis die mnemotechnische Konvergenz fördert und somit das kollaborative Lernen optimiert.
- Titel:BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters
- Link: https://arxiv.org/abs/2412.20024
- Beschreibung:
- BaiJia ist ein umfangreiches Korpus, das für das Training und die Evaluation von Rollenspiel-KI-Agenten mit chinesischen historischen Figuren entwickelt wurde.
- Das Korpus umfasst detaillierte Beschreibungen und Dialoge, die es den Agenten ermöglichen, glaubwürdige historische Persönlichkeiten darzustellen.
- Diese Ressource soll die Forschung im Bereich der personalisierten und kulturell sensiblen KI-Interaktion fördern.
- Titel:Exploring and Controlling Diversity in LLM-Agent Conversation
- Link: https://arxiv.org/abs/2412.21102
- Beschreibung:
* Diese Arbeit untersucht Methoden zur Messung und Steuerung der inhaltlichen Vielfalt in Gesprächen, die von LLM-basierten Agenten geführt werden.
* Es werden verschiedene Ansätze vorgestellt, um die Diversität von Konversationen zu erhöhen oder zu reduzieren, je nach Anwendungsfall.
* Die Ergebnisse deuten darauf hin, dass eine gezielte Steuerung der Diversität die Qualität und Relevanz von Agenten-Konversationen verbessern kann.
- Titel:Plancraft: an evaluation dataset for planning with LLM agents
- Link: https://arxiv.org/abs/2412.21033
- Beschreibung:
* Plancraft ist ein neuer Datensatz, der speziell für die Bewertung der Planungsfähigkeiten von LLM-basierten Agenten entwickelt wurde.- Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
* Plancraft soll als Standard-Benchmark für die Forschung im Bereich des Planens mit LLMs dienen.
- Der Datensatz enthält eine Reihe komplexer Aufgaben, die von den Agenten erfordern, detaillierte Handlungsabläufe zu entwerfen.
- Titel:Game Theory and Multi-Agent Reinforcement Learning: From Nash Equilibria to Evolutionary Dynamics
- Link: https://arxiv.org/abs/2412.20519
- Beschreibung:
- Dieses Paper bietet einen Überblick über die Grundlagen der Spieltheorie und deren Anwendung auf Multi-Agenten Reinforcement Learning.
- Es werden verschiedene Methoden und Algorithmen vorgestellt, die von Nash-Gleichgewichten bis zur evolutionären Dynamik reichen.
* Die Arbeit bietet sowohl theoretische als auch praktische Einblicke in die Gestaltung kooperativer und kompetitiver Multi-Agenten-Systeme.
- Titel:Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
- Link: https://arxiv.org/abs/2412.20429
- Beschreibung:
- Dieses Paper untersucht, wie humanoide Roboter durch Multi-Modal-Reasoning eine höhere kognitive Autonomie erreichen können.
- Der Fokus liegt auf der Fähigkeit der Roboter, über verschiedene Szenarien hinweg zu schlussfolgern und zu verstehen.
- Es wird ein Ansatz vorgestellt, der es Robotern ermöglicht, multimodale Eingaben zu integrieren und flexible Entscheidungen zu treffen.
- Titel:Safe Multiagent Coordination via Entropic Exploration
- Link: https://arxiv.org/abs/2412.20361
- Beschreibung:
- Dieses Paper präsentiert einen Ansatz, um die sichere Koordination von Multi-Agenten-Systemen durch die Nutzung von Entropie-basierter Exploration zu verbessern.
- Es wird gezeigt, dass die kontrollierte Zufallsexploration das Risiko unkoordinierter Aktionen minimieren und gleichzeitig die Zusammenarbeit fördern kann.
- Die Arbeit bietet eine vielversprechende Methode, um sichere und effiziente Multi-Agenten-Systeme zu entwickeln.
- Titel:TradingAgents: Multi-Agents LLM Financial Trading Framework
- Link: https://arxiv.org/abs/2412.20138
- Beschreibung:
- Dieses Paper stellt TradingAgents vor, ein Framework, das LLMs nutzt, um Multi-Agenten-Systeme für den Finanzhandel zu entwickeln.
- Das Framework ermöglicht es, verschiedene Handelsstrategien zu testen und ihre Leistung in simulierten Marktszenarien zu bewerten.
- Durch die Verwendung mehrerer Agenten kann eine robustere und vielseitigere Handelsstrategie erreicht werden.
- Titel:M-MAD: Multidimensional Multi-Agent Debate Framework for Fine-grained Machine Translation Evaluation
- Link: https://arxiv.org/abs/2412.20127
- Beschreibung:
- M-MAD ist ein Multi-Agenten-Framework, das auf Debatten basiert und zur präzisen Evaluierung maschineller Übersetzungen entwickelt wurde.
- Es verwendet mehrere Agenten, die verschiedene Aspekte einer Übersetzung diskutieren und bewerten, um eine umfassendere Analyse zu ermöglichen.
- Dieser Ansatz ermöglicht eine differenziertere Bewertung als herkömmliche Metriken.
- Titel:OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
- Link: https://arxiv.org/abs/2412.20005
- Beschreibung:
* OneKE ist ein dockerisiertes System, das schemageführte LLM-Agenten verwendet, um Wissen aus Dokumenten zu extrahieren.
* Das System ist flexibel und ermöglicht eine einfache Integration in verschiedene Arbeitsabläufe durch den Einsatz von Docker-Containern.
* OneKE ist ein Beispiel dafür, wie LLM-basierte Agenten für automatisierte Wissensextraktion genutzt werden können.
- Titel:Can Large Language Models Adapt to Other Agents In-Context?
- Link: https://arxiv.org/abs/2412.19726
- Beschreibung:
* Diese Forschung untersucht, ob Large Language Models (LLMs) ihre Verhaltensweisen während einer Interaktion mit anderen Agenten anpassen können.
* Es wird analysiert, wie LLMs in-context lernen und ihre Strategien auf Grundlage der Interaktionspartner optimieren.
* Die Ergebnisse geben Aufschluss über die Flexibilität und Anpassungsfähigkeit von LLMs in Multi-Agenten-Umgebungen.
- Titel:OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
- Link: https://arxiv.org/abs/2412.19723
- Beschreibung:
- OS-Genesis ist ein System, welches automatisch Trajektorien für GUI-Agenten mittels Reverse Task Synthesis erstellen kann.
- Der Ansatz kehrt den Prozess der Task-Ausführung um, indem es von einem gewünschten Ergebnis ausgehend eine Reihe von Schritten ableitet.
- Dieses System zielt darauf ab, die Erstellung und Analyse von GUI-Agenten zu vereinfachen.
- Titel:Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following
- Link: https://arxiv.org/abs/2412.19562
- Beschreibung:
- Dieser Artikel stellt einen Planner vor, der nur wenige Beispiele benötigt und aus Erfahrung lernt, um Anweisungen in einer Umgebung zu befolgen.
- Der Planner nutzt ein Hindsight-Konzept, um aus Fehlern zu lernen und den Planungsprozess anzupassen.
- Das System zeigt, wie Agenten in dynamischen Umgebungen mit wenigen Beispielen komplexe Aufgaben erfolgreich bewältigen können.
- Titel:Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding
- Link: https://arxiv.org/abs/2412.19064
- Beschreibung:
- Hier wird ein hierarchischer Multi-Agenten-Ansatz vorgestellt, der Meta-Reinforcement Learning (Meta-RL) verwendet, um Bietstrategien über verschiedene Kanäle zu optimieren.
- Die Hierarchie ermöglicht es, dass Agenten auf verschiedenen Ebenen agieren und somit komplexere Entscheidungen treffen können.
* Die Experimente zeigen, dass dieser Ansatz die Effizienz und Rentabilität von Bietprozessen verbessern kann.
- Titel:TravelAgent: Generative Agents in the Built Environment
- Link:https://arxiv.org/abs/2412.18985
- Beschreibung:
- TravelAgent ist ein System, das generative KI-Agenten nutzt, um das Verhalten von Menschen in einer bebauten Umgebung zu simulieren.
- Die Agenten sind in der Lage, selbstständig Entscheidungen zu treffen und Interaktionen mit der Umgebung zu simulieren, die auf realen Mustern basieren.
- Dies ermöglicht ein besseres Verständnis von räumlichen Interaktionen und kann in der Stadtplanung verwendet werden.
- Beschreibung:
- Link:https://arxiv.org/abs/2412.18985
- Titel:GAI: Generative Agents for Innovation
* Link:https://arxiv.org/abs/2412.18899- Beschreibung:
- Dieses Paper untersucht die Rolle von generativen Agenten bei der Förderung von Innovationen.
- Es wird ein Framework vorgestellt, das verschiedene Agenten mit unterschiedlichen Rollen für die generative Ideenfindung und Problemlösung kombiniert.
- Die Forschung zeigt das Potenzial generativer Agenten, die Entwicklung von neuen Lösungen in verschiedenen Bereichen zu beschleunigen.
- Beschreibung:
- Titel:Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice
- Link: https://arxiv.org/abs/2412.18697
- Beschreibung:
- Dieses Paper präsentiert ein Multi-Agenten-Framework, basierend auf LLMs, das für Anwendungen im Bereich der digitalen Justiz entwickelt wurde.
- Das Framework soll die Transparenz und das Vertrauen in die digitale Justiz stärken.
- Die Arbeit adressiert wichtige ethische und praktische Aspekte im Kontext von KI und Rechtsprechung.
- Titel:Multi-Agent Norm Perception and Induction in Distributed Healthcare
- Link: https://arxiv.org/abs/2412.18454
- Beschreibung:
- Dieses Paper untersucht die Wahrnehmung und Induktion von Normen in Multi-Agenten-Systemen, die im verteilten Gesundheitswesen eingesetzt werden.
- Es wird analysiert, wie Agenten gemeinsame Verhaltensregeln erlernen und befolgen können, um eine effektive Zusammenarbeit zu gewährleisten.
- Diese Forschung bietet Einblicke in die Schaffung sicherer und effizienter Multi-Agenten-Systeme in komplexen Umgebungen.
- Titel:Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent
* Link:https://arxiv.org/abs/2412.18428- Beschreibung:
- Hier wird ein Ansatz vorgestellt, wie LLMs genutzt werden können, um multimodale Daten in natürlicher Sprache zu explorieren.
- Ein LLM-Agent dient dabei als Schnittstelle, über die Benutzer Fragen stellen und Ergebnisse interpretieren können.
- Dieser Ansatz soll die Zugänglichkeit von komplexen multimodalen Datensätzen verbessern.
- Beschreibung:
- Titel:GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent
- Link: https://arxiv.org/abs/2412.18426
- Beschreibung:
- Dieses Paper präsentiert eine vereinheitlichte Benchmark für die Entwicklung und Evaluierung von autonomen GUI-Testagenten.
- Die Benchmark soll die Entwicklung effizienterer und effektiverer Testmethoden in GUI-basierten Systemen fördern.
- Die Arbeit bietet einen umfassenden Testrahmen mit klaren Kriterien zur Bewertung der Testfähigkeiten.
- Titel:MineStudio: A Streamlined Package for Minecraft AI Agent Development
- Link: https://arxiv.org/abs/2412.18293
- Beschreibung:
- MineStudio ist ein Paket, das den Entwicklungsprozess von KI-Agenten in Minecraft vereinfacht und optimiert.
- Das Paket bietet eine Reihe von Werkzeugen und Ressourcen, die es Entwicklern erleichtern, Agenten zu erstellen, zu trainieren und zu testen.
- MineStudio zielt darauf ab, die Hürden für den Einsatz von KI in Spielen zu senken.
- Titel:AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation
- Link: https://arxiv.org/abs/2412.18116
- Beschreibung:
- AutoDroid-V2 ist eine Methode, um die Leistung von GUI-Agenten durch Codegenerierung zu verbessern.
- Der Fokus liegt auf der Effizienz von speziell trainierten Sprachmodellen (SLMs) für GUI-bezogene Aufgaben.
- Durch die Kombination von SLMs mit Codegenerierung sollen GUI-Agenten effektiver und robuster gemacht werden.
- Titel:Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models
- Link: https://arxiv.org/abs/2412.17964
- Beschreibung:
- Dieses Paper beschreibt einen Ansatz zur dynamischen Orchestrierung mehrerer KI-Agenten mit LLMs in Frage-Antwort-Systemen, die auf verschiedene Datenquellen zugreifen.
- Das Framework ermöglicht es, dass die Agenten ihre Aufgaben koordiniert ausführen und aus verschiedenen Quellen benötigte Informationen beziehen.
- Die Studie untersucht die verbesserte Genauigkeit und Effizienz dieser Systeme im Vergleich zu anderen Ansätzen.
- Titel:Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents
- Link: https://arxiv.org/abs/2412.17942
- Beschreibung:
- Contrato360 2.0 ist ein Frage-Antwort-System, welches LLMs und Agenten nutzt, um Dokumente und Datenbanken gemeinsam zu analysieren.
- Das System ist darauf ausgerichtet, komplexe Fragen aus heterogenen Datenquellen zu beantworten.
- Diese Forschung zeigt, wie verschiedene LLM- und Agenten-Technologien kombiniert werden können, um leistungsfähige Q&A-Systeme zu entwickeln.
- Titel:Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems
- Link: https://arxiv.org/abs/2412.18601
- Beschreibung:
- Das Paper analysiert den Einsatz von „Embodied AI Agents“ in GameFi-Systemen, wo DeFi (Dezentrale Finanzen) und virtuelle Ökosysteme interagieren.
- Es wird untersucht, wie KI-Agenten autonome Entscheidungen treffen und zu einer dezentralisierten Intelligenz beitragen können.
- Die Forschung untersucht die Möglichkeiten und Herausforderungen in diesem neuen Feld.
- Titel:A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs
- Link: https://arxiv.org/abs/2412.18588
- Beschreibung:
- Diese Studie zeigt, dass Roboter mithilfe von Interaktionen mit vertrauenswürdigen LLMs komplexe Verhaltensweisen erlernen können.
- Es genügt eine kurze textuelle Anweisung, damit LLMs Roboter effektiv lenken und koordinieren können.
- Die Ergebnisse zeigen eine verbesserte Flexibilität und Anpassungsfähigkeit der Roboter in dynamischen Umgebungen.
- Titel:Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples
* Link:https://arxiv.org/abs/2412.17288
* Beschreibung:- Dieses Paper präsentiert eine Methode für multimodale, geerdete Planung, die es Embodied Agents ermöglicht, mit wenigen Beispielen zu lernen.
* Die Methode integriert visuelle und sprachliche Informationen, um die Planungsfähigkeit der Agenten zu verbessern. - Die Arbeit zeigt, dass Agents mit dieser Methode effizient und flexibel in verschiedenen Szenarien planen und agieren können.
- Dieses Paper präsentiert eine Methode für multimodale, geerdete Planung, die es Embodied Agents ermöglicht, mit wenigen Beispielen zu lernen.
KI-Agenten, Multi-Agentensysteme, Reinforcement Learning, Generative Agenten, autonome Systeme, Vision-Language-Modelle, LLM-Anwendungen, kollaborative Robotik, agentenbasierte KI, wissenschaftliche Fortschritte.