Aperçu
XAgent est un agent autonome expérimental open-source, piloté par un grand modèle linguistique (LLM) et conçu pour résoudre un large éventail de tâches complexes sans intervention humaine. Il vise à être un agent polyvalent et super-intelligent, capable d'accomplir toute tâche donnée, avec un développement continu pour améliorer ses capacités.
Objectif principal et groupe d'utilisateurs cibles
- Objectif principal : Fournir un agent LLM autonome capable de résoudre automatiquement des tâches complexes, offrant une solution polyvalente pour diverses applications.
- Groupe d'utilisateurs cibles : Développeurs, chercheurs et organisations intéressés par l'exploitation d'agents d'IA autonomes pour l'automatisation des tâches, la résolution de problèmes complexes et l'exploration des frontières de l'IA. Cela inclut les personnes travaillant dans l'analyse de données, le développement de logiciels, la recherche et tout domaine nécessitant une automatisation intelligente.
Détails et opérations des fonctions
- Autonomie : XAgent peut résoudre diverses tâches de manière indépendante, minimisant le besoin de participation humaine.
- Sécurité : Les opérations sont contraintes au sein d'un conteneur Docker, garantissant un environnement d'exécution sécurisé.
- Extensibilité : Les utilisateurs peuvent facilement ajouter de nouveaux {tools} et même de nouveaux agents pour améliorer les capacités de XAgent.
- Interfaces utilisateur : Fournit à la fois une interface utilisateur graphique (GUI) conviviale et une interface de ligne de commande (CLI) pour l'interaction.
- Coopération homme-agent : XAgent peut collaborer avec les utilisateurs, suivre leurs directives pour les tâches complexes et demander de l'aide en cas de difficultés.
- Architecture modulaire :
- Dispatcher : Instancie et répartit dynamiquement les tâches aux différents agents.
- Planner : Génère et affine les plans de tâches, les décomposant en sous-tâches avec des jalons.
- Actor : Exécute des actions pour atteindre les objectifs et accomplir les sous-tâches, en utilisant divers {tools} et en collaborant avec les humains.
- ToolServer : Un serveur basé sur {Docker} fournissant des {tools} puissants et sûrs :
- File Editor : Pour écrire, lire et modifier des fichiers.
- Python Notebook : Environnement interactif pour exécuter du code {Python}, valider des idées et dessiner des figures.
- Web Browser : Pour rechercher et visiter des pages web.
- Shell : Exécute des commandes {shell}, y compris l'installation de programmes et l'hébergement de services.
- Rapid API Integration : Accède et appelle un large éventail d'API de {Rapid API} (collections {ToolBench}).
- Flux de travail d'exécution des tâches :
- Les utilisateurs soumettent des tâches via {CLI} ou {GUI}.
- XAgent traite les tâches, génère des plans et exécute des actions.
- Tous les fichiers générés et les étapes intermédiaires sont enregistrés dans un espace de travail local et les enregistrements d'exécution.
- Les enregistrements peuvent être chargés pour reproduire les exécutions précédentes, avec les informations sensibles supprimées pour un partage sûr.
Avantages pour l'utilisateur
- Efficacité accrue : Automatise les tâches complexes, ce qui permet d'économiser du temps et des ressources.
- Résolution de problèmes améliorée : Capable de résoudre des problèmes complexes dans divers domaines.
- Opérations sécurisées : La conteneurisation {Docker} assure un environnement sûr pour l'exécution des actions.
- Flexibilité et personnalisation : Facilement extensible avec de nouveaux {tools} et agents pour répondre à des besoins spécifiques.
- Collaboration améliorée : Facilite une interaction transparente entre les utilisateurs humains et l'agent {AI}.
- Reproductibilité : Les enregistrements d'exécution détaillés permettent une reproduction et une analyse faciles des exécutions passées.
Compatibilité et intégration
- Système d'exploitation : Nécessite {Docker} et {Docker Compose} pour la configuration de {ToolServer}.
- Version {Python} : Nécessite {Python} >= 3.10.
- Clés {API} : Configurable avec les clés {API OpenAI} ({gpt-4-32k} recommandé, {gpt-4} et {gpt-3.5-turbo-16k} pris en charge).
- Intégration {Docker} : {ToolServer} s'exécute comme un conteneur {Docker}, offrant un environnement autonome.
- {Web UI} : Accessible via un navigateur web ({http://localhost:5173}) pour l'interaction {GUI}.
Commentaires des clients et études de cas
- Analyse de données : Aide avec succès les utilisateurs dans l'analyse complexe de données, y compris l'inspection des données, la vérification de l'environnement, la génération de code et la compilation de rapports (par exemple, l'analyse {iris.zip}).
- Recommandation : Démontre la coopération homme-agent en recherchant activement la contribution humaine lorsque les informations sont insuffisantes (par exemple, les recommandations de restaurant).
- Entraînement de modèles : Capable de tâches complexes comme l'entraînement de modèles d'apprentissage automatique (par exemple, l'entraînement d'un modèle {BERT} pour l'analyse des sentiments de critiques de films).
- Évaluation : Surpasse {AutoGPT} dans les évaluations de préférences humaines sur plus de 50 tâches complexes du monde réel classées en Recherche et rapport, Codage et développement, Analyse de données, Mathématiques et Assistant de vie.
Méthode d'accès et d'activation
- Code source : Disponible sur {GitHub} ({github.com/OpenBMB/XAgent}).
- Configuration de {ToolServer} :
- Tirer l'image {Docker} :
{docker compose up} - Construire à partir de sources locales :
{docker compose build}puis{docker compose up}
- Tirer l'image {Docker} :
- Configuration de XAgent :
- Installer les dépendances :
{pip install -r requirements.txt} - Configurer les clés {API} dans {assets/config.yml}.
- Exécuter XAgent :
{python run.py --task "put your task here" --config-file "assets/config.yml"}
- Installer les dépendances :
- Accès {GUI} : Visiter
{http://localhost:5173}après avoir démarré le conteneur {XAgent-Server}. Identifiants par défaut : nom d'utilisateur{guest}, mot de passe{xagent}.