개요
XAgent는 사람의 개입 없이 광범위한 복잡한 작업을 해결하도록 설계된 오픈 소스 실험적인 대규모 언어 모델(LLM) 기반 자율 에이전트입니다. 어떤 주어진 작업이든 처리할 수 있는 범용의 초지능형 에이전트가 되는 것을 목표로 하며, 지속적인 개발을 통해 그 기능을 향상시키고 있습니다.
주요 목적 및 목표 사용자 그룹
- 주요 목적: 복잡한 작업을 자동으로 해결할 수 있는 자율 LLM 에이전트를 제공하여 다양한 애플리케이션을 위한 범용 솔루션을 제공합니다.
- 목표 사용자 그룹: 작업 자동화, 복잡한 문제 해결, AI의 최전선 탐색을 위한 자율 AI 에이전트 활용에 관심 있는 개발자, 연구원 및 조직. 여기에는 데이터 분석, 소프트웨어 개발, 연구 및 지능형 자동화가 필요한 모든 분야의 사람들이 포함됩니다.
기능 세부 사항 및 작동
- 자율성: XAgent는 다양한 작업을 독립적으로 해결할 수 있어 사람의 참여 필요성을 최소화합니다.
- 안전: 작업은 Docker 컨테이너 내에서 제한되어 안전한 실행 환경을 보장합니다.
- 확장성: 사용자는 XAgent의 능력을 향상시키기 위해 새로운 도구는 물론 새로운 에이전트를 쉽게 추가할 수 있습니다.
- 사용자 인터페이스: 편리한 GUI(그래픽 사용자 인터페이스)와 CLI(명령줄 인터페이스)를 모두 제공하여 상호 작용을 지원합니다.
- 인간-에이전트 협력: XAgent는 사용자에게 지침을 따르고, 복잡한 작업을 위해 협력하며, 어려움이 발생할 때 도움을 요청할 수 있습니다.
- 모듈식 아키텍처:
- Dispatcher: 작업을 동적으로 인스턴스화하고 다른 에이전트로 분배합니다.
- Planner: 마일스톤과 함께 하위 작업으로 나누어 작업 계획을 생성하고 개선합니다.
- Actor: 다양한 도구를 활용하고 인간과 협력하여 목표를 달성하고 하위 작업을 완료하기 위해 작업을 실행합니다.
- ToolServer: 강력하고 안전한 도구를 제공하는 Docker 기반 서버:
- 파일 편집기: 파일 작성, 읽기 및 수정을 위한 도구입니다.
- 파이썬 노트북: 파이썬 코드를 실행하고, 아이디어를 검증하고, 그림을 그리기 위한 대화형 환경입니다.
- 웹 브라우저: 웹페이지를 검색하고 방문하기 위한 도구입니다.
- 셸: 프로그램 설치 및 서비스 호스팅을 포함한 셸 명령을 실행합니다.
- Rapid API 통합: Rapid API(ToolBench 컬렉션)의 광범위한 API에 액세스하고 호출합니다.
- 작업 실행 워크플로우:
- 사용자는 CLI 또는 GUI를 통해 작업을 제출합니다.
- XAgent는 작업을 처리하고, 계획을 생성하며, 작업을 실행합니다.
- 생성된 모든 파일과 중간 단계는 로컬 작업 공간 및 실행 기록에 저장됩니다.
- 이전 실행을 재현하기 위해 기록을 로드할 수 있으며, 안전한 공유를 위해 민감한 정보는 제거됩니다.
사용자 혜택
- 효율성 증대: 복잡한 작업을 자동화하여 시간과 자원을 절약합니다.
- 향상된 문제 해결: 다양한 영역에서 복잡한 문제를 처리할 수 있습니다.
- 안전한 작업: Docker 컨테이너화를 통해 작업을 실행하는 안전한 환경을 보장합니다.
- 유연성 및 사용자 정의: 새로운 도구 및 에이전트를 사용하여 특정 요구 사항을 충족하도록 쉽게 확장할 수 있습니다.
- 향상된 협업: 인간 사용자와 AI 에이전트 간의 원활한 상호 작용을 촉진합니다.
- 재현성: 자세한 실행 기록을 통해 과거 실행을 쉽게 재현하고 분석할 수 있습니다.
호환성 및 통합
- 운영 체제: ToolServer 설정을 위해 Docker 및 Docker Compose가 필요합니다.
- 파이썬 버전: 파이썬 >= 3.10이 필요합니다.
- API 키: OpenAI API 키로 구성 가능 (gpt-4-32k 권장, gpt-4 및 gpt-3.5-turbo-16k 지원).
- Docker 통합: ToolServer는 Docker 컨테이너로 실행되어 자체 포함 환경을 제공합니다.
- 웹 UI: GUI 상호 작용을 위해 웹 브라우저 (http://localhost:5173)를 통해 액세스할 수 있습니다.
고객 피드백 및 사례 연구
- 데이터 분석: 데이터 검사, 환경 검증, 코드 생성, 보고서 작성(예: iris.zip 분석)을 포함한 복잡한 데이터 분석에서 사용자를 성공적으로 지원합니다.
- 추천: 정보가 불충분할 때 인간의 입력을 적극적으로 요청하여 인간-에이전트 협력을 보여줍니다(예: 레스토랑 추천).
- 모델 훈련: 기계 학습 모델 훈련(예: 영화 리뷰 감성 분석을 위한 BERT 모델 훈련)과 같은 복잡한 작업을 수행할 수 있습니다.
- 평가: 검색 및 보고, 코딩 및 개발, 데이터 분석, 수학, 생활 도우미로 분류된 50개 이상의 실제 복잡한 작업에 대한 인간 선호도 평가에서 AutoGPT보다 우수한 성능을 보여줍니다.
액세스 및 활성화 방법
- 소스 코드: GitHub (github.com/OpenBMB/XAgent)에서 사용 가능합니다.
- ToolServer 설정:
- Docker 이미지 풀:
docker compose up - 로컬 소스에서 빌드:
docker compose build후docker compose up
- Docker 이미지 풀:
- XAgent 설정:
- 필요한 사항 설치:
pip install -r requirements.txt assets/config.yml에 API 키를 구성합니다.- XAgent 실행:
python run.py --task "여기에 작업 입력" --config-file "assets/config.yml"
- 필요한 사항 설치:
- GUI 액세스: XAgent-Server 컨테이너 시작 후
http://localhost:5173을 방문합니다. 기본 자격 증명: 사용자 이름guest, 비밀번호xagent.