คุณสมบัติผลิตภัณฑ์ของ Open Manus
ภาพรวม
Open Manus เป็นโครงการโอเพนซอร์สที่ออกแบบมาให้เป็นเฟรมเวิร์กที่ยืดหยุ่นและเข้าถึงได้ง่ายสำหรับการสร้างตัวแทน AI ทั่วไป โดยเน้นหลักปรัชญา "พื้นที่เปิด" (open ground) เพื่อกำจัดอุปสรรคต่าง ๆ เช่น รหัสเชิญ ทำให้การพัฒนา AI agent ขั้นสูงสามารถเข้าถึงได้ทุกคน พัฒนาโดยสมาชิกหลักจาก MetaGPT, Open Manus นำเสนอการนำไปใช้งานที่เรียบง่ายแต่ทรงพลังสำหรับการสร้างและปรับใช้ AI agent โดยให้ความสำคัญอย่างยิ่งกับการมีส่วนร่วมของชุมชนและการพัฒนาอย่างต่อเนื่อง
วัตถุประสงค์หลักและกลุ่มผู้ใช้เป้าหมาย
วัตถุประสงค์หลักของ Open Manus คือการช่วยให้นักพัฒนา นักวิจัย และผู้ที่ชื่นชอบ AI สามารถสร้าง ปรับแต่ง และใช้งาน AI agent ของตนเองได้อย่างง่ายดายโดยไม่มีข้อจำกัด มุ่งมั่นที่จะทำให้การพัฒนา AI agent เป็นประชาธิปไตยมากขึ้น ส่งเสริมการสร้างสรรค์นวัตกรรมและความร่วมมือภายในชุมชนโอเพนซอร์ส
กลุ่มผู้ใช้เป้าหมาย
- นักพัฒนา AI: บุคคลและทีมที่กำลังมองหาเฟรมเวิร์กโอเพนซอร์สเพื่อสร้างและทดลองกับ AI agent
- นักวิจัย: นักวิชาการและนักวิทยาศาสตร์ที่สนใจสำรวจและมีส่วนร่วมในสาขาการพัฒนา AI agent โดยเฉพาะอย่างยิ่งในด้านการเรียนรู้แบบเสริมแรงสำหรับ LLM agent (เช่น OpenManus-RL)
- นักเรียนและผู้ที่ชื่นชอบ: ผู้เรียนที่ต้องการทำความเข้าใจและได้รับประสบการณ์จริงกับการสร้าง AI agent
- สตาร์ทอัพและทีมขนาดเล็ก: องค์กรที่กำลังมองหาโซลูชันที่คุ้มค่าและยืดหยุ่นสำหรับการรวม AI agent เข้ากับผลิตภัณฑ์หรือขั้นตอนการทำงานของตน
รายละเอียดฟังก์ชันและการทำงาน
- เฟรมเวิร์ก AI Agent ทั่วไป: จัดโครงสร้างพื้นฐานสำหรับสร้าง AI agent ประเภทต่าง ๆ
- การสนับสนุนหลาย Agent: สามารถรัน Agent ได้หลายตัว รวมถึง Data Analysis Agent เฉพาะสำหรับงานประมวลผลและแสดงข้อมูล
- การผสานรวม LLM API: สามารถกำหนดค่าให้ทำงานร่วมกับ Large Language Model (LLM) API ต่าง ๆ (เช่น GPT models ของ OpenAI) โดยการตั้งค่า API key, base URL และพารามิเตอร์ของโมเดล
- การผสานรวม Browser Automation Tool: รองรับ
playwrightสำหรับการทำงานอัตโนมัติบนเบราว์เซอร์ ทำให้ Agent สามารถโต้ตอบกับสภาพแวดล้อมบนเว็บได้ - โหมดการทำงานที่ยืดหยุ่น:
main.py: สำหรับรัน Open Manus agent ทั่วไปด้วยข้อมูลที่ผู้ใช้ป้อนผ่านเทอร์มินัลrun_mcp.py: สำหรับ "MCP tool version" (ระบุฟังก์ชันการทำงานที่แน่ชัดไม่ได้ แต่บ่งบอกถึงโหมดการทำงานที่แตกต่าง)run_flow.py: สำหรับ "unstable multi-agent version" ซึ่งช่วยให้เกิดการโต้ตอบแบบหลาย Agent ที่ซับซ้อนมากขึ้น
- การจัดการการกำหนดค่า: ใช้
config.tomlเพื่อปรับแต่งการตั้งค่า LLM, API key และการเปิดใช้งาน Agent ได้อย่างง่ายดาย (เช่น การเปิดใช้งาน Data Analysis Agent) - การจัดการการพึ่งพา: มีสองวิธีการติดตั้ง:
- Conda: การจัดการสภาพแวดล้อม Python แบบดั้งเดิม
- uv (แนะนำ): ตัวติดตั้งและตัวแปลงแพ็คเกจ Python ที่รวดเร็วเพื่อการติดตั้งที่รวดเร็วยิ่งขึ้นและการจัดการการพึ่งพาที่ดีขึ้น
- Pre-commit Hooks: รวม
pre-commitสำหรับการตรวจสอบคุณภาพโค้ด ทำให้มั่นใจได้ถึงรูปแบบและสไตล์ที่สอดคล้องกันก่อนการส่ง Pull Request
ประโยชน์ที่ผู้ใช้จะได้รับ
- การเข้าถึง: ปรัชญา "No fortress, purely open ground" กำจัดอุปสรรค ทำให้การพัฒนา AI agent สามารถเข้าถึงได้ทุกคนโดยไม่มีรหัสเชิญ
- ความยืดหยุ่นและการปรับแต่ง: ผู้ใช้สามารถกำหนดค่าโมเดล LLM, รวมเครื่องมือต่าง ๆ และเพิ่ม Agent ที่กำหนดเองได้อย่างง่ายดายเพื่อให้เหมาะกับความต้องการเฉพาะของตน
- การสร้างต้นแบบอย่างรวดเร็ว: โครงการนี้ถูกสร้างต้นแบบภายใน 3 ชั่วโมง แสดงให้เห็นถึงความง่ายในการตั้งค่าและการใช้งานสำหรับวงจรการพัฒนาที่รวดเร็ว
- การพัฒนาที่ขับเคลื่อนโดยชุมชน: เปิดรับข้อเสนอแนะ การมีส่วนร่วม และความคิดเห็น ส่งเสริมสภาพแวดล้อมการทำงานร่วมกันเพื่อการพัฒนาอย่างต่อเนื่อง
- คุ้มค่า: การเป็นโอเพนซอร์สช่วยลดต้นทุนการพัฒนาที่เกี่ยวข้องกับโซลูชัน AI agent ที่เป็นกรรมสิทธิ์
- โอกาสในการเรียนรู้: มอบแพลตฟอร์มที่เป็นประโยชน์สำหรับการเรียนรู้เกี่ยวกับสถาปัตยกรรมและการนำ AI agent ไปใช้งาน
- การผสานรวมการเรียนรู้แบบเสริมแรง: แผนการในอนาคตรวมถึง OpenManus-RL สำหรับการปรับแต่ง LLM agent ขั้นสูงโดยใช้วิธีการ RL
ความเข้ากันได้และการรวม
- Python 3.12: เวอร์ชัน Python ที่แนะนำสำหรับการตั้งค่าสภาพแวดล้อม
- LLM API: ออกแบบมาเพื่อรวมเข้ากับผู้ให้บริการ LLM ต่าง ๆ พร้อมการกำหนดค่าที่ชัดเจนสำหรับโมเดล OpenAI (GPT-4o)
- Browser Automation: เข้ากันได้กับ
playwrightสำหรับความสามารถในการโต้ตอบกับเว็บ - Dependency Management Tools: รองรับ
condaและuvสำหรับการจัดการการพึ่งพาโครงการ - Version Control: โฮสต์บน GitHub โดยใช้เวิร์กโฟลว์ Git มาตรฐานสำหรับการทำงานร่วมกัน
- ระบบปฏิบัติการ: มีคำแนะนำในการติดตั้งสำหรับทั้งสภาพแวดล้อม Unix/macOS และ Windows
ข้อเสนอแนะจากลูกค้าและกรณีศึกษา
- การสาธิตโครงการ: มีวิดีโอ
seo_website.mp4ที่เชื่อมโยงอยู่ ซึ่งแสดงการทำงานจริงของโครงการ - การมีส่วนร่วมของชุมชน: สนับสนุนให้ผู้ใช้เข้าร่วมกลุ่มเครือข่าย Feishu เพื่อแบ่งปันประสบการณ์
- คำขอบคุณ: ขอบคุณโครงการต่าง ๆ เช่น
anthropic-computer-use,browser-use, AAAJ, MetaGPT, OpenHands และ SWE-agent สำหรับการสนับสนุนพื้นฐาน แสดงให้เห็นถึงการพึ่งพาและบูรณาการกับเครื่องมือและชุมชนโอเพนซอร์สที่มีอยู่ - การสนับสนุน: PPIO ให้การสนับสนุนด้านแหล่งข้อมูลการคำนวณ ซึ่งบ่งบอกถึงการใช้งานจริงและความต้องการทรัพยากร
- Hugging Face Demo Space: ได้รับการสนับสนุนโดย stepfun (阶跃星辰) ซึ่งบ่งบอกถึงศักยภาพในการปรับใช้ในวงกว้างขึ้นและการเข้าถึงการสาธิต
การเข้าถึงและวิธีการเปิดใช้งาน
- GitHub Repository: จุดเข้าถึงหลักคือ GitHub repository สาธารณะ:
https://github.com/FoundationAgents/OpenManus - การโคลน Repository: ผู้ใช้สามารถโคลน repository โดยใช้
git clone https://github.com/FoundationAgents/OpenManus.git - การติดตั้ง:
- วิธีที่ 1 (Conda): สร้างสภาพแวดล้อม conda, เปิดใช้งาน และติดตั้งการพึ่งพาผ่าน
pip install -r requirements.txt - วิธีที่ 2 (uv - แนะนำ): ติดตั้ง
uv, สร้างและเปิดใช้งานสภาพแวดล้อมเสมือน จากนั้นติดตั้งการพึ่งพาผ่านuv pip install -r requirements.txt
- วิธีที่ 1 (Conda): สร้างสภาพแวดล้อม conda, เปิดใช้งาน และติดตั้งการพึ่งพาผ่าน
- การกำหนดค่า: คัดลอก
config/config.example.tomlไปยังconfig/config.tomlและแก้ไขเพื่อเพิ่ม LLM API key และปรับแต่งการตั้งค่า - การรัน Agent: รัน
python main.pyสำหรับ Agent ทั่วไป,python run_mcp.pyสำหรับ MCP tool version, หรือpython run_flow.pyสำหรับ Multi-agent version - การมีส่วนร่วม: ผู้ใช้สามารถมีส่วนร่วมโดยการสร้าง Issues หรือส่ง Pull Request หลังจากรัน
pre-commit run --all-files