Devika AI: AI-инженер программного обеспечения с открытым исходным кодом
Обзор
Devika AI — это AI-инженер программного обеспечения с открытым исходным кодом. Он предназначен для понимания сложных человеческих инструкций, разбиения их на действенные шаги, проведения исследований и написания кода для достижения поставленных целей. Devika стремится стать конкурентоспособной альтернативой проприетарным AI-инженерам программного обеспечения, таким как Devin от Cognition AI, с амбициозной целью соответствовать и в конечном итоге превзойти их производительность в бенчмарках, таких как SWE-bench.
Основное назначение и целевая группа пользователей
- Основное назначение: Революционизировать разработку программного обеспечения, предоставляя AI-парного программиста, способного справляться со сложными задачами кодирования с минимальным участием человека, включая создание новых функций, исправление ошибок или разработку целых проектов.
- Целевая группа пользователей: Разработчики, инженеры-программисты и команды, ищущие продвинутого AI-помощника для автоматизации и оптимизации своих рабочих процессов кодирования, особенно те, кто заинтересован в решениях с открытым исходным кодом и использовании больших языковых моделей для задач программной инженерии.
Детали функций и операции
- Понимание инструкций: Интерпретирует высокоуровневые человеческие инструкции для задач разработки программного обеспечения.
- Декомпозиция задач: Разбивает сложные цели на управляемые, последовательные шаги.
- Исследование информации: Использует возможности веб-браузинга и извлечение контекстных ключевых слов для сбора соответствующей информации.
- Генерация кода: Пишет код на нескольких языках программирования на основе исследований и требований задач.
- Поддержка LLM: Поддерживает различные большие языковые модели, включая Claude 3, GPT-4, Gemini, Mistral, Groq и локальные LLM через Ollama. Модели Claude 3 рекомендуются для оптимальной производительности.
- Динамическое отслеживание состояния: Визуализирует и отслеживает прогресс и текущее состояние агента.
- Интерфейс чата: Обеспечивает взаимодействие на естественном языке для предоставления инструкций и получения обновлений.
- Управление проектами: Организует и управляет задачами разработки программного обеспечения на проектной основе.
- Расширяемая архитектура: Разработана для легкой интеграции новых функций и возможностей.
- Веб-интерфейс: Доступен через веб-браузер для взаимодействия с пользователем и управления проектами.
- Конфигурация: Позволяет пользователям настраивать ключи API для различных сервисов (Bing, Google Search, OpenAI, Gemini, Claude, Mistral, Groq, Netlify) и конечные точки API (Bing, Google, Ollama, OpenAI).
Преимущества для пользователя
- Повышение эффективности: Автоматизирует значительные части процесса разработки программного обеспечения, ускоряя завершение проекта.
- Снижение ручного труда: Минимизирует необходимость человеческого вмешательства в задачи кодирования и исследования.
- Повышение производительности: Работает как AI-парный программист, позволяя разработчикам сосредоточиться на высокоуровневом проектировании и решении проблем.
- Доступ к продвинутому AI: Использует современные LLM и возможности планирования AI для сложной генерации кода.
- Гибкость открытого исходного кода: Предоставляет прозрачную и настраиваемую альтернативу проприетарным решениям.
- Оптимизированный рабочий процесс: Интегрирует исследования, планирование и кодирование в единый, связный процесс.
Совместимость и интеграция
- Операционная система: Требуется Python >= 3.10 и < 3.12, NodeJs >= 18 и Bun.
- Интеграция с браузером: Использует Playwright для возможностей просмотра.
- Интеграции API: Настраивается с помощью ключей API для различных поисковых систем (Bing, Google Search) и поставщиков LLM (OpenAI, Gemini, Anthropic, Mistral, Groq).
- Развертывание: Поддерживает ключ API Netlify для развертывания и управления веб-проектами.
- Локальная поддержка LLM: Интегрируется с Ollama для запуска локальных языковых моделей.
Отзывы клиентов и кейсы
- В настоящее время находится на ранней стадии разработки/экспериментальном этапе со множеством нереализованных/сломанных функций.
- Стремится стать конкурентоспособной альтернативой с открытым исходным кодом для Devin от Cognition AI, с "чрезмерно амбициозной" целью достичь и в конечном итоге превзойти его результаты в бенчмарках SWE-bench.
- Приветствуются вклады сообщества для ускорения разработки и реализации функций.
- Доступны демонстрации (например,
devika-pygame-demo.mp4), демонстрирующие ее возможности.
Метод доступа и активации
- Исходный код: Доступен на GitHub:
https://github.com/stitionai/devika. - Установка:
- Клонируйте репозиторий GitHub.
- Перейдите в каталог проекта.
- Создайте виртуальное окружение и установите зависимости с помощью
uv venvиuv pip install -r requirements.txt. - Установите Playwright для возможностей браузера:
playwright install --with-deps. - Запустите сервер Devika:
python devika.py. - Для фронтенда перейдите в каталог
ui/, запуститеbun install, а затемbun run start.
- Доступ: Откройте веб-интерфейс Devika, перейдя по адресу
http://127.0.0.1:3001в веб-браузере. - Конфигурация: Ключи API и конечные точки настраиваются через страницу настроек в пользовательском интерфейсе, которая создает файл
config.tomlв корневом каталоге.