Skip to content

Latest commit

 

History

History
419 lines (289 loc) · 13.2 KB

File metadata and controls

419 lines (289 loc) · 13.2 KB

🦜🤖 DeepManus

Python 3.12+ License: MIT WeChat Discord Follow

English | 简体中文 | 日本語

源于开源,回馈开源

DeepManus 是一个基于LangManus开发的 AI 自动化框架,使用deepseek作为大模型,使用了更少的第三方框架,让它更易于国内使用,项目建立在开源社区的卓越工作基础之上。项目目标是将给大语言模型装上手脚。

演示视频

Task: Calculate the influence index of DeepSeek R1 on HuggingFace. This index can be designed by considering a weighted sum of factors such as followers, downloads, and likes.

DeepManus的全自动计划与解决方案:

  1. 收集最新信息
    通过在线搜索获取关于"DeepSeek R1"、"HuggingFace"以及相关主题的最新信息。

  2. 访问HuggingFace官网
    使用 Chromium 实例访问 HuggingFace 的官方网站,搜索"DeepSeek R1",并检索最新数据,包括关注者数量、点赞数、下载量及其他相关指标。

  3. 查找模型影响力计算公式
    使用搜索引擎和网页抓取技术,寻找计算模型影响力的相关公式或方法。

  4. 使用Python计算影响力指数
    基于收集到的数据,使用Python编程计算DeepSeek R1的影响力指数。

  5. 生成综合报告
    将分析结果整理成一份全面的报告并呈现给用户。

目录

快速开始

# 克隆仓库
git clone https://github.com/TimeCyber/DeepManus.git
cd DeepManus

# 安装依赖
uv sync

# Playwright install to use Chromium for browser-use by default
uv run playwright install

# 配置环境
cp .env.example .env
# 编辑 .env 文件,填入你的 API 密钥

# 运行项目
uv run main.py

项目声明

本项目是基于LangManus学术驱动的开源项目,修改了大模型引用Deepseek,去掉jina。旨在探索和交流 Multi-Agent 和 DeepResearch 相关领域的技术。

  • 项目目的:本项目的主要目的是大模型应用研究,给大模型装上手脚。
  • 产权声明:所属知识产权归成都时光赛博科技有限公司所有。
  • 无关联声明:本项目与 Manus(无论是公司、组织还是其他实体)无任何关联。
  • 贡献管理:Issue 和 PR 将在空闲时间处理,可能存在延迟,敬请谅解。
  • 免责声明:本项目基于 MIT 协议开源,使用者需自行承担使用风险。我们对因使用本项目产生的任何直接或间接后果不承担责任。

架构

DeepManus 实现了一个分层的多智能体系统,其中有一个主管智能体协调专门的智能体来完成复杂任务:

DeepManus 架构

系统由以下智能体协同工作:

  1. 协调员(Coordinator):工作流程的入口点,处理初始交互并路由任务
  2. 规划员(Planner):分析任务并制定执行策略
  3. 主管(Supervisor):监督和管理其他智能体的执行
  4. 研究员(Researcher):收集和分析信息
  5. 程序员(Coder):负责代码生成和修改
  6. 浏览器(Browser):执行网页浏览和信息检索
  7. 汇报员(Reporter):生成工作流结果的报告和总结

功能特性

核心能力

  • 🤖 LLM 集成
    • 支持通过litellm接入大部分模型
    • 支持通义千问等开源模型
    • Deepseek 兼容的 API 接口
    • 多层 LLM 系统适配不同任务复杂度

工具和集成

  • 🔍 搜索和检索
    • 通过 Tavily API 进行网络搜索
    • 使用标准script
    • 高级内容提取

开发特性

  • 🐍 Python 集成
    • 内置 Python REPL
    • 代码执行环境
    • 使用 uv 进行包管理

工作流管理

  • 📊 可视化和控制
    • 工作流程图可视化
    • 多智能体编排
    • 任务分配和监控

为什么选择 DeepManus?

我们信奉开源协作的力量。本项目的实现离不开以下优秀项目的支持:

  • Qwen:提供开源语言模型
  • Tavily:提供搜索能力
  • Browser-use:提供浏览器控制能力
  • 以及众多其他开源贡献者

我们致力于回馈社区,欢迎各种形式的贡献——无论是代码、文档、问题报告还是功能建议。

安装设置

你也可以参考 01Coder 发布的这部影片

前置要求

  • uv 包管理器

安装步骤

DeepManus 使用 uv 作为包管理器以简化依赖管理。 按照以下步骤设置虚拟环境并安装必要的依赖:

# 步骤 1:用uv创建并激活虚拟环境
uv python install 3.12
uv venv --python 3.12

# Unix/macOS 系统:
source .venv/bin/activate

# Windows 系统:
.venv\Scripts\activate

# 步骤 2:安装项目依赖
uv sync

配置

DeepManus 使用三层 LLM 系统,分别用于推理、基础任务和视觉语言任务,使用项目根目录下conf.yaml进行配置,您可以复制conf.yaml.exampleconf.yaml开始配置:

cp conf.yaml.example conf.yaml
# 设置为true会读取conf.yaml配置,设置为false会使用原来的.env配置,默认为false(兼容存量配置)
USE_CONF: true

# LLM Config
## 遵循litellm配置参数: https://docs.litellm.ai/docs/providers, 可以点击具体provider文档,参看completion参数示例
REASONING_MODEL:
  model: "volcengine/ep-xxxx"
  api_key: $REASONING_API_KEY # 支持通过$ENV_KEY引用.env文件中的环境变量ENV_KEY
  api_base: $REASONING_BASE_URL

BASIC_MODEL:
  model: "azure/gpt-4o-2024-08-06"
  api_base: $AZURE_API_BASE
  api_version: $AZURE_API_VERSION
  api_key: $AZURE_API_KEY

VISION_MODEL:
  model: "azure/gpt-4o-2024-08-06"
  api_base: $AZURE_API_BASE
  api_version: $AZURE_API_VERSION
  api_key: $AZURE_API_KEY

您可以在项目根目录创建 .env 文件并配置以下环境变量,您可以复制 .env.example 文件作为模板开始:

cp .env.example .env
# 工具 API 密钥
TAVILY_API_KEY=your_tavily_api_key

# 浏览器配置
CHROME_INSTANCE_PATH=/Applications/Google Chrome.app/Contents/MacOS/Google Chrome  # 可选,Chrome 可执行文件路径
CHROME_HEADLESS=False  # 可选,默认是 False
CHROME_PROXY_SERVER=http://127.0.0.1:10809  # 可选,默认是 None
CHROME_PROXY_USERNAME=  # 可选,默认是 None
CHROME_PROXY_PASSWORD=  # 可选,默认是 None

注意:

  • 系统对不同类型的任务使用不同的模型:
    • 推理 LLM 用于复杂的决策和分析
    • 基础 LLM 用于简单的文本任务
    • 视觉语言 LLM 用于涉及图像理解的任务
  • 所有 LLM 的配置可以独立自定义
  • Tavily 搜索默认配置为最多返回 5 个结果(你可以在 app.tavily.com 获取该密钥)

配置预提交钩子

DeepManus 包含一个预提交钩子,在每次提交前运行代码检查和格式化。设置步骤:

  1. 使预提交脚本可执行:
chmod +x pre-commit
  1. 安装预提交钩子:
ln -s ../../pre-commit .git/hooks/pre-commit

预提交钩子将自动:

  • 运行代码检查(make lint
  • 运行代码格式化(make format
  • 将任何重新格式化的文件添加回暂存区
  • 如果有任何代码检查或格式化错误,阻止提交

使用方法

基本执行

使用默认设置运行 DeepManus:

uv run main.py

API 服务器

DeepManus 提供基于 FastAPI 的 API 服务器,支持流式响应:

# 启动 API 服务器
make serve

# 或直接运行
uv run server.py

API 服务器提供以下端点:

  • POST /api/chat/stream:用于 LangGraph 调用的聊天端点,流式响应
    • 请求体:
    {
      "messages": [{ "role": "user", "content": "在此输入您的查询" }],
      "debug": false
    }
    • 返回包含智能体响应的服务器发送事件(SSE)流

高级配置

DeepManus 可以通过 src/config 目录中的各种配置文件进行自定义:

  • env.py:配置 LLM 模型、API 密钥和基础 URL
  • tools.py:调整工具特定设置(如 Tavily 搜索结果限制)
  • agents.py:修改团队组成和智能体系统提示

智能体提示系统

DeepManus 在 src/prompts 目录中使用复杂的提示系统来定义智能体的行为和职责:

核心智能体角色

  • 主管(src/prompts/supervisor.md:通过分析请求并确定由哪个专家处理来协调团队并分配任务。负责决定任务完成情况和工作流转换。

  • 研究员(src/prompts/researcher.md:专门通过网络搜索和数据收集来收集信息。使用 Tavily 搜索和网络爬取功能,避免数学计算或文件操作。

  • 程序员(src/prompts/coder.md:专业软件工程师角色,专注于 Python 和 bash 脚本。处理:

    • Python 代码执行和分析
    • Shell 命令执行
    • 技术问题解决和实现
  • 文件管理员(src/prompts/file_manager.md:处理所有文件系统操作,重点是正确格式化和保存 markdown 格式的内容。

  • 浏览器(src/prompts/browser.md:网络交互专家,处理:

    • 网站导航
    • 页面交互(点击、输入、滚动)
    • 从网页提取内容

提示系统架构

提示系统使用模板引擎(src/prompts/template.py)来:

  • 加载特定角色的 markdown 模板
  • 处理变量替换(如当前时间、团队成员信息)
  • 为每个智能体格式化系统提示

每个智能体的提示都在单独的 markdown 文件中定义,这样无需更改底层代码就可以轻松修改行为和职责。

Docker

DeepManus 可以运行在 Docker 容器中。默认情况下,API 服务器在端口 8000 上运行。

docker build -t DeepManus .
docker run --name DeepManus -d --env-file .env -e CHROME_HEADLESS=True -p 8000:8000 DeepManus

你也可以直接用 Docker 运行 CLI:

docker build -t DeepManus .
docker run --rm -it --env-file .env -e CHROME_HEADLESS=True DeepManus uv run python main.py

网页界面

DeepManus 提供一个默认的网页界面。

请参考 DeepManus/DeepManus-web 项目了解更多信息。

Docker Compose (包括前后端)

DeepManus 提供了 docker-compose 设置,可以轻松地同时运行后端和前端:

# 启动后端和前端
docker-compose up -d

# 后端将在 http://localhost:8000 可用
# 前端将在 http://localhost:3000 可用,可以通过浏览器访问

这将:

  1. 构建并启动 DeepManus 后端容器
  2. 构建并启动 DeepManus Web UI 容器
  3. 使用共享网络连接它们

在启动服务之前,请确保已准备好包含必要 API 密钥的 .env 文件。

开发

测试

运行测试套件:

# 运行所有测试
make test

# 运行特定测试文件
pytest tests/integration/test_workflow.py

# 运行覆盖率测试
make coverage

代码质量

# 运行代码检查
make lint

# 格式化代码
make format

FAQ

请参考 FAQ.md 了解更多信息。

贡献

我们欢迎各种形式的贡献!无论是修复错别字、改进文档,还是添加新功能,您的帮助都将备受感激。请查看我们的贡献指南了解如何开始。

许可证

本项目是开源的,基于 MIT 许可证

致谢

特别感谢所有让 DeepManus 成为可能的开源项目和贡献者。我们站在巨人的肩膀上。

我们特别要感谢以下项目:

  • LangChain:为我们提供了出色的框架,支撑着我们的 LLM 交互和链式操作
  • LangGraph:为我们的复杂多智能体编排提供支持
  • Browser-use:提供浏览器控制能力
  • LangManus:该项目基于LangManus

这些优秀的项目构成了 DeepManus 的基石,展现了开源协作的力量。