中文 | English

快速开始

本文档将指导您完成 DataAgent 的安装、配置和首次运行。

📋 环境要求

JDK: 17 或更高版本
MySQL: 5.7 或更高版本
Node.js: 16 或更高版本
Docker: (可选) 用于Python代码执行
向量数据库: (可选) 默认使用内存向量库

🗄️ 1. 业务数据库准备

可以在项目仓库获取测试表和数据：

文件在：data-agent-management/src/main/resources/sql，里面有4个文件：

schema.sql - 功能相关的表结构
data.sql - 功能相关的数据
product_schema.sql - 模拟数据表结构
product_data.sql - 模拟数据

将表和数据导入到你的MySQL数据库中。

# 示例：使用 MySQL 命令行导入
mysql -u root -p your_database < data-agent-management/src/main/resources/sql/schema.sql
mysql -u root -p your_database < data-agent-management/src/main/resources/sql/data.sql
mysql -u root -p your_database < data-agent-management/src/main/resources/sql/product_schema.sql
mysql -u root -p your_database < data-agent-management/src/main/resources/sql/product_data.sql

⚙️ 2. 配置

2.1 配置management数据库

在data-agent-management/src/main/resources/application.yml中配置你的MySQL数据库连接信息。

初始化行为说明：默认开启自动创建表并插入示例数据（spring.sql.init.mode: always）。生产环境建议关闭，避免示例数据回填覆盖你的业务数据。

spring:
  datasource:
    url: jdbc:mysql://127.0.0.1:3306/saa_data_agent?useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&allowMultiQueries=true&allowPublicKeyRetrieval=true&useSSL=false&serverTimezone=Asia/Shanghai
    username: ${MYSQL_USERNAME:root}
    password: ${MYSQL_PASSWORD:root}
    driver-class-name: com.mysql.cj.jdbc.Driver
    type: com.alibaba.druid.pool.DruidDataSource

2.2 数据初始化配置

默认开启自动初始化 (spring.sql.init.mode: always)。

关于如何关闭自动初始化，请参考开发者指南 - 数据库初始化配置。

2.3 配置模型

如果涉及手动管理模型依赖（非默认 Starter），请参考开发者指南 - 扩展依赖配置。

启动项目，点击模型配置，新增模型填写自己的apikey即可。

标准提供商接入如果您使用的是系统内置支持的 AI 提供商（如 OpenAI, Deepseek 等），通常只需要提供模型名称（Model Name）和 API Key。
自定义及本地模型接入 (Ollama/自建网关) 本系统基于 Spring AI 架构，支持标准的 OpenAI 接口协议。如果您接入的是 Ollama 或其他自定义网关，请注意以下几点：
- 协议兼容：请参考 Spring AI 官方文档中关于 OpenAI 兼容性的说明，确保您的网关响应格式符合标准。
- 地址配置：针对自部署模型，请准确填写 base-url（基础地址）和 completions-path（请求路径）。系统会将两者拼接为完整的调用地址，例如：http://localhost:11434/v1/chat/completions
故障排查如发现配置后无法调用，建议优先使用 Postman 对接您的接口地址进行测试，确认网络连通性及参数格式无误。

2.4 嵌入模型批处理策略配置

详细配置参数请参考开发者指南 - 开发配置手册。

2.5 向量库配置

系统默认使用内存向量库，同时系统提供了对es的混合检索支持。

2.5.1 向量库依赖引入

您可以自行引入你想要的持久化向量库，只需要往ioc容器提供一个org.springframework.ai.vectorstore.VectorStore类型的bean即可。例如直接引入PGvector的starter

<dependency>
	<groupId>org.springframework.ai</groupId>
	<artifactId>spring-ai-starter-vector-store-pgvector</artifactId>
</dependency>

详细对应的向量库参考文档：https://springdoc.cn/spring-ai/api/vectordbs.html

2.5.2 向量库schema设置

以下为es的schema结构，其他向量库如milvus，pg等自行可根据如下的es的结构建立自己的schema。尤其要注意metadata中的每个字段的数据类型。

{
  "mappings": {
    "properties": {
      "content": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "embedding": {
        "type": "dense_vector",
        "dims": 1024,
        "index": true,
        "similarity": "cosine",
        "index_options": {
          "type": "int8_hnsw",
          "m": 16,
          "ef_construction": 100
        }
      },
      "id": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "metadata": {
        "properties": {
          "agentId": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "agentKnowledgeId": {
            "type": "long"
          },
          "businessTermId": {
            "type": "long"
          },
          "concreteAgentKnowledgeType": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "vectorType": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      }
    }
  }
}

2.5.3 向量库配置参数

详细配置参数请参考开发者指南 - 开发配置手册。

2.6 检索融合策略

详细配置参数请参考开发者指南 - 开发配置手册。

2.7 替换vector-store的实现类

关于如何替换默认的内存向量库（如使用 PGVector, Milvus 等），请参考开发者指南 - 扩展依赖配置。

🚀 3. 启动管理端

在data-agent-management目录下，运行 DataAgentApplication.java 类。

cd data-agent-management
./mvnw spring-boot:run

或者在IDE中直接运行 DataAgentApplication.java。

🌐 4. 启动WEB页面

进入 data-agent-frontend 目录

4.1 安装依赖

# 使用 npm
npm install

# 或使用 yarn
yarn install

4.2 启动服务

# 使用 npm
npm run dev

# 或使用 yarn
yarn dev

启动成功后，访问地址 http://localhost:3000

🎯 5. 系统体验

5.1 数据智能体的创建与配置

访问 http://localhost:3000 ，可以看到当前项目的智能体列表（默认有四个占位智能体，并没有对接数据，可以删除掉然后创建新的智能体）

点击右上角"创建智能体" ，这里只需要输入智能体名称，其他配置都选默认。

创建成功后，可以看到智能体配置页面。

配置数据源

进入数据源配置页面，配置业务数据库（我们在环境初始化时第一步提供的业务数据库）。

添加完成后，可以在列表页面验证数据源连接是否正常。

对于添加的新数据源，需要选择使用哪些数据表进行数据分析。

之后点击右上角的"初始化数据源"按钮。

配置预设问题

预设问题管理，可以为智能体设置预设问题

配置语义模型

语义模型管理，可以为智能体设置语义模型。语义模型库定义业务术语到数据库物理结构的精确转换规则，存储的是字段名的映射关系。例如customerSatisfactionScore对应数据库中的csat_score字段。

配置业务知识

业务知识管理，可以为智能体设置业务知识。业务知识定义了业务术语和业务规则，比如GMV= 商品交易总额,包含付款和未付款的订单金额。业务知识可以设置为召回或者不召回，配置完成后需要点击右上角的"同步到向量库"按钮。

成功后可以点击"前往运行界面"使用智能体进行数据查询。调试没问题后，可以发布智能体。

目前"访问API"在当前版本并没有实现完全，预留着二次开发用的

5.2 数据智能体的运行

运行界面

运行界面左侧是历史消息记录，右侧是当前会话记录、输入框以及请求参数配置。

输入框中输入问题，点击"发送"按钮，即可开始查询。

分析报告为HTML格式报告，点击"下载报告"按钮，即可下载最终报告。

运行模式

除了默认的请求模式，智能体运行时还支持"人工反馈"，"仅NL2SQL"，"简洁报告"和"显示SQL运行结果"等模式。

默认模式

默认情况不开启人工反馈模式，智能体直接自动生成计划并执行，并对SQL执行结果进行解析，生成报告。

人工反馈模式

如果开启人工反馈模式，则智能体会在生成计划后，等待用户确认，然后根据用户选择的反馈结果，更改计划或者执行计划。

仅NL2SQL模式

"仅NL2SQL模式"会让智能体只生成SQL和运行获取结果，不会生成报告。

显示SQL运行结果

"显示SQL运行结果"会在生成SQL和运行获取结果后，将SQL运行结果展示给用户。

📚 下一步

了解架构设计以深入理解系统原理
查看高级功能了解更多高级特性
阅读开发者文档参与项目贡献

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

快速开始

📋 环境要求

🗄️ 1. 业务数据库准备

⚙️ 2. 配置

2.1 配置management数据库

2.2 数据初始化配置

2.3 配置模型

2.4 嵌入模型批处理策略配置

2.5 向量库配置

2.5.1 向量库依赖引入

2.5.2 向量库schema设置

2.5.3 向量库配置参数

2.6 检索融合策略

2.7 替换vector-store的实现类

🚀 3. 启动管理端

🌐 4. 启动WEB页面

4.1 安装依赖

4.2 启动服务

🎯 5. 系统体验

5.1 数据智能体的创建与配置

配置数据源

配置预设问题

配置语义模型

配置业务知识

5.2 数据智能体的运行

运行模式

📚 下一步

FilesExpand file tree

QUICK_START.md

Latest commit

History

QUICK_START.md

File metadata and controls

快速开始

📋 环境要求

🗄️ 1. 业务数据库准备

⚙️ 2. 配置

2.1 配置management数据库

2.2 数据初始化配置

2.3 配置模型

2.4 嵌入模型批处理策略配置

2.5 向量库配置

2.5.1 向量库依赖引入

2.5.2 向量库schema设置

2.5.3 向量库配置参数

2.6 检索融合策略

2.7 替换vector-store的实现类

🚀 3. 启动管理端

🌐 4. 启动WEB页面

4.1 安装依赖

4.2 启动服务

🎯 5. 系统体验

5.1 数据智能体的创建与配置

配置数据源

配置预设问题

配置语义模型

配置业务知识

5.2 数据智能体的运行

运行模式

📚 下一步