Skip to content

Commit 2e97064

Browse files
committed
add 2 demos
1 parent 3d2c89f commit 2e97064

13 files changed

Lines changed: 73 additions & 3 deletions

File tree

content/alumni/_index.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -10,7 +10,7 @@ sections:
1010
text: |
1111
- **博士毕业生**:
1212
- 王安特
13-
- 发表论文:CCF-A类4篇,CCF-A类Findings 1篇,CCF-B类2篇,CCF-B类Findings 1篇
13+
- 发表论文:CCF-A类5篇,CCF-A类Findings 1篇,CCF-B类2篇,CCF-B类Findings 1篇
1414
- 实习经历:21.07-23.07、24.01-25.06 腾讯AI Lab西雅图实验室实习
1515
- 毕业去向:清华大学智能产业研究院博后
1616
1.19 MB
Loading
60.1 KB
Loading

content/demo/1/featured.png

573 KB
Loading

content/demo/1/index.md

Lines changed: 31 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
---
2+
title: GraphRAG 可视化交互系统演示
3+
date: 2025-12-01
4+
---
5+
  本视频展示了一套DeepLIT课题组自主研发的 GraphRAG 可视化交互 Web 系统。针对当前 RAG 技术中推理过程不透明、策略对比困难的问题,本系统集成了微软 GraphRAG 与港大 LightRAG 两大主流框架,为研究人员和开发者提供了一个强大的测试与分析环境。
6+
7+
<!--more-->
8+
<video controls width="100%" src="GraphRAGdemo.mp4">
9+
您的浏览器不支持视频播放。
10+
</video>
11+
12+
## 核心功能亮点:
13+
14+
- **多框架集成与对比**:内置 Microsoft GraphRAG 与 LightRAG,直观对比不同图谱构建策略的性能优劣。
15+
- **一键式图谱构建**:通过简单的文件拖拽(TXT格式),系统自动完成文本分块、实体/关系抽取、向量化及图谱生成的全流程。
16+
- **白盒化推理展示**:不仅返回 LLM 生成的答案,更实时渲染推理路径上的子图结构。用户可交互式查看被检索到的节点与边,验证答案的逻辑来源。
17+
- **灵活参数调优**:支持在问答界面动态调整社区层级(Community Level)与查询模式,探索不同粒度信息对回答质量的影响。
18+
---
19+
## 背景知识
20+
### 什么是 GraphRAG?
21+
GraphRAG(Graph Retrieval-Augmented Generation)是下一代检索增强生成技术。传统的 RAG 依赖向量相似度检索,容易在长文本摘要和跨文档的复杂逻辑推理中丢失“全局视野”。 GraphRAG 通过构建知识图谱(Knowledge Graph),将非结构化文本转化为结构化的网络。它利用 **社区检测(Community Detection)** 算法将紧密关联的信息聚类,让大模型不仅能“看到”细节,还能“理解”数据集中蕴含的高层级主题和隐式关系。
22+
本系统集成的两大框架解析:
23+
1. **Microsoft GraphRAG (基于社区摘要)**:
24+
- 特点:利用 Leiden 算法检测图谱社区,并为每个社区生成摘要。
25+
- 优势:在回答“整个数据集主要讲了什么?”这类全局性问题(Global Sensemaking) 时表现卓越,能够提供全面的综合性答案。
26+
2. **LightRAG (高效检索)**:
27+
- 特点:由香港大学提出,强调轻量化与双层检索机制。
28+
- 优势:引入了具体查询(Specific)与抽象查询(Abstract)的双重检索路径,旨在降低构建图谱的 Token 消耗,同时保持对细节问题的高精度响应。
29+
30+
### 为什么我们需要可视化?
31+
在知识图谱增强的大模型应用中,可解释性至关重要。虽然 GraphRAG 提升了回答质量,但用户往往不知道模型引用了图谱中的哪一部分。本 Demo 通过子图可视化(Subgraph Visualization),将模型的“思维过程”具象化,这对于发现幻觉(Hallucination)、优化知识库质量以及调试检索策略具有不可替代的作用。

content/demo/2/featured.png

1.12 MB
Loading

content/demo/2/index.md

Lines changed: 39 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,39 @@
1+
---
2+
title: 智能关系抽取助手系统演示
3+
date: 2025-12-02
4+
---
5+
&emsp;&emsp;本 Demo 展示了一款多功能的智能关系抽取系统。它不仅支持基于 Schema 的 **文档级****跨文档** 关系抽取,还能根据需求灵活输出表格、JSON 代码或自然语言描述。无论是处理长篇历史文献还是实时新闻,模型都能精准识别实体间的复杂关系,助力知识图谱的高效构建。
6+
7+
<!--more-->
8+
<video controls width="100%" src="信息抽取.mp4">
9+
您的浏览器不支持视频播放。
10+
</video>
11+
12+
## 视频详情
13+
&emsp;&emsp;本视频完整演示了智能抽取模型在三种不同场景下的应用能力,突显了其在知识工程中的灵活性与准确性:
14+
1. **跨文档关系抽取 (Cross-Document RE)**
15+
- 场景: 面对来源分散、篇幅较长的多文档文本(如历史百科与地理志)。
16+
- 能力: 模型能够跨越段落界限,综合上下文信息,精准提取出“被...创立”、“竞争阶级”等深层关系。
17+
- 呈现: 默认以清晰的**结构化表格**展示,便于人工校验。
18+
2. **文档级关系抽取 (Document-Level RE)**
19+
- 场景: 处理单一长文本中的密集信息。
20+
- 能力: 在给定 Schema(如“包含部分”、“位于...”)下,模型展现了强大的逻辑推理能力。
21+
- 呈现: 支持开发者友好的 **JSON 格式**输出,可直接对接下游数据库或图谱构建流程。
22+
3. **开放式关系抽取 (Open RE)**
23+
- 场景: 处理娱乐新闻或社交媒体等非正式文本。
24+
- 能力: 即使面对口语化的输入,模型也能理解语义并完成抽取。
25+
- 呈现: 支持 **自然语言 (Natural Language)** 输出,将抽取结果转化为通顺的文字描述,增强了可解释性。
26+
---
27+
## 技术背景
28+
1. **信息抽取**
29+
30+
在大语言模型时代,信息抽取(Information Extraction, IE)依然是连接非结构化数据(文本)与结构化知识(知识图谱)的关键桥梁。视频中展示的 Schema(图谱模式)定义过程,实际上就是一种轻量级的本体(Ontology)对齐。通过预先定义关系类型(如 founded by, part of),我们将原本混乱的文本“降噪”并映射到了具体的知识网络中,这是构建高质量垂直领域知识图谱的第一步
31+
32+
2. **跨文档推理的挑战与突破**
33+
34+
视频演示的重点之一是跨文档抽取。在现实世界中,关于同一个实体(如“Apple”)的信息往往分散在不同的报告或新闻中。传统的抽取模型往往受限于单句或单文档长度,难以处理这种碎片化信息。本系统展示了模型在处理 Long Context(长上下文)时的记忆与推理能力,这对于解决知识图谱构建中的实体消歧和信息融合问题至关重要。
35+
36+
3. **生成式抽取的灵活性**
37+
38+
不同于传统的序列标注方法,本 Demo 展示了**生成式抽取(Generative IE)**的优势。模型不仅是在“寻找”答案,更是在“生成”符合用户指定格式(Table/JSON/Text)的答案。这种 Capability 使得该系统不仅可以服务于后端工程师(提供 JSON),也能直接服务于业务分析师(提供表格)或最终用户(提供自然语言摘要),极大地扩展了落地场景。
39+

content/demo/3/ed1091c076eae14b10901d3310216bb4.mp4 renamed to content/demo/3/1.mp4

File renamed without changes.

content/demo/4/3a53cb4baf0939dedd15b3cb16c478b4.mp4 renamed to content/demo/4/1.mp4

File renamed without changes.

0 commit comments

Comments
 (0)