Skip to content

Latest commit

 

History

History
765 lines (662 loc) · 39.4 KB

File metadata and controls

765 lines (662 loc) · 39.4 KB

MediGraphRAG

项目旨在构建一个医疗知识图谱并基于此实现 RAG(Retrieval-Augmented Generation)方法,应用于医学试题的生成,提升医学领域的信息管理与应用效率。项目通过知识点抽取、关系提取、知识增强检索和智能体,解决大模型在生成过程中可能出现的幻觉问题,确保模型生成内容的准确性和可靠性。最终目标是为医学教育和实践提供一个动态、准确的知识支持系统。

环境

  • 大模型部署工具ollama
  • 大模型开发框架: langchain
  • 编译环境python3.10
  • 数据构建模型qwen2.5:14b
  • 智能体框架metagpt
  • 智能体模型qwen2.5:32b
  • 图数据库Neo4j
  • 向量检索引擎faiss
  • 嵌入模型bge-large-zh-v1.5
  • rerank模型bge-reranker-v2-m3

数据

  • 顶层数据->医学考试试题
  • 中层数据->医学知识点[医学试题通过llm进行知识点抽取得出数据]
  • 直接检索数据->医疗知识图谱[医疗知识点通过llm进行关系抽取实现医疗实体与知识点之间相互关联数据]

知识库构建

我们知识库以知识图谱结构作为存储结构,通过大模型进行知识点的增强生成,构建实体(entity)、实体描述(description)、type(实体类型的)、知识点(knowledge)为架构的图数据库,使用Neo4j进行图数据库的存储,然后使用faiss作为向量数据库以实体(entity)、知识点(knowledge)作为索引关键字以便后续工作的检索。

知识图谱构建流程

1. 知识点抽取

通过qwen2.5:14b从医学试题中抽取考题知识点,我们需要设置promat暗示模型需要进行知识的提取,而不是进行该题目的解题

从每一道试题中提取一个知识点,将其转换为dict格式,以便后续转为json,值得注意的是由于模型处理速度偏慢,且由于本地数据清洗可能存在内存溢出,模型宕机等情况,在这里我选择进行多次IO操作,牺牲时间以保证安全性的策略,在每次读取后立即进行数据的存储

knowledge
[
   {
       "knowledge": "急性造血停滞的特点包括突然出现的全血细胞减少、网织红细胞可降至零以及骨髓中可见巨大原红细胞。此病通常在无血液病的患者中发生,且其病程常呈自限性,在适当的支持治疗下可以自然恢复。因此选项A(均发生于无血液病的患者)不符合急性造血停滞的特点。"
   },
   {
       "knowledge": "老年人行走时不慎滑倒后出现右髋部疼痛、局部压痛及下肢短缩和外旋畸形,提示可能发生髋部损伤。根据症状描述,最可能的诊断是股骨转子间骨折。此部位骨折的特点包括短缩外旋畸形,且患者的年龄和跌倒方式增加了此类骨折的可能性。"
   },
   {
       "knowledge": "梗阻性黄疸的B超诊断最直接证据是肝内胆管普遍扩张以及胆总管直径增大。选项A中的描述‘肝内胆管普遍扩张,胆总管直径1.5cm’符合这一特征。因此,A是最直接的支持梗阻性黄疸诊断的结果。"
   }
 ]
 

2. 关系抽取

在前面我们提取知识点的基础上从知识点中提取数据,同样的我们采用qwen2.5:14b进行样本的提取,大致流程与前面知识点抽取的一致,但是需要注意的是为我们需要在promat中暗示好我们所需要的实体,与关系类别,否则他将可能抽取各种奇怪的实体与关系,这会让我们在后期进行知识融合的过程十分不利

实体关系
- 实体字段
疾病(Disease):疾病名称、疾病编码(如ICD-10)、描述、分类(如慢性病、传染病等)。
药物(Drug):药物名称、剂量、适应症、禁忌、常见副作用。
症状(Symptom):症状名称、描述、严重程度、出现频率。
治疗方法(Treatment):治疗方案、方法(如手术、药物治疗)、疗效、适应症。
检查项目(Test):检查名称、目的、结果范围、相关疾病。

- 关系字段
疾病与症状:哪些症状与哪些疾病相关联(例如,咳嗽与肺炎)。
疾病与药物:哪些药物用于治疗特定疾病(例如,阿莫西林用于治疗细菌感染)。
症状与检查项目:某些症状需要进行哪些检查(例如,咳嗽需要进行胸部X光)。
药物与副作用:药物可能引起的副作用(例如,阿司匹林可能导致胃肠不适)。

关系应当包括但不限于以下:["导致症状", "伴随症状", "治疗方法", "疗效", "风险因素", "保护因素", "检查方法", "检查指标", "高发人群", "易感人群", "药物治疗", "药物副作用", "病理表现", "生物标志物", "发生率", "预后因素", "病因", "传播途径", "预防措施", "生活方式影响", "相关疾病", "诊断标准", "自然病程", "临床表现", "并发症", "危险信号", "遗传因素", "环境因素", "生活方式干预", "治疗费用", "治疗反应", "康复措施", "心理影响", "社会影响"]

由于我们任务处理的字段过多,我们实行两步走的策略构建工作流,将知识中的实体抽取后,再让模型从中寻觅关系

图谱存储格式
{
  "knowledge": "胰岛素是调节血糖水平的重要激素,胰腺是其主要分泌腺体。",
  "entities": [
    {
      "entity": "胰岛素",
      "type": "激素",
      "description": "调节血糖水平的激素"
    },
    {
      "entity": "血糖水平",
      "type": "生理指标",
      "description": "血液中的葡萄糖含量"
    },
    {
      "entity": "胰腺",
      "type": "器官",
      "description": "分泌胰岛素的腺体"
    }
  ],
  "relation": [
    {
      "entity1": "胰岛素",
      "relation": "调节",
      "entity2": "血糖水平"
    },
    {
      "entity1": "胰岛素",
      "relation": "主要分泌腺体",
      "entity2": "胰腺"
    }
  ]
}

下图为知识图谱结构:

graph

3. 图数据库构建

前面处理的存储格式明显不足以我们进行跨知识点的快速检索,故我们选择使用Neo4j进行我们图谱的存取。

Neo4j作为一个图数据库,具有更好的图谱检索能力以及更严格的格式要求

我们以relationentitydescriptiontype为实体(由于不同知识点下同一个实体的描述的方面不一致,故我们构建多个描述实体以获取更为全面的描述),构建实体知识指向和实体属性关系,以便后续进行知识检索

以下为Neo4j存储片段:

向量数据库构建

1. 嵌入模型

为了进行高效的文本向量化,我们使用了 bge-large-zh-v1.5 嵌入模型。该模型通过深度学习方法生成的向量,能够将医学实体、知识点等文本数据映射到一个高维的向量空间中。此过程主要是通过以下步骤完成:

  • 对医学领域的实体(如疾病、药物、症状等)进行向量化,以便后续检索和分析。
  • 对知识点进行向量化,确保文本信息能够被嵌入为固定长度的高维向量。

该嵌入模型能够处理大量中文医学文本,还具有较强的领域适应性,确保了在医疗相关文本中的高效表示。

2. Neo4j数据提取

在构建向量数据库之前,我们首先需要从 Neo4j 数据库中提取实体及其关系数据。根据后续的建模需求,我们分别实现了以下两类数据提取方法:

  • 根据属性、标签、ID获取实体:此方法适用于通过指定实体的特定属性、标签或ID快速检索相关实体及其属性。通过 Neo4j 提供的 Cypher 查询语言,可以灵活地获取和筛选符合条件的数据。
  • 获取全部实体:此方法用于提取数据库中所有实体及其关联关系,以便在后续的向量化过程中将所有相关数据一并处理,确保数据的全面性。

这些提取方法能够高效地从 Neo4j 数据库中获取所需的实体信息,进而为向量化操作提供充足的原始数据。

3. FAISS索引生成

在完成实体和知识点的向量化后,接下来的步骤是将其存储到向量数据库中,以便后续检索。我们选择了 FAISS(Facebook AI Similarity Search)作为向量检索引擎,FAISS 支持高效的相似度计算和存储,适合大规模向量数据的管理。

我们采用以下步骤进行 FAISS 索引生成:

  • 向量编码:使用前述的 bge-large-zh-v1.5 嵌入模型对提取到的知识点和实体进行向量编码。每个实体或知识点都被转化为一个高维向量,这些向量能够有效捕捉其语义信息。
  • 存储向量:编码后的向量数据被存储为 NumPy 数组格式,并与相应的 Neo4j 实体 ID 进行关联。这样,我们能够通过 FAISS 索引快速定位到对应的实体信息。
  • 相似度计算:我们选择了 欧几里得距离(L2距离) 作为相似度计算的度量标准。欧几里得距离是衡量向量之间相似度的经典方法,适用于我们当前的任务。FAISS 索引能够高效地进行大规模向量间的距离计算,并返回与查询向量最相似的实体。

增强检索生成与智能体

下图为我们进行增强检索生成的流程图

到这一步我们开始调用前面生成的数据进行搭建我们的医学试题生成任务的大模型工作流

我们输入关键词,如糖尿病,读取faiss的索引文件,使用faiss的相似度计算接口进行文本的匹配,其中匹配的可能存在实体知识点,我们采取的处理策略是:

  1. 知识点:提取知识点相关实体以及这些实体的类型与描述

  2. 实体:提取该实体的类型与描述,以及有关系的实体、相关知识点

检索输出案例

急性心肌梗死
('急性心肌梗死', '疾病', '心脏肌肉因冠状动脉阻塞导致的缺血性坏死'),
相关知识点:['急性心肌梗死的主要病因是冠状动脉粥样硬化,其他诱因包括劳累和情绪激动等。尽管高血压病、糖尿病、吸烟等是冠心病的重要风险因素,但直接导致该患者急性下壁心肌梗死的原因是冠状动脉的粥样硬化。', ......, '溶栓治疗通常用于急性心肌梗死等病症;介入取栓治疗主要用于血管内的血栓堵塞情况;抗凝治疗适用于预防和治疗静脉血栓形成,也常用于房颤患者以防止血栓脱落导致的脑卒中;抗血小板聚集治疗则通过抑制血小板功能来减少血栓形成的风险。对于该病例中的男66岁高血压合并房颤且超声心动图示左房大的情况,选用的治疗是抗凝治疗(C选项),以降低心房内血栓形成和脱落引起脑卒中的风险。'],
相关实体:[('急性心肌梗死', '导致并发症', '心脏破裂'), ('急性心肌梗死', '由...导致', '冠状动脉内血栓形成'), ('急性心肌梗死', '治疗方法', '急诊介入手术'), ......, ('急性心肌梗死', '导致', '乳头肌功能不全'), ('急性心肌梗死', '导致症状', '上腹疼痛'), ('急性心肌梗死', '风险因素', '心脏功能不全')]

急性透壁性心肌梗死


('急性透壁性心肌梗死', '疾病', '心脏的一种严重状况'),
相关知识点:['急性透壁性心肌梗死后3周,梗死灶内的主要发现是梗死区域被肉芽组织包围并开始机化,形成瘢痕组织。因此,正确答案为D.大片纤维疤痕形成。'],
相关实体:[('急性透壁性心肌梗死', '导致病理变化', '梗死区域')]

急性下壁心肌梗死


('急性下壁心肌梗死', '疾病', '心脏下壁区域的心肌细胞死亡'),
相关知识点:['心电图检查中可能出现的改变包括S1Q3T3,这通常提示急性下壁心肌梗死或其他心脏问题。', '急性心肌梗死的主要病因是冠状动脉粥样硬化,其他诱因包括劳累和情绪激动等。尽管高血压病、糖尿病、吸烟等是冠心病的重要风险因素,但直接导致该患者急性下壁心肌梗死的原因是冠状动脉的粥样硬化。'],
相关实体:[]

为了提高这些数据与我们所面向的生成的关键词的相关性,我们再引入一层rerank模型:bge-reranker-v2-m3进行重排序,最终挑出语义最相似的三份数据

这些数据整理出来后仍欠缺解释能力,如实体之间的关系我们直接传递给大模型,再赋予其他任务会导致模型的解释能力下降,以及未整理的数据过长导致模型的任务能力下降,我们借助metagpt构建一个双模型的智能体工作流来进行数据的解释与实体的生成,metagpt是一个多智能体框架,可以有效的利用我们构建的两个智能体模型,让他们进行有效的衔接工作。以下我将解释模型和任务模型称之为解释器和生成器。

解释器

解释模型prompt
数据:{knowledge}
你是一个医学知识处理系统,任务是从给定的医学数据中提取和构建结构化的知识点,并通过相关实体中的三元知识图谱信息去完善和补充知识点。请按照以下要求进行处理:

1. **数据清洗与标准化**:
  - 输入:包含医学实体(如疾病、症状、治疗、病因等)及其相关描述的原始数据。
  - 清洗后的医学数据,标准化的实体及描述。确保实体名称一致、术语精确,去除冗余和无关信息。

2. **知识点提取与扩展**:
  - 请基于你你的医学知识背景进行诊断生成
  - 从输入的医学实体信息中提取并构建有意义的**知识点**。这些知识点可以包括病因、症状、治疗方法、并发症等领域。
  - 利用相关实体中的**三元知识图谱**信息(例如:`(实体1, 关系, 实体2)`)来补充和完善已有的知识点,或是从中生成新的知识点。
    - 例如,从已知的三元关系`('肺炎链球菌', '导致症状', '铁锈色痰')`可以推导出新的知识点:“肺炎链球菌引起的肺炎常伴有铁锈色痰”。
  - 确保通过三元关系补充的知识点和从文本中提取的知识点保持一致,并标注每个知识点的类别,如“症状”、“病因”、“治疗方法”等。

3. **数据优化**:
  - 确保提取的知识点没有冗余和无关信息,所有知识点都要有医学背景支持,避免模糊或重复的表述。
  - 在结合三元知识图谱信息时,确保新的知识点有充足的证据支持,并且不会引入误导性或不准确的信息。

4. **结构化输出**:
  - 输出一个字典数据结构,其中键为 `knowledge`,值为一个包含相关知识点的列表,确保输出格式结构清晰且便于后续处理。
  - 示例输出格式:

    {{
      "knowledge": [
        "尿毒症是一种由于慢性肾功能衰竭导致的代谢性疾病",
        "尿毒症的症状包括食欲丧失、恶心、呕吐、乏力等",
        "尿毒症可能由多种病因引起,包括急性肾衰竭、慢性肾病等",
        "尿毒症的治疗方法包括透析治疗、肾移植等"
      ]
    }}

5. **输出结果**:
   - 提取清晰且有意义的医学知识点,确保这些知识点与相关医学实体(如病因、症状、治疗等)之间的关系正确,并且通过三元知识图谱信息得到了适当的扩展和补充。
   - 输出的结果应当结构化、准确,能够方便后续医学分析、推理或决策支持。
   - 请严格按照示例输出格式进行输出

我们匹配相关的k个实体/知识点,进入我们的解释模型,生成n个考点,最后prompt进行任务的输出,实现通过一个关键词生成多考点的增强检索生成,其输出为:

{
    "knowledge": [
        "急性心肌梗死是一种心脏疾病,其特点包括高大T波和ST段抬高的表现",
        "急性心肌梗死可能导致的症状有胸痛、发热等",
        "急性心肌梗死可能伴有症状如心包摩擦音和胸腔积液",
        "急性心肌梗死可并发三度房室传导阻滞,导致心源性休克",
        "急性心肌梗死可能导致乳头肌功能不全,并引发上腹疼痛",
        "心脏功能不全是急性心肌梗死的风险因素之一",
        "急性透壁性心肌梗死后3周,梗死区域被肉芽组织包围并开始机化,形成瘢痕组织",
        "急性下壁心肌梗死是心脏下壁区域的心肌细胞死亡",
        "S1Q3T3在心电图检查中可能出现的改变通常提示急性下壁心肌梗死或其他心脏问题"
    ]
}

在调用任务模型前,我们需要留意的一点是,我们进行试题的生成中,模型会高相似的仿造我们给出的样例的结构进行试题的生成,但是试题本身是具有多样的考察结构,并且各种题型的考察方式和试题特点都各不相同,我们需要构建一个特定的框架以适应不同的题型

生成器

任务模型prompt
你是医学领域的专业大学教授,现在需要你根据我传递给你的知识库内容构建一道选择题,以考察考生的专业能力

**输出要求:**

- 我发给你的内容是相关需要生成的试题的知识点
- 你需要确保你给的题目具有逻辑性且有唯一正确答案
- 基于知识库进行试题的生成
- 试题考察尽量不要过于简单
- 你需要返回题目、选项、答案、解析
- 确保输出是紧凑格式的有效JSON格式,不包含任何其他解释、转义符、换行符或反斜杠
- 请确保生成的试题的专业性,确保语言的逻辑能力与问题提问方式的合理性
- 请根据你的医学知识进行分析,确保题目生成的正确性
- 按照题目题型特点生产试题,特点为:{qtype}

**知识库内容:**
{knowledge_description}

**输出案例(仅提供格式输出,不提供知识点参考,禁止完全仿照相同格式进行试题生成):**

{case}

"""

其中qtype为试题特点,knowledge_description为解释模型输出信息,case为试题输出案例

模型输出
{
    "topic": "在急性肾衰竭的诊断中,下列哪一项实验室检查指标最能支持肾缺血性急性肾衰竭的诊断?",
    "options": {
        "A": "尿钠浓度<20mmol/L",
        "B": "尿比重固定在1.010-1.014之间",
        "C": "尿钠浓度>20mmol/L",
        "D": "血肌酐每日升高>176.8μmol/L"
    },
    "answer": "C",
    "parse": "支持肾缺血性急性肾衰竭的实验室检查指标是尿钠浓度>20mmol/L,这表明近端肾小管功能受损而远端相对保留。"
}

截至为此完成试题生成的基本工作

附录

试题样式

[
    {
        "名称": "概念判断题",
        "特点": "针对基本概念的理解与记忆,要求考生判断对错或从多个选项中选择符合题干描述的正确答案。",
        "输出案例": [
            {
                "topic": "有关人体内控制系统中的调定点,错误的描述是?",
                "options": {
                    "A": "调定点通过负反馈调节",
                    "B": "调定点是内环境稳定的标准值",
                    "C": "调定点不可调节",
                    "D": "调定点可受环境因素影响"
                },
                "answer": "C",
                "parse": "调定点是一个通过反馈机制调节的标准值,通常不受外部因素直接改变,因此错误的描述是C选项。"
            },
            {
                "topic": "不参与构成核小体核心颗粒的组蛋白是?",
                "options": {
                    "A": "H1",
                    "B": "H2A",
                    "C": "H2B",
                    "D": "H3"
                },
                "answer": "A",
                "parse": "核小体核心颗粒由H2A、H2B、H3和H4组成,H1不参与其中。"
            },
            {
                "topic": "左下肢骨折固定6周后变细,这种病变属于?",
                "options": {
                    "A": "骨萎缩",
                    "B": "骨质疏松",
                    "C": "骨变形",
                    "D": "骨折不愈合"
                },
                "answer": "A",
                "parse": "骨折后固定期骨头会因为缺乏负重而出现骨萎缩,导致骨骼变细。"
            },
            {
                "topic": "非寒战产热作用最强的组织是?",
                "options": {
                    "A": "肝脏",
                    "B": "骨骼肌",
                    "C": "脂肪组织",
                    "D": "大脑"
                },
                "answer": "B",
                "parse": "骨骼肌通过剧烈运动是非寒战产热作用最强的组织。"
            },
            {
                "topic": "蛋白质常发生磷酸化的氨基酸残基有?",
                "options": {
                    "A": "Ser、Thr、Tyr",
                    "B": "Pro、Glu、His",
                    "C": "Cys、Asn、Met",
                    "D": "Leu、Val、Ala"
                },
                "answer": "A",
                "parse": "磷酸化常发生在Ser、Thr、Tyr等氨基酸残基上。"
            },
            {
                "topic": "急性细菌性炎症早期主要渗出细胞是?",
                "options": {
                    "A": "中性粒细胞",
                    "B": "单核细胞",
                    "C": "淋巴细胞",
                    "D": "嗜酸性粒细胞"
                },
                "answer": "A",
                "parse": "急性细菌性炎症早期渗出细胞主要是中性粒细胞。"
            },
            {
                "topic": "肾脏分泌NH3和NH4+的描述,正确的有?",
                "options": {
                    "A": "主要通过近曲小管分泌",
                    "B": "有助于维持酸碱平衡",
                    "C": "与尿液酸性有关",
                    "D": "与肾单位的浓缩功能无关"
                },
                "answer": "B, C",
                "parse": "肾脏通过分泌NH3和NH4+来帮助维持酸碱平衡,并与尿液酸性有关。"
            }
        ]

    },
    {
        "名称": "机制分析题",
        "特点": "考察生理、生化、病理等机制或过程的理解。",
        "输出案例": [
            {
                "topic": "骨骼肌细胞横管膜L型钙通道激活后的生理效应是?",
                "options": {
                    "A": "肌肉收缩",
                    "B": "肌肉松弛",
                    "C": "钙离子进入细胞",
                    "D": "钠离子外流"
                },
                "answer": "A",
                "parse": "L型钙通道的激活导致钙离子流入肌细胞,触发肌肉收缩。"
            },
            {
                "topic": "在糖无氧酵解代谢调节中,磷酸果糖激酶-1最强别构激活剂是?",
                "options": {
                    "A": "ATP",
                    "B": "AMP",
                    "C": "NADH",
                    "D": "ADP"
                },
                "answer": "B",
                "parse": "AMP是磷酸果糖激酶-1的强别构激活剂,在糖无氧酵解中起重要作用。"
            },
            {
                "topic": "导致糖尿病酮症的主要脂代谢紊乱是?",
                "options": {
                    "A": "脂肪酸氧化增加",
                    "B": "胆固醇合成增加",
                    "C": "脂肪酸合成减少",
                    "D": "酮体合成增加"
                },
                "answer": "D",
                "parse": "糖尿病酮症的发生与酮体合成增加密切相关,尤其在胰岛素不足时。"
            },
            {
                "topic": "关于NO对循环系统作用的描述,正确的有?",
                "options": {
                    "A": "NO通过血管扩张降低血压",
                    "B": "NO促进血小板聚集",
                    "C": "NO增加心脏输出量",
                    "D": "NO与抗炎作用有关"
                },
                "answer": "A, D",
                "parse": "NO通过血管扩张降低血压,并具有抗炎作用。"
            },
            {
                "topic": "慢性阻塞性肺疾病患者发生肺动脉高压的最重要机制是?",
                "options": {
                    "A": "肺小动脉的重塑",
                    "B": "血液黏稠度增加",
                    "C": "氧气分压下降",
                    "D": "肺泡通气量增加"
                },
                "answer": "A",
                "parse": "慢性阻塞性肺疾病导致的肺小动脉重塑是引发肺动脉高压的最重要机制。"
            },
            {
                "topic": "转运肝合成的内源性胆固醇至全身组织的脂蛋白是?",
                "options": {
                    "A": "低密度脂蛋白(LDL)",
                    "B": "高密度脂蛋白(HDL)",
                    "C": "极低密度脂蛋白(VLDL)",
                    "D": "胆固醇酯"
                },
                "answer": "A",
                "parse": "低密度脂蛋白(LDL)负责转运肝脏合成的胆固醇至全身组织。"
            },
            {
                "topic": "参加嘌呤核苷酸从头合成途径的主要关键酶是?",
                "options": {
                    "A": "磷酸果糖激酶-1",
                    "B": "酰基转移酶",
                    "C": "PRPP合成酶",
                    "D": "腺苷酸激酶"
                },
                "answer": "C",
                "parse": "PRPP合成酶是嘌呤核苷酸从头合成途径的关键酶。"
            }
        ]

    },
    {
        "名称": "症状诊断题",
        "特点": "通过患者的症状、体征和实验室检查结果,采用通俗化的语言,模拟病例或描绘场景,确保描述能引导考生通过归纳和提取信息来作答,考察考生的临床推理能力。注意一般只进行病状的描述,而不是直接说明其的疾病,强调一下疾病和症状是不一样的,概念多数时候不能混用,如‘肌无力一般不会直接描述,多数时候表述是眼睑下垂四肢乏力’",
        "输出案例": [
            {
                "topic": "23岁男性,发热、寒战,伴乏力和脾肿大,最可能的诊断是?",
                "options": {
                    "A": "传染性单核细胞增多症",
                    "B": "急性白血病",
                    "C": "淋巴瘤",
                    "D": "慢性肝炎"
                },
                "answer": "A",
                "parse": "发热、寒战伴乏力和脾肿大常见于传染性单核细胞增多症。"
            },
            {
                "topic": "45岁男性,右季肋部胀痛,既往乙肝10余年,最可能的诊断是?",
                "options": {
                    "A": "肝硬化",
                    "B": "胆囊炎",
                    "C": "胃溃疡",
                    "D": "肝癌"
                },
                "answer": "A",
                "parse": "右季肋部胀痛伴有长期乙肝史,最可能的诊断是肝硬化。"
            },
            {
                "topic": "18岁女性,乏力、面色苍白,血常规提示小细胞低色素贫血,最可能的诊断是?",
                "options": {
                    "A": "缺铁性贫血",
                    "B": "地中海贫血",
                    "C": "巨幼细胞贫血",
                    "D": "慢性病贫血"
                },
                "answer": "A",
                "parse": "小细胞低色素贫血和乏力、面色苍白常见于缺铁性贫血。"
            }
        ]

    },
    {
        "名称": "治疗与处理题",
        "特点": "关注疾病的治疗原则、首选药物或手术方式。",
        "输出案例": [
            {
                "topic": "急性前壁心肌梗死,急诊处理最正确的是?",
                "options": {
                    "A": "立刻进行冠脉造影",
                    "B": "使用溶栓药物",
                    "C": "进行紧急手术",
                    "D": "静脉输液和止痛"
                },
                "answer": "B",
                "parse": "急性前壁心肌梗死的急诊处理应尽早使用溶栓药物。"
            },
            {
                "topic": "15岁男性肾病综合征患者,最主要的治疗药物是?",
                "options": {
                    "A": "激素类药物",
                    "B": "抗生素",
                    "C": "免疫抑制剂",
                    "D": "利尿剂"
                },
                "answer": "A",
                "parse": "肾病综合征的主要治疗药物是激素类药物,用于减轻肾脏炎症反应。"
            }
        ]

    },
    {
        "名称": "综合型分析题",
        "特点": "涉及多学科内容,综合考察考生的知识应用能力。",
        "输出案例": [
            {
                "topic": "可通过激活酪氨酸激酶受体完成细胞信号转导的配体有?",
                "options": {
                    "A": "胰岛素",
                    "B": "生长因子",
                    "C": "细胞因子",
                    "D": "激素"
                },
                "answer": "A, B",
                "parse": "胰岛素和生长因子都可以通过激活酪氨酸激酶受体来完成细胞信号转导。"
            },
            {
                "topic": "6年前心肌梗死,评估目前心功能的检查方法包括?",
                "options": {
                    "A": "心电图",
                    "B": "超声心动图",
                    "C": "胸片检查",
                    "D": "心肌酶检测"
                },
                "answer": "B",
                "parse": "超声心动图是评估心功能最常用的检查方法,能够全面反映心脏的收缩与舒张功能。"
            }
        ]

    },
    {
        "名称": "题干分析题",
        "特点": "给定一个医学场景或背景,要求考生基于题干内容提出多个问题,考察其推理、分析与综合能力。同时通过在题干描述中加入与诊断不完全相关的症状和检查结果,考察考生从混杂信息中筛选关键信息、排除干扰项并作出正确诊断的能力。注意一般只进行病状的描述,而不是直接说明其的病名,如‘肌无力一般不会直接描述,多数时候表述是眼睑下垂四肢乏力’",
        "输出案例": [
            {
                "topic": "一名65岁男性患者,长期吸烟,近半年有持续咳嗽、咳痰,偶有气短,体检时发觉右侧胸部有哑音,胸片显示右肺上叶局部阴影。以下是该患者可能的诊断问题:",
                "questions": [
                    {
                        "question": "该患者的最可能诊断是?",
                        "options": {
                            "A": "肺炎",
                            "B": "肺结核",
                            "C": "慢性阻塞性肺疾病(COPD)",
                            "D": "肺癌"
                        },
                        "answer": "D",
                        "parse": "患者的吸烟史、持续咳嗽、咳痰和胸片阴影提示可能存在肺癌,尤其是右肺上叶局部阴影。"
                    },
                    {
                        "question": "对于这种患者,应该做的首项检查是什么?",
                        "options": {
                            "A": "肺功能测试",
                            "B": "CT扫描",
                            "C": "血气分析",
                            "D": "支气管镜检查"
                        },
                        "answer": "B",
                        "parse": "CT扫描是评估肺部阴影、肿瘤及肺部病变的金标准检查,能够更清晰地显示肿瘤的大小、位置和特征。"
                    },
                    {
                        "question": "该患者是否需要进行手术治疗?",
                        "options": {
                            "A": "不需要,目前可以药物治疗",
                            "B": "需要,根据肿瘤大小和病变位置决定",
                            "C": "需要,所有肺癌患者均需要手术",
                            "D": "不需要,应该采取放疗治疗"
                        },
                        "answer": "B",
                        "parse": "是否需要手术治疗要根据肿瘤的大小、位置及转移情况来决定。早期肺癌可能需要手术治疗,而晚期则可能需要化疗或放疗。"
                    }
                ]
            },
            {
                "topic": "一名45岁女性患者,突然出现剧烈腹痛,伴有恶心、呕吐,体检发现腹部触痛明显,血常规检查显示白细胞增高。以下是该患者的分析问题:",
                "questions": [
                    {
                        "question": "该患者最可能的诊断是?",
                        "options": {
                            "A": "急性胃炎",
                            "B": "急性阑尾炎",
                            "C": "急性胰腺炎",
                            "D": "消化性溃疡穿孔"
                        },
                        "answer": "C",
                        "parse": "剧烈腹痛、恶心呕吐和白细胞增高提示急性胰腺炎,尤其是在女性患者中更为常见。"
                    },
                    {
                        "question": "下一步最重要的检查是什么?",
                        "options": {
                            "A": "腹部X线检查",
                            "B": "腹部CT扫描",
                            "C": "腹部超声",
                            "D": "血清胰酶检查"
                        },
                        "answer": "B",
                        "parse": "CT扫描能够清晰显示胰腺的病变范围,有助于确认胰腺炎的诊断及排除其他可能的腹部病变。"
                    },
                    {
                        "question": "该患者的急性胰腺炎治疗中最重要的措施是什么?",
                        "options": {
                            "A": "抗生素治疗",
                            "B": "静脉补液",
                            "C": "止痛药治疗",
                            "D": "手术治疗"
                        },
                        "answer": "B",
                        "parse": "急性胰腺炎的治疗关键是静脉补液,保持水、电解质平衡,避免进一步加重病情。"
                    }
                ]
            },
            {
                "topic": "一名60岁男性患者,长期高血压,出现头痛、视力模糊、呕吐,神经系统检查显示轻度瘫痪。CT扫描显示大脑内有出血影像。以下是该患者可能的诊断问题:",
                "questions": [
                    {
                        "question": "该患者最可能的诊断是?",
                        "options": {
                            "A": "急性脑梗死",
                            "B": "脑出血",
                            "C": "高血压危象",
                            "D": "颅内肿瘤"
                        },
                        "answer": "B",
                        "parse": "患者的高血压病史及CT扫描的出血影像提示脑出血。头痛、视力模糊及神经系统症状也符合脑出血的表现。"
                    },
                    {
                        "question": "治疗该患者的首要措施是什么?",
                        "options": {
                            "A": "降压治疗",
                            "B": "手术治疗",
                            "C": "止血药物",
                            "D": "抗凝治疗"
                        },
                        "answer": "A",
                        "parse": "对脑出血患者而言,首先要控制血压,避免进一步加重出血。降压治疗应谨慎进行,避免血压过低。"
                    },
                    {
                        "question": "若该患者的出血量较大,可能需要采取什么措施?",
                        "options": {
                            "A": "紧急手术",
                            "B": "抗血小板治疗",
                            "C": "使用血管收缩药",
                            "D": "静脉补液"
                        },
                        "answer": "A",
                        "parse": "大出血可能需要紧急手术治疗,进行血肿清除和止血,以防止生命危险。"
                    }
                ]
            },
            {
                "topic": "一名30岁女性患者,出现双侧膝关节疼痛,伴有晨僵,持续时间较长。她有家族性类风湿性关节炎病史。以下是该患者可能的诊断问题:",
                "questions": [
                    {
                        "question": "该患者最可能的诊断是?",
                        "options": {
                            "A": "骨关节炎",
                            "B": "类风湿性关节炎",
                            "C": "痛风",
                            "D": "强直性脊柱炎"
                        },
                        "answer": "B",
                        "parse": "患者的膝关节疼痛、晨僵以及家族史符合类风湿性关节炎的表现,尤其是双侧关节受累。"
                    },
                    {
                        "question": "为确诊类风湿性关节炎,应该做什么检查?",
                        "options": {
                            "A": "X光检查",
                            "B": "血清抗环瓜氨酸肽抗体(CCP)检查",
                            "C": "关节超声",
                            "D": "尿酸水平检查"
                        },
                        "answer": "B",
                        "parse": "血清抗环瓜氨酸肽抗体(CCP)检查是类风湿性关节炎的特异性检查,能够帮助确诊。"
                    },
                    {
                        "question": "如果确诊为类风湿性关节炎,最重要的治疗措施是什么?",
                        "options": {
                            "A": "非甾体抗炎药(NSAIDs)",
                            "B": "糖皮质激素治疗",
                            "C": "抗风湿药物(DMARDs)",
                            "D": "手术治疗"
                        },
                        "answer": "C",
                        "parse": "抗风湿药物(DMARDs)是类风湿性关节炎的基础治疗药物,能够减缓疾病进展,控制症状。"
                    }
                ]
            }
        ]
    }

]