Skip to content

Latest commit

 

History

History
16 lines (8 loc) · 588 Bytes

File metadata and controls

16 lines (8 loc) · 588 Bytes

MachineLearningPractice

一、GhatGLM文档问答(chatglm_qa)

使用ChatGLM+langchain实现文档问答,使用gradio搭建简单UI,支持实时上传文档。

详见:chatglm_document_qa_READM.md

二、视觉版大语言模型(vision_llm)

利用yolo和CLIP模型生成图片描述,基于生成的图片描述进行图文问答。界面使用streamlit编写。

三、图像搜索(image_search)

基于Vit模型提取图像embedding,使用向量数据库进行相似度搜索,以实现图搜图功能。