毛球

技术爱好者 · 探索者

← 返回项目列表

AI 知识库系统

📚 RAG 🔍 智能检索 🆕 新项目

Python LangChain 向量数据库

项目简介

基于RAG（检索增强生成）技术的AI知识库系统，可以让你的AI助手基于私人文档进行问答。

什么是RAG？

RAG（Retrieval Augmented Generation，检索增强生成）是一种结合了信息检索和文本生成的技术。它可以让AI在回答问题时，先从知识库中检索相关信息，然后再生成答案，从而解决大模型"知识过时"和"幻觉"的问题。

主要功能

文档上传和管理（PDF、Word、TXT、Markdown等）
自动文本分块和向量化
语义相似度检索
基于检索结果的问答
多知识库支持
API接口

技术架构

文档处理： LangChain + PyPDF2
向量化： OpenAI Embedding / BGE
向量存储： Milvus / Pinecone / Qdrant
LLM： GPT / Claude / MiniMax
后端： FastAPI

快速开始

# 添加文档
python kb.py add --file docs/

# 问答
python kb.py query "什么是RAG？"

# 启动API服务
python api.py

应用场景

企业知识库
个人笔记助手
客服知识库
产品文档问答
论文检索问答

优势

无需微调，成本更低
知识更新简单（添加文档即可）
可追溯答案来源
支持私有化部署