- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 MinerU使用
MinerU 专注于高效解析和提取复杂的 PDF 文档、网页和电子书,并将其转换为易于分析的 Markdown 或JSON 格式。• 电子书转换:支持 epub、mobi、docx、pptx、chm、azw 等格式批量转 Markdown。• 网页内容提取:从网页中剔除广告等干扰信息,精准提取正文、评论、视频文字等内容。自动去除页眉、页脚、脚注等干扰信息,保留标题、段落、列表等结构。支持多模态 PDF(含图片、表格、公式等)的结构化转换。使用modelscope快速下载各种models。
2025-10-19 23:12:46
268
原创 MCP介绍与SDK简单示例
Model Context Protocol(MCP)是由Anthropic公司于2024年11月推出的一种开放协议标准,目的在于标准化LLM与外部数据源,工具及服务之间的交互方式,MCP 被广泛类比为“AI 领域的 USB-C 接口”• 创建 MCP Server:提供标准化的 API,供 AI 模型调用外部功能(如文件操作、数据库查询等)。• Tools(工具调用):允许 AI 执行外部操作(如发送邮件、查询 GitHub、调用智能合约等)。• 简单易用:仅需几行代码即可启动 MCP Server。
2025-09-15 21:58:31
354
原创 LlamaIndex学习
LlamaIndex 是一个为开发「上下文增强」的大语言模型应用的框架(也就是 SDK)。上下文增强,泛指任何在私有或特定领域数据基础上应用大语言模型的情况。例如:LlamaIndex 有 Python 和 Typescript 两个版本,Python 版的文档相对更完善。- Python 文档地址:https://docs.llamaindex.ai/en/stable/
2024-10-15 16:26:22
1912
原创 chroma db读取PDF实操
上一篇文章简单介绍了向量数据chroma db,今天一起来学习下具体如何将pdf的内容写入chroma db,然后再根据openai来根据pdf的内容进行回复。
2024-09-29 16:22:50
730
原创 向量数据库chromadb
向量是一种有大小和方向的数学对象。它可以表示为从一个点到另一个点的有向线段。例如,二维空间中的向量可以表示为 (x,y),表示从原点 (0,0) 到点 (x,y) 的有向线段。以此类推,我可以用一组坐标 (x0,x1,…,xN−1) 表示一个 N 维空间中的向量,N 叫向量的维度。
2024-09-25 15:08:58
2413
1
原创 JVM动行时数据区域
以下是我根据JVM运行时数据区架构与各个功能的区的作用弄出来的一个简单图,由于经常容易忘记每个区的作用和经常容易混淆堆与栈的功能,所以简单整了以下的图方便自己记录:...
2018-04-18 23:23:36
140
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅