Deepseek学习笔记

Deepseek R1常见的主要有如下几个常用的参数版本:

1.5B,基本所有电脑都跑的起来,开发的时候小规模调试很方便,你可以用这个来熟悉各种开发语言与其打交道。
7B,对电脑的配置会有一定的要求,通常4090显卡或平果最新的M系列芯片都可以跑,我有一个1650也能勉强跑起来,但明显速度慢很多。
70B,基本能满足企业的应用。成本基本都在百万以内。
671B,传说中的满血版,部署需要大规模硬件投资。常规部署的成本在百万以上,但也有小成本方案,比如8台M4 pro的Mac mini。如果考虑到模型微调这个成本还会成倍增长。
参数的差距会有多大的不同,比如下图我用1.5B,大小写的问题居然就识别不出来。
 

img


所以条件足够的话,开发尽量选7B。

模型的知识怎么来的

从官方得到的都是通用大模型,是基于海量的信息训练得来的。如果需要建立垂直领域(或者说某一专业领域)的解决方案,比如医疗,法律或者公司内部文件,可以对模型进行微调或者通过RAG。
RAG个人理解是给大模型之外挂接了一个增量模型。是大模型的一个外部知识库。
它俩的区别可以比作成一个历史考试,前者是闭卷考时,后者是开卷考试。闭卷考试就是经过一个学期的学习,你已经把知识记在了脑子里。而开卷考试,就是你现去查书中去寻找答案。所以你能看到,成绩一般的学了一个学期学生,这么考下来可能跟一个聪明点的小学生开卷考同样的东西,成绩不会差太多。

微调和RAG怎么选

先说一下,这个微调,别看有个微,其牵扯到的资源和成本可不少。
说回考试的例子,如果你想通过闭卷考时那么就需要长时间的学习,但如果是闭卷考时,在了解一定的技巧之上那么你也能顺利的通过考试。可以看到这两种方式的时间成本差异是很大的。
此外模型的微调需要的硬件成本巨高,而且需要大量的专业内知识数据,以及大量的时间(以周甚至月记)。而且微调比较黑盒,结果难以预测。
RAG方案可以快速的给大模型挂接知识,成本低见效快。
即使是你两三个文档的更新,RAG也照样能接待,但微调的话可能合不上成本。
通常对于有海量固定知识的情况适用于模型微调,但是因为其时间很长成本高,很难获取最新的知识,所以可以通过模型微调加RAG补充最新或者经常变化的那部分来解决。
RAG是目前大多数企业采用的方式,当然缺点是如果是海量数据(PB以上)那么会有性能问题。所以常规的方案还是海量数据用模型微调,增量或者经常变化的数据或者信息用RAG。
从另一个角度我问了下豆包,10GB(我也问了100GB的)的资料,微调和RAG哪个更适合,答案是RAG,尤其资料是经常变化的。但到什么级别必须得用微调,这个需要考虑的因素很多,在数据量上没有一个固定的答案。

成熟的应用

公司内的问答。可以把公司内的数据通过RAG读取,然后供所有员工查询。
开发文档规范审查,比如你创建的数据库,是否符合命名规范。
个人知识库,把自己多年沉淀的文档输入知识库,方便自己随时查询。
对于一个程序员:告诉我一个功能怎么实现,或者给我生成一个文档。
对于一个文员:给我生成一篇文章。
对于自媒体:给我写一个关于某某某的文案。
对于我写这篇文章:学习各个知识点,帮我验证一些自己的理解。
总之关于AI的潜力开发空间是很大的,了解了它之后你才会知道在什么场合他能帮到你。

个人怎么玩

不管是苹果还是Windows,先下载Ollama,然后在Ollama里下载对应的Deepseek,这个操作完成后,就可以在命令行下玩问答。但如前面所说,如果是1.5B,那么不要对回答期望太高,如果部署了7B,那么勉强可玩。以上你要是想做开发什么的,足够了。
 

img


进一步想玩RAG来搭建个人知识库,可以下载一个anything LLM。这个工具的优点是操作有UI,不需要敲复杂的指令。需要注意的是在ollma里不仅需要pull一个R1模型,还需要pull一个embed模型,然后在anything LLM里配置好就可以了。如果你想尝试本地deepseek能干啥,个人知识库怎么搭建,用这个就够了。
 

img


如果你想进阶折腾一下,想大概了解下更专业点的方案,那么在这个基础上就可以自己去折腾RAG方案,比如RAGFLOW或者Dify。这个要下载和配置很多东西,没有点经验的话,按照网络上你能搜到的能搜索到的方法都不一定能走的通。而且又Git又docker的,没点方法有些步骤搞不定。
至于微调的话这个实在太复杂,不建议个人在自己的设备上折腾。

<think>好的,我现在需要帮助用户解决如何使用DeepSeek将PDF电子书转化为学习笔记的问题。首先,我要仔细分析用户的问题,了解他们的需求。用户提到了DeepSeek工具,可能指的是深度求索(DeepSeek)公司开发的相关AI工具。根据提供的引用资料,特别是引用[1]和[3],里面提到了多模态处理和金融领域的模型应用,可能相关的功能。 首先,引用[1]提到DeepSeek支持解析扫描件或带图的PDF,将图片内容转为文字。这可能涉及到OCR技术,所以用户可能需要使用这个功能来提取PDF中的文本。然后,引用[3]中的通义千问金融模型有信息抽取、阅读理解等能力,可能可以用来处理提取后的文本,生成学习笔记。 接下来,我需要整理步骤。第一步是安装或访问DeepSeek的相关工具。但用户提到的具体工具名称没有明确说明,可能需要假设用户指的是通义千问的某个接口或者DeepSeek提供的API。根据引用[3],Tongyi-Finance-14B模型支持多模态和Coding能力,但用户可能需要通过API调用来处理PDF。 然后,用户需要将PDF文件上传到DeepSeek的平台,或者使用其OCR功能转换PDF中的内容为文本。这一步需要确保PDF中的文字能被正确提取,特别是扫描件可能需要OCR处理。例如,用户可能需要使用类似#命令调用文件集,如引用[1]中的说明,通过命令调用特定文件进行处理。 处理完文本后,用户需要生成学习笔记。这里可能需要使用模型的摘要、信息抽取或问答功能。例如,模型可以分析文本内容,提取关键知识点,生成结构化的笔记,如章节概要、重点概念、例题解析等。 同时,用户可能需要参考引用[2]中的大模型学习路线图和商业化方案,或者引用[4]中的评估方法,来优化生成的学习笔记的质量。例如,使用SFT数据筛选工具提升生成内容的准确性,或者通过multi-agent框架结合知识库增强结果。 另外,需要注意用户可能需要具体的操作步骤,比如如何调用API、使用哪些命令、是否需要编写代码等。例如,引用[3]提到multi-agent框架实现知识库增强,用户可能需要配置相关参数或使用特定的接口。 最后,可能需要指导用户如何验证生成的学习笔记是否符合预期,比如通过模型的问题回答功能检查笔记的完整性,或者人工复核关键部分。 总结步骤可能为:1.准备PDF文件;2.使用DeepSeek的OCR功能提取文本;3.调用模型的信息处理能力生成结构化笔记;4.优化和验证结果。同时,提供相关教程资源的获取方式,如引用[2]中的视频教程或PDF书籍。</think>### 如何用DeepSeek将PDF电子书转化为学习笔记 #### 步骤说明 1. **准备PDF文件** 确保PDF文件符合DeepSeek支持的格式(如普通文本PDF或扫描件)。若为扫描件,系统会通过**多模态视觉模型**自动解析图片中的文字[^1]。 2. **调用文件处理功能** 使用DeepSeek的`#`命令关联目标文件集(例如`#attach=电子书.pdf`),触发OCR转换和内容分析。 ```python # 示例:通过API调用PDF解析(需替换为实际API密钥) import deepseek client = deepseek.Client(api_key="your_key") text_content = client.parse_pdf("ebook.pdf", ocr_mode=True) ``` 3. **生成结构化笔记** 基于通义千问模型的**信息抽取**和**文本创作**能力,对提取的文本进行关键点提取、章节划分和逻辑重组[^3]。 ```python # 示例:生成学习笔记 prompt = "将以下文本转换为学习笔记,包含章节概要、公式列表(用$...$标注)和例题解析:\n" + text_content notes = client.generate(prompt, model="tongyi-finance-14B") ``` 4. **增强优化(可选)** - 通过`multi-agent`框架调用知识库补充背景资料[^3] - 使用`SFT质量分析工具`优化生成内容的准确性 #### 示例输出片段 ``` 第三章 傅里叶变换 核心公式: $$F(\omega) = \int_{-\infty}^{\infty} f(t)e^{-j\omega t}dt$$ 例题解析: 已知$f(t)=e^{-at}u(t)$,求其傅里叶变换→解:积分后得$1/(a+j\omega)$ ``` #### 相关教程资源 1. 参考[DeepSeek大模型视频教程](引用[2])获取完整代码示例 2. 通过[通义千问金融模型文档](引用[3])查看高级参数配置
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值