自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI人工智能的学习之路

归零,更新 重启,向上! 归零,不沉溺过去 更新,不止步于现状 重启,不受限于旧习惯 向上,不断攀升

  • 博客(193)
  • 资源 (8)
  • 收藏
  • 关注

原创 详解如何从零用 Python复现类似 GPT-4o 的多模态模型

在这篇博客中,我们从零开始构建了一个多模态模型,能够处理文本、图像、视频和音频,并根据文本提示生成图像。我们首先实现了 BPE 分词器,将文本分解为子词标记。接着,我们构建了一个基于 Transformer 的语言模型,能够生成文本。然后,我们将模型扩展为多模态,通过 ResNet 提取图像特征,并将这些特征与文本结合,使模型能够回答关于图像的问题。我们还展示了如何通过文本提示生成图像特征向量,并找到最接近的已知图像。整个过程不仅展示了多模态模型的强大能力,还揭示了其在实际应用中的潜力。

2025-04-10 00:00:00 3385 68

原创 利用python从零实现Byte Pair Encoding(BPE):NLP 中的“变形金刚”

在自然语言处理(NLP)的世界里,分词是将文本转换为机器可理解形式的关键步骤。传统的分词方法存在诸多局限,如词汇表过大、无法处理未见过的单词等。Byte Pair Encoding(BPE)作为一种强大的子词分词技术,通过迭代合并训练语料库中出现频率最高的相邻符号对,巧妙地解决了这些问题。它不仅能够有效控制词汇表的大小,还能大幅减少词汇外问题(OOV),同时保留单词的形态学信息。本文将从零开始,详细实现 BPE 算法,逐步展示其训练过程、合并规则学习以及对新文本的分词能力,揭示 BPE 如何将普通文本“变形

2025-04-10 00:00:00 703 14

原创 5大向量数据库技巧:嵌入成本直降70%的魔法操作

这篇技术博客分享了5种大幅降低AI推荐系统成本的向量数据库优化技巧。作者团队通过PCA降维(保留95%信息量但减少75%存储)、量化(float32转int8)、内容过滤(仅存储活跃数据)、智能缓存(减少65%API调用)和批量处理(请求量下降85%)等组合策略,将每月1.5万美元的嵌入成本直降70%至4500美元,同时提升系统性能3.2倍。文章用代码实例和幽默比喻,生动演示了如何在不影响推荐质量的前提下实现"成本瘦身",为资源有限的AI团队提供了实用优化方案。

2025-04-07 21:46:38 1357 42

原创 再看自适应RAG方法:SEAKR|PIKE-RAG|DeepRAG

大语言模型(LLM)的“幻觉”问题使其可能生成看似合理实则错误的内容,传统检索增强生成(RAG)方法因盲目检索而效率低下。本文介绍了三种创新解决方案:SEAKR让AI基于内部不确定性动态检索,避免过度自信;PIKE-RAG像智能设计师分层管理知识,精准匹配需求;DeepRAG则像经验丰富的外卖骑手,按需规划检索路径。这些方法让AI学会“何时该查资料”“如何高效整合知识”,在准确性与效率间找到平衡。未来,AI或许能像人类专家一样,学会谦虚地说:“这个问题我需要查证一下。”

2025-04-07 08:39:20 965 38

原创 零SQL构建数据分析AI智能体——基于LangChain和DuckDB的魔法之旅

SQL一直是数据分析领域的"普通话",但如今有了AI,连SQL语法都可以丢进垃圾桶了!本文将手把手教你用LangChain和DuckDB打造一个会自己写SQL的AI小助手,连Kaggle数据集都能轻松调戏~

2025-04-07 03:00:00 1922 70

原创 拥抱MCP Servers :利用Python集成AI Agent详解

现代AI助手虽强,但缺乏实时数据接入能力,常使回答沦为"纸上谈兵"。传统集成方案需要为每个数据源编写定制API,堪称开发者的"噩梦循环"。MCP协议的价值在于统一对接标准:一套协议吃遍所有数据源安全上下文访问:权限管控的标准化数据通道弹性扩展架构:无需修改核心代码即可接入新源采用MCP后,开发者能打造:✓更智能:实时数据驱动的AI系统✓更灵活:快速适应新需求的架构✓更安全:企业级管控的数据交互🔹行动指南立即部署MCP服务器实战围观开源项目MCP GitHub仓库。

2025-04-02 00:30:00 1430 56

原创 向量数据库华山论剑:AI开发者的选型指南

本文深度横评7大主流向量数据库技术特性与适用场景:FAISS是学术研究的"瑞士军刀",Pinecone提供开箱即用的云服务,Weaviate以模块化设计见长,Milvus适合K8s生产环境,ChromaDB专注快速原型开发,Qdrant支持高级过滤功能,Neo4j则实现图数据与向量的融合。各方案在索引算法(HNSW/IVF/PQ)、混合搜索、部署方式等方面呈现显著差异。作者建议根据数据规模、延迟要求、运维能力等维度选择,小型项目可从ChromaDB起步,复杂场景推荐混合架构。最后抛出开放性问题,邀请读者分享

2025-03-31 12:49:46 1515 37

原创 如何使用 FastAPI 构建 MCP 服务器

哎呀,各位算法界的小伙伴们!今天咱们要聊聊一个超酷的话题——MCP 协议!你可能已经听说了,Anthropic 推出了这个新玩意儿,目的是让 AI 代理和你的应用程序之间的对话变得更顺畅、更清晰。不过别担心,为你的 Python 应用程序搭建一个这样的服务器并不复杂,甚至可以说简单到让你怀疑人生!想象一下,AI 就像你的私人助理,而 MCP 就是它和你家大门之间的钥匙。让 AI 去操心那些繁琐的逻辑吧,咱就负责躺平享受成果。不管你是想连数据库还是接 API,MCP 都能帮你搞定。

2025-03-31 11:20:36 1920 32

原创 机器学习ML极简指南

机器学习是现代AI的核心,从推荐系统到自动驾驶,无处不在。但每个智能应用背后,都离不开那些奠基性的模型。本文用最简练的方式拆解核心机器学习模型,助你面试时对答如流,稳如老狗。

2025-03-30 01:13:06 1289 23

原创 自适应多模型蒸馏:一种将多个预测模型动态组合成轻量高性能学生模型的新方法

在机器学习中,依赖单一模型(如XGBoostLightGBM或)进行预测是常见做法。然而,正如多样化的专家团队能做出更优决策一样,多个预测模型(“教师”)可以指导一个更简单、轻量的模型(“学生”)学习更全面的模式。这种方法称为知识蒸馏,本文介绍了一种自适应多教师蒸馏。

2025-03-28 13:11:02 961 14

原创 使用Python从零开始构建千万级参数的大型语言模型(LLM)

徒手pytho撸出Transformer架构并一步步训练处一个LLM大模型

2025-03-22 00:15:00 1279 8

原创 知识蒸馏:从软标签压缩到推理能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新)

Deepseek对模型蒸馏技术的创新点在于进一步优化了用于学生模型训练的教师模型输出数据,通过数据增强合成并优化了具有推导过程的思维链语料(如多步骤推理的CoT语料等),再对学生模型进行微调。该技术利用了推理模型的特点,将教师模型在推理任务中学习到的思维方式通过蒸馏传输给学生模型,使学生模型具备相似的推理能力,从“知识迁移”演进为“能力转移”。利用这种蒸馏方式,模仿教师模型的输入到输出的映射关系,小参数的学生模型也能获得非常高的推理能力。知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。

2025-03-19 12:30:00 1720 8

原创 图解LLM智能体(LLM Agents):构建与运作机制的全面解析

本文深入探讨了大型语言模型(LLM)智能体的构建与运作机制,涵盖其核心组件和多智能体框架。LLM智能体通过外部工具、记忆系统和规划能力弥补了传统LLM的不足,能够执行复杂任务并展示自主行为。文章详细介绍了记忆模块(短期与长期记忆)、工具使用(如Toolformer和MCP协议)以及规划与推理技术(如ReAct和Reflexion)。此外,多智能体系统的协作框架被提出,用于解决单一智能体在工具选择、上下文复杂性和任务专业化上的局限性。生成式智能体(Generative Agents)模拟人类行为的研究展示了多

2025-03-18 13:35:10 2006 3

原创 【再读】R1-Onevision通过跨模态形式化为复杂多模态推理任务提供了系统性解决方案

R1-Onevision:跨模态形式化驱动的多模态推理技术突破,R1-Onevision通过跨模态形式化、双阶段训练和教育级基准测试,为多模态推理树立了新标杆。其技术创新不仅提升了模型在复杂任务中的表现,更重要的是为行业提供了一种可解释、可迁移的多模态处理范式。随着形式化方法的不断完善和硬件性能的持续提升,我们有理由期待多模态AI在教育、医疗、工业等领域实现更广泛的落地应用。R1-Onevision:结合形式语言和基于规则的强化学习打造的具有推理能力的多模态开源大型语言模型我们针对其报告进行了一个总结

2025-03-17 13:13:42 1506 40

原创 徒手打造个人AI Agent:基于DeepSeek-R1+websearch从零构建类Manus深度探索智能体AI-Research

该系统能够在预定义的主题上进行深入研究。研究计划:这意味着创建一个研究报告大纲,这将成为系统的最终输出。将上述内容拆分为可管理的步骤。对报告的各个部分进行深入研究。针对推理所需的数据,进行全面的分析,并利用网络搜索工具支持分析。反思研究过程中不同步骤生成的数据,并改进结果。总结检索到的数据,并生成最终的研究报告。今天,我们将实现上述所有步骤,而不使用任何LLM编排框架。首先,我们需要定义整个系统的状态,该状态将在代理运行过程中不断演变,并被系统的不同部分选择性地使用。

2025-03-16 00:15:00 1805 16

原创 【开源+代码解读】Search-R1:基于强化学习的检索增强大语言模型框架3小时即可打造个人AI-search

强化学习驱动检索:首次将RL应用于LLM与搜索引擎的多轮交互,突破传统监督学习限制。轻量化奖励设计:仅用结果奖励即可引导模型学习复杂检索策略。结构化生成框架:通过标记控制生成流程,兼容不同RL算法。

2025-03-13 13:57:02 2902 17

原创 从理解强化学习及其在 LLM 中的作用开始手把手教你构建DeepSeek-R1推理模型

本文深入探讨了强化学习(RL)在大型语言模型(LLM)训练中的应用,特别是通过人类反馈强化学习(RLHF)技术对齐人类偏好。文章重点介绍了组相对策略优化(GRPO)这一创新算法,其通过生成多个响应组、组内归一化优势计算和KL散度约束,显著提升了训练效率和稳定性。此外,本文详细解析了DeepSeek R1模型的四阶段训练流程,展示了其在数学和编程任务中的卓越表现。最后,文章还介绍了如何在TRL库中实现GRPO,并提供了配置参数、奖励函数设计和训练监控指标等实用建议

2025-03-05 01:15:00 1882 11

原创 【论文精读与实现】EDC²-RAG:基于动态聚类的文档压缩方法提升检索增强生成RAG性能

首次系统性地处理RAG中的文档关系建模问题提出计算高效的动态聚类方案验证了压缩技术对长上下文处理的增益依赖GPT-3.5的压缩能力高冗余场景下的计算成本线性增长缺乏对跨语言场景的验证这项研究为RAG系统的优化提供了新思路,其核心思想也可应用于其他信息检索场景,值得算法工程师深入理解和实践。

2025-04-11 00:15:00 5 1

原创 万字长文为你详解如何从零开始利用Python构建 DeepSeek R1

本文详细介绍了从零开始构建 DeepSeek R1 的过程,涵盖了从基础模型选择、训练数据准备到多阶段训练的完整流程。首先,通过强化学习(RL)和 GRPO 算法训练出 R1 Zero,解决了基础模型的推理能力问题。接着,通过监督式微调(SFT)和冷启动数据,进一步优化模型的推理风格和语言一致性。最后,通过推理导向的强化学习、拒绝采样以及知识蒸馏等技术,不断提升模型的推理质量和实用性,最终得到高效且推理能力强的 DeepSeek R1 模型。整个过程不仅注重技术实现,还通过详细示例和代码,让读者能够清晰地理

2025-04-11 00:00:00 407

原创 使用Python从零开始构建生成型TransformerLM并训练

本文详细介绍了 Transformer 模型的实现过程,包括从字符级标记化到模型训练和文本生成的完整步骤。通过内联代码和详细注释,展示了如何构建一个仅解码器的 Transformer 语言模型。模型利用注意力机制捕捉文本中的关键信息,通过训练学会生成文本。文章还探讨了模型保存与加载的方法,并展望了其未来的发展。整个过程以幽默风趣的方式呈现,旨在帮助读者深入理解 Transformer 模型的原理和应用。

2025-04-11 00:00:00 458

原创 【复读】从零开始图解DeepSeek R1 架构与训练过程

本文详细介绍了 DeepSeek R1 的架构设计与训练过程。DeepSeek R1 是一种先进的大型语言模型(LLM),它并非从零开始训练,而是基于已有的 DeepSeek-V3 模型,通过强化学习(RL)进行优化,以提升推理能力。文章首先解释了 DeepSeek-V3 的工作原理,它通过混合专家模型(MOE)架构,根据问题的复杂性选择不同的处理路径。接着,文章深入探讨了 DeepSeek R1 的训练过程,包括使用 GRPO 算法进行强化学习,以及如何通过奖励系统和拒绝采样等技术来优化模型的推理能力和语

2025-04-09 09:57:24 1239 4

原创 什么是混合搜索Hybrid Search?

混合搜索如同“搜索界的瑞士军刀”,结合了关键词的效率和语义的智能。无论是电商、企业知识库还是学术研究,它都能让搜索体验从“勉强能用”升级到“真香警告”。想继续深造?向量搜索指南RAG技术详解。

2025-04-09 00:00:00 849 12

原创 Text-to-SQL技术深度解析:从理论突破到工程实践

SQL的专业性要求构成了数据民主化的主要障碍——据统计,仅约35%的开发人员接受过系统的SQL培训,而超过51%的专业岗位需要SQL技能。对于算法工程师而言,把握技术本质,理解业务需求,在生成质量与系统可靠性间寻求平衡,将是构建成功Text-to-SQL系统的关键。传统**自一致性(Self-Consistency)**方法假设多数投票最优,但在Text-to-SQL中面临两大局限:(1)最频繁的答案未必正确,(2)高温采样会降低候选质量。THEN"表达式),(3)数仓建模时建立清晰的业务域映射。

2025-04-08 00:00:00 739 4

原创 AI烘焙大赛中的算法:理解PPO、GRPO与DPO最简单的方式

我翻遍了arXiv上那些让人头秃的论文,发现它们不是在堆砌数学公式,就是在用更复杂的数学公式解释上一个数学公式。今天,本AI厨神就要用最接地气的烘焙大赛来拆解这些算法,保证让您看得津津有味,连隔壁卖煎饼的王大妈都能听懂!不过在那之前,各位AI厨师们,请继续在算法的厨房里挥洒汗水吧!里面记载着:“面粉要过筛三次”、“蛋白打发要逆时针搅拌”、“烤箱温度要精确到±1℃”——这些细节决定了你的蛋糕是米其林三星还是黑暗料理。适合预算有限但又要比DPO稳定点的项目,就像学校里的学习小组——虽然比不上私教,但比自学强。

2025-04-08 00:00:00 1073 3

原创 langchain实现基于语义分块的文档处理技术semantic-chunker

本代码实现了一种针对PDF文档处理的语义分块方法,该方法最初由Greg Kamradt提出,后由LangChain团队实现。与传统基于固定字符或单词数量的文本分割方式不同,语义分块旨在创建更具意义且上下文感知的文本片段。传统文本分割方法常在任意位置切断文档,可能破坏信息流的连贯性和上下文关联。语义分块通过尝试在更自然的断点处分割文本来解决这个问题,从而保持每个文本块内部的语义连贯性。文档预处理通过自定义的函数读取PDF并将其转换为字符串格式。语义分块使用LangChain的结合OpenAI嵌

2025-04-06 20:15:00 1004

原创 MCP协议支持的七大AI框架和使用代码案例

MCP让AI工具管理从「俄罗斯轮盘赌」变成了「儿童安全积木」——虽然偶尔还是会砸到脚(某不愿透露姓名的Claude表示:“用了MCP后,终于不用假装自己懂2024年的天气预报了!”)

2025-04-06 12:00:23 768 6

原创 LlamaIndex实现RAG增强:上下文增强检索/重排序

本代码实现了一种用于向量数据库文档检索的上下文丰富窗口技术。它通过为每个检索到的文本块添加周边上下文,增强了标准检索过程,从而提升返回信息的连贯性和完整性。

2025-04-05 20:30:00 812 2

原创 如何为你的项目找到“真命天模“:大模型|预训练模型|嵌入模型Embedding Models

当GPT-4这样的"灭霸级"大模型、BERT这样的"特种兵"预训练模型,还有Sentence Transformers这样的"轻骑兵"嵌入模型同时摆在面前…这份指南就是你的"AI模型选妃攻略"!:用GPT-4做脏话检测 ≈ 用粒子对撞机砸核桃(效果不错但成本血亏),其实微调后的BERT小可爱用1/10资源就能搞定!大模型就像超级计算机——能解宇宙方程,但用它算1+1=2就太败家了!“用BERT做聊天机器人像让数学家讲相声——不是不行,但费劲!记住:没有最好的模型,只有最合适的模型。不选贵的,只选对的!

2025-04-05 00:15:00 1305 54

原创 MCP服务器:AI与外部工具交互的桥梁——Python和代理AI工具集成指南

MCP服务器的核心是资源(Resource)的概念。资源代表了可以被AI模型访问的外部数据源或工具。你可以通过实现自定义资源来扩展MCP服务器的功能。# 处理自定义动作inputelse:这个示例实现了一个自定义资源,它支持一个名为"my_action"的动作。当AI模型调用这个动作时,服务器会返回处理结果[14。

2025-04-04 20:00:00 863

原创 大语言模型中的嵌入模型

在LLMs的语境中,嵌入模型是一种神经网络,旨在将文本(如单词、短语、句子)表示为连续向量空间中的密集向量。这些向量表示能捕捉文本项之间的语义关系,是现代NLP系统的基石。"king"和"queen"这两个词的嵌入向量可能在向量空间中非常接近。"king"和"man"之间的向量关系可能与"queen"和"woman"之间的关系类似。想象完这些语义关系在向量空间中的样子后,我们可能会认为单词直接变成了这些能保留语义关系的向量。这种想法在讨论LLM处理流程中的令牌时可能会引起一些混淆。

2025-04-04 00:00:00 1221 4

原创 MCP Servers是什么?

MCP全称(Model Context Protocol),这货就像是给AI系统(比如大语言模型)装了个万能USB-C接口,让它们能和外部工具、数据源和服务唠嗑。简单说,就是个中间商,专门帮AI代理和数据库、API、文件系统这些资源牵线搭桥,还自带标准化话术手册。有了它,AI终于不用死啃训练数据的老本了——它能实时查资料、搞操作,活像个会用工具的聪明猴子。MCP服务器因此成了现代计算的顶梁柱,。

2025-04-03 19:15:00 841

原创 LlamaIndex实现RAG增强:融合检索(Fusion Retrieval)与混合检索(Hybrid Search)

本代码实现了一个混合检索系统,将基于向量的相似性搜索与基于关键词的BM25检索相结合。该方法旨在综合两种技术的优势,提升文档检索的整体质量和相关性。

2025-04-03 00:00:00 1433 5

原创 什么是向量搜索Vector Search?

向量是一种数据结构,存储了一组数字。在这里,它指的是保存了数据集数字摘要的向量,可以看作是数据的指纹或摘要,正式名称叫嵌入。以下是一个简单的例子:"红苹果"0.025112340.054731230.012345670.004567890.033456780.00789012如果你只需要查找LLM中存储的信息匹配项,那么工作就完成了。但真正自适应的应用会希望从内部数据源(如企业数据库)中提取匹配和信息。

2025-04-02 20:30:00 291 1

原创 RAG优化:python从零实现Proposition Chunking[命题分块]让 RAG不再“断章取义”,从此“言之有物”!

实现了一个完整的命题分块系统,并将其与传统的基于块的分块方法进行了比较。命题分块通过将文档分解为原子化的事实性陈述,显著提高了检索的准确性和响应质量。希望这个实现对你有所帮助!注意:如果你有任何问题或需要进一步的帮助,请随时联系我!😄。

2025-04-02 00:15:00 512 2

原创 基于langchain实现GraphRAG:基于图结构的检索增强生成系统

基于LangChain框架构建的GraphRAG,通过FAISS向量库、LLMChainExtractor和PromptTemplate等组件实现文档分块、知识图谱构建与智能检索。系统采用Dijkstra算法遍历图谱节点,结合ChatOpenAI生成答案,并通过可视化工具展示推理路径。测试表明,它能准确回答"气候变化主因"等复杂问题,且推理过程完全透明,显著提升了RAG系统的上下文理解能力。

2025-04-02 00:00:00 919

原创 什么是嵌入模型Embedding Models?

如果你处理通用任务且不需要高度专业化模型,使用BERT、GPT或ResNet等预训练嵌入通常足够且节省时间。如果你的数据非常特定(如小众领域或语言),可能需要微调预训练模型或训练自定义模型。

2025-04-01 15:45:00 1787 1

原创 向量嵌入Vector Embeddings让机器“读懂“世界的数字魔法

今天咱们要聊的是AI界的"翻译官"——向量嵌入(Vector Embeddings)。这货可是把文字、图片这些人类能懂的东西,变成计算机能理解的数字密码的黑科技!向量嵌入干的就是这个——把各种信息变成一串数字(向量),让电脑能"摸到"这些概念的轮廓。比如"猫"和" kitten"这两个词,经过语言模型处理后,它们的数字密码会非常接近。单看这些数字就像天书,但妙就妙在——电脑能通过"邻居算法"找到相似的向量,就像在派对上帮你找到兴趣相投的朋友!A:前者是数单词出现次数,后者是理解单词的"灵魂"

2025-04-01 12:54:23 1031 9

原创 图基RAG方法全景分析 | 高级检索增强生成技术Graph-based RAG

关于图基检索增强生成(Graph-based RAG)技术的研究,主要探讨如何将外部知识融入大语言模型(LLMs),提升其性能。Graph-based RAG框架,用于解决基于图的RAG方法的比较和分析问题。具体来说,​图构建:首先,将输入语料库分割成多个块,然后使用LLM或其他工具为每个块创建节点和边,构建图。图的类型包括 passage graph、tree、knowledge graph、textual knowledge graph 和 rich knowledge graph。

2025-04-01 09:18:05 882 5

原创 RAG优化:python从零实现Fusion Retrieval(混合检索融合向量搜索和关键词搜索)

大家好,欢迎来到今天的“AI相亲大会”!和。向量搜索是个“文艺青年”,擅长理解语义,但有时候过于“感性”,容易忽略关键词的精确匹配。而关键词搜索则是个“理工男”,做事一丝不苟,关键词抓得准,但缺乏“情商”,理解不了复杂的语义。于是,我们决定让这两位“喜结连理”,诞生了一个全新的“混血儿”——!它不仅继承了父母的优点,还青出于蓝而胜于蓝,既能理解语义,又能精准匹配关键词。今天,我们就来看看这个“混血儿”是如何在信息检索的世界中大展身手的!准备好了吗?让我们一起见证这场“AI界的完美婚姻”吧!

2025-04-01 00:15:00 470 3

原创 PDF解析黑科技:从OCR-Free到多模态大模型的进化之旅

TextMonkey能在有限训练资源下提升分辨率,同时保留跨窗口信息并减少因分辨率提升带来的冗余token。此外,通过多种数据和前置提示,TextMonkey已经具备了处理多任务的能力。图1:TextMonkey架构概览。TextMonkey论文初始处理:输入图像通过分割模块被划分为不重叠的448x448像素块,这些块再被分割为更小的14x14像素块,每个小块被视为一个token跨窗口关系增强。

2025-04-01 00:15:00 900 1

大型语言模型、预训练模型与嵌入模型的选型指南及应用场景解析

内容概要:本文详细介绍了大型语言模型(LLMs)、预训练模型和嵌入模型的区别及其各自的应用场景。首先阐述了三者的特性和优势,接着讨论了它们在不同任务中的适用性,如对话系统、文本分类和聚类等。文中通过对比性能指标、资源需求、可扩展性和定制能力,帮助读者理解如何根据具体需求选择最优模型。最后,通过三个真实的案例研究展示了不同类型模型的成功应用,进一步明确了各自的优劣。 适合人群:从事自然语言处理(NLP)及相关领域工作的研究人员和技术人员,尤其是需要选择和部署AI模型的从业者。 使用场景及目标:①帮助读者理解大型语言模型、预训练模型和嵌入模型的特点;②指导读者根据任务复杂性、资源限制等因素选择合适的模型;③提供具体的实施步骤和代码示例,便于实际操作。 其他说明:文章不仅涵盖了理论层面的知识,还包括了实际应用中的经验分享和技术实现的具体方法,是一份兼具深度和广度的参考资料。

2025-04-01

基于Label Studio的文档标注方法及应用场景

内容概要:本文档详细介绍了利用 Label Studio 进行文档标注的具体流程与配置方法。主要包括系统环境搭建与Label Studio安装指引,随后依次讲述了从项目创建、数据加载直至数据导出及格式转换等步骤的操作指南,并深入探讨了实体、关系抽取与文档分类等多种任务类型的设置与执行。此外还提供了额外配置选项以供灵活调整任务细节。 适合人群:从事机器学习相关工作的专业人士,尤其侧重于信息提取与自然语言处理的应用开发人员和技术爱好者。 使用场景及目标:帮助开发者掌握高效、精确地准备用于训练深度学习模型所需的数据集的技术能力。能够支持诸如金融票据、法律文件以及其他结构化文本资料中的重要元素识别等工作需求。 其他说明:文中涉及大量实战案例展示,附带源码片段便于理解和操作演示。强调了合理的负样例构造对于提高特定类型AI模型性能的作用,并提供了关于比例分配等方面实用建议。

2025-03-25

图数据库基准测试:TigerGraph与其他图数据库的性能对比及优势解析

内容概要:本文档详细评估了 TigerGraph 与其他图数据库(如 Neo4j、Amazon Neptune、JanusGraph 和 ArangoDB)在数据加载和查询性能方面的表现。测试环境使用相同的 Amazon EC2 硬件平台,并通过加载和查询两个不同规模的数据集(Graph500 和 Twitter 用户跟随关系图)来衡量性能。测试内容包括数据加载时间和效率、加载后的磁盘存储空间、单节点及分布式环境中各种复杂图遍历查询的响应时间。结果显示,TigerGraph 在各个方面表现出显著优越的性能,尤其是在大规模并行处理和存储效率方面。 适用人群:从事图数据库及其应用的开发人员、研究人员及技术决策者。 使用场景及目标:通过具体的性能数据和实际用例,为图数据库的选择和技术选型提供参考依据,特别是对于需要高效处理大量关系数据的应用场景。 其他说明:所有测试代码及相关配置均可在官方 GitHub 页面获取,方便重现。文中提到 TigerGraph 在欺诈检测、医疗保健等多个行业的应用场景,突显其广泛的商业价值。

2025-03-25

RAG学习RL测试数据集

RAG 测试pdf文件,配套《动手实现各类RAG》专栏,不借助任何RAG现成框架,徒手撸python实现各类RAG功能、增强技术等https://blog.youkuaiyun.com/qq_36603091/category_12923460.html?spm=1001.2014.3001.5482

2025-03-25

企业AIGC商业落地应用解析:技术进步引领企业服务创新与优化

内容概要:本文聚焦于生成式人工智能(AIGC)技术的发展及其在企业层面的应用前景。首先阐述了AIGC的核心概念及对其市场全貌的认识,探讨了各类服务商的角色和选择依据,并分析了AIGC可能改变的传统场景及新模式。文中指出,AIGC不仅革新了市场营销手段,还在客服、办公自动化等多个领域提供了新的解决方案。尤其值得注意的是,它能够在降低成本的同时提升用户体验,并通过深度集成进入企业的现有数字架构,实现快速高效的业务转型。 适合人群:对AIGC感兴趣的企业管理者和技术从业者,特别是那些希望借助先进AI技术推动业务增长或改进内部运作效率的人士。 使用场景及目标:文章适用于希望理解AIGC如何帮助企业应对挑战并抓住机遇的情境。通过了解具体的实施案例,如营销内容自动化、客户服务智能化等,可以使企业找到适合自己情况的应用切入点,促进创新发展。此外,文章还有助于制定合理的投资策略,评估采用AIGC所带来的潜在收益。 其他说明:本文还涉及不同类型的收费模式对中小型和大型企业在应用时的选择启示,强调数据安全性和系统兼容性为两大重点考量因素。为了最大化发挥AIGC的作用,建议企业培养相关技术团队并重视长远规划

2025-03-24

基于单元格分割OCR及插图检测的表格识别算法

基于单元格分割OCR及插图检测的表格识别算法

2025-03-24

RAG技术体系全解析:发展脉络、框架演进与增强技术

算法部门内部RAG学习交流分享

2025-03-23

RAG 测试pdf文件,配套《动手实现各类RAG》专栏,不借助任何RAG现成框架,徒手撸python实现各类RAG功能、增强技术等

RAG 测试pdf文件,配套《动手实现各类RAG》专栏,不借助任何RAG现成框架,徒手撸python实现各类RAG功能、增强技术等https://blog.youkuaiyun.com/qq_36603091/category_12923460.html?spm=1001.2014.3001.5482

2025-03-20

招标投文本NER/REL数据集-中标单位与金额解析及其关联信息整理

内容概要:本文提供了大量的招标投标相关数据片段,涵盖的内容广泛,主要包括了各种类型的项目如工程类、设备采购、服务外包等。这些数据片段详尽展示了不同中标单位、金额及对应的关系。例如,在中标情况方面有多个中标单位的具体名称及各自对应的金额。此外还有对特定项目的开标时间和地点、合同签订和公示截止日期、预算金额和工程建设地点等一系列具体参数的数据记录。所有中标信息都明确了各单位中标的产品或项目、中标金额和关联单位地址等重要细节。 适用人群:本文适合于需要掌握详细项目运作情况的专业人士,包括但不限于参与政府、企事业单位采购部门工作人员以及招投标领域的研究人员或从事审计监察工作的相关人员。 使用场景及目标:本文可用于了解某个特定地区或某项业务领域的市场竞标动态及趋势走向;对于想了解某行业市场参与者竞争态势的人群而言非常有用;同时还可以用于学习如何解读官方发布的招投标结果通告,以作为实际工作参考。 其他说明:文中包含了大量的实际项目实例,这有助于读者更加直观地理解和分析各类信息之间的关系。此外还提供了完整的数据链以便追溯每一个中标背后的详细流程与规定。通过对这些数据的学习可以提升用户对该领域的认知水

2025-03-17

面向统一端到端模型的下一代光学字符识别理论与GOT-OCR-2.0模型解析

内容概要:本文介绍了一种全新的光学字符识别(OCR)系统——OCR-2.0及其代表性模型GOT。传统的OCR系统由于模块化的复杂流程导致高昂维护成本和低效的文本感知能力。GOT模型拥有5.8亿参数,集成了高效压缩编码器与长上下文解码器,在处理多类型的文本识别上具有优越性能,支持常见图像类型和复杂的任务如乐谱、化学公式、图表、甚至几何图形。它还支持动态分辨率以及多页OCR,并能在高交互性和特定区域识别上表现出色。作者通过对不同模型的对比实验展示了该模型的有效性和实用性。 适用人群:对OCR研究和应用感兴趣的学术研究人员、从事文字识别领域的软件开发者和技术爱好者。 使用场景及目标:主要适用于科研论文转换成PDF文档、文献档案数字化、表格公式的结构化抽取等各种场景中的高质量文字识别需求。此外还包括需要高级OCR特性的场景比如细粒度文档理解、图表提取、以及批量PDF处理等方面。 其他说明:文章强调了OCR的发展方向是从传统单一功能向更加综合全面的方向转变,并提出了未来工作的改进建议,例如支持更多语种及其他特殊字符形态。同时提供大量详实的数据来源说明和实验结果比较,论证了所提出方法的优势。

2025-03-13

基于Label Studio的文本标注工具及其实现自然语言处理任务的操作手册

内容概要:本文档提供了利用Label Studio进行文本标注的具体操作步骤,涵盖了安装配置方法、多种标注类型的创建、数据准备、标注过程以及最后数据导出和转换。重点阐述了不同任务,比如命名实体识别、关系抽取、事件抽取、文本分类、句子女情感分类以及实体/评价维度分类的实现方法。并且深入解析了这些自然语言处理(NLP)应用过程中的一些注意事项和技术细节,尤其是关于prompt构造的原则及其如何影响模型性能。 适合人群:从事自然语言处理领域的研究人员、工程师和相关专业学生,以及希望借助Label Studio开展高质量语料加工的技术团队。 使用场景及目标:该文档主要用于指导如何快速有效地建立起自己的文本标注平台来支持下游机器学习项目的推进;确保用户可以独立完成整个流程,从而为模型训练提供高质量的数据资源。同时,帮助开发者更好地理解UIE框架的需求并优化标注方案。 其他说明:本文档不仅介绍了一般性的操作步骤,还针对特定的配置选项给予了详细的解释,使得即便是初次接触Label Studio或者PaddlePaddle平台的新手也能顺利地执行各种复杂的文本标注任务。它强调了一些关键点如合理的提示词

2025-03-12

使用DeepSeek进行高效学习、工作与旅行规划的经验与技巧详解

内容概要:本文详细讲述了用户如何借助AI助手DeepSeek进行高效的学习、工作和娱乐活动,包括为幼儿制定全英语教育课程,设计系统的西班牙语学习计划以及规划一次安全舒适的西班牙旅行,涵盖了使用和提问的具体策略和心得分享。DeepSeek不仅展示了强大的逻辑思考和推理能力,而且其出色的结构化表达和针对性强的答案让人赞叹。文中列举了大量的实际案例和应用场景,突显了该工具的强大功能性。 适合人群:想要提升自身效率的上班族、正在学习新的语言和技术的学生,以及有兴趣深入了解如何有效利用AI进行日常生活的规划与优化的人群。 使用场景及目标:适用于各类涉及学习新知识、项目策划、个人发展等方面的需求。尤其当您希望通过有效的沟通方式获取更高质量的回答,并且希望通过实践来不断提升自己时,DeepSeek 是非常好的工具。 其他说明:值得注意的是,为了得到最好的交互体验,用户应当提供足够的背景信息和明确的需求描述;对于不确定的部分持续追问也能进一步获得更加详尽的帮助。总之,本文旨在通过具体的应用案例帮助读者更好地理解和运用DeepSeek。

2025-03-11

从零构建RAG-基于提示连接检索增强生成与LLM的技术解析及应用场景

内容概要:本文作者 Lance Martin 是来自 LangChain 公司的软件工程师。文档首先解释了RAG(Retrieval-Augmented Generation,检索增强生成)的动机,即通过引入文档资料到LLM的语境窗口来提升机器理解和作答复杂度的能力。之后深入浅出地介绍了如何利用prompt将文档搜索检索系统与大型语言模型(LLMs)进行链接,并附有实例网站参考资料供读者进一步学习。最后,文中提供了详细的代码演示,有助于理解整个过程的实际运作方法。 适合人群:对AI对话系统有兴趣并具有一定程序背景的开发者和技术爱好者。 使用场景及目标:帮助研究者和技术工作者更好地掌握RAG技术及其具体实施手段,提高问答系统的精度和服务质量。 阅读建议:本材料旨在引导读者理解从无到有创建RAG的基本概念以及操作流程,在实践的同时可以参阅提供的案例网站链接来加深对RAG的理解。同时也可以跟着代码讲解进行实际编码尝试,体验LLM驱动的应用开发魅力。

2025-03-11

自然语言处理技术在金融资管领域的落地实践

自然语言处理技术在金融资管领域的落地实践

2025-03-11

区块链应用与测试:涵盖用户注册页面测试、文档分类及应用部署

内容概要:本文详细介绍了区块链应用的不同方面,其中包括了针对一个即将开发的用户论坛进行的用户注册页面测试,明确了测试设计的具体要求和答案,如用户名有效和无效等价类的界定。接下来是对各种开发文档(开发计划、需求说明书)、产品文档(产品手册、用户指南)及管理文档(进度记录)的分类,以及如何运用 Git 版本控制工具协同编辑文档。此外,还讲述了区块链系统的单节点区块验证过程,包括五个具体的检查点(时间戳、随机数、哈希值、链链接和交易有效性),并且提供了一个简单的 Flask Web 服务器构建示例和区块链系统交易对象属性解释,如发送方和接收方地址及其数字签名等内容。 适合人群:对于想要深入了解区块链测试方法、Git 操作、区块链应用程序开发,尤其是关注用户注册页面测试和单节点区块链系统区块验证的技术人员和学生而言非常有用。 使用场景及目标:旨在帮助读者掌握用户界面功能验证的方法论,提高区块链应用程序的安全性和稳定性。同时让开发者更好地管理多份技术文档,优化项目的开发流程,并能够初步了解 Flask 框架的应用。最后,为深入研究区块链系统底层架构提供了基础理论和实践指引。 其他说明:文档

2025-03-11

推理模型构建:四种主要方法和技术进展综述

内容概要:本文全面解析了构建和改进推理模型(推理能力增强的大规模语言模型,LLM)的四种主要方法:推理时间扩展、纯强化学习(RL)、监督微调加强化学习(SFT + RL),以及纯监督微调和蒸馏(Distillation)。文中介绍了 DeepSeek团队通过这几种方法开发出的多个模型,特别是在不同应用场景和预算条件下的实践效果。文中不仅讲解了各个技术的优势与局限,还包括对模型训练成本、开发难度、效率等方面的专业讨论。 适合人群:对自然语言处理、推理模型构建感兴趣的科研工作者、工程师及研究生。 使用场景及目标:①帮助研究者掌握不同类型推理模型的特点和优劣,从而选择最适合的应用方法;②引导开发者根据自身条件制定高效合理的建模计划,尤其是面对复杂问题或有限预算时;③为有兴趣了解前沿AI技术和模型架构的学习者提供有价值的参考资料。 其他说明:本文提供了丰富的实例和技术细节,涵盖了目前主流的技术手段和发展方向。同时也对比了几款知名推理模型,如 DeepSeek-R1和疑似 OpenAI的 o1,并对未来发展趋势提出了预测。作者希望通过此文激发更多关于低成本高质效推理模型的研发思路。

2025-03-10

智能投标领域的星火投标平台-利用大模型技术提高编标效率与标书质量的应用指南

内容概要:本文介绍了一款面向投标的专业工具——星火投标。该平台依托星火大模型技术,实现了从投标所需的各种资信材料自动化解析到通过知识图谱生成投标方案的一站式解决方案,涵盖高精度投标文件创作、以及自动检测和纠正标书中潜在缺陷的功能,以此提升编标工作的速度和精准度,最终增加企业的中标几率。特别适用于建筑、能源、制造等多个行业的工程项目招投标工作中。 适合人群:参与各类大型复杂投标项目的从业人员及其负责团队,包括但不限于项目管理人员、合同专家和其他需要准备高质量标书的专业人士。 使用场景及目标:该软件能够帮助客户在短时间内高质量地完成标书制作任务。它可以自动分析以往的成功案例及相关文档资料来辅助新的标书创建工作,确保新文档与既往成功的投标保持连贯性和专业水平;另外它还具备智能化检查功能,用来发现可能存在的错误点并及时给出改进意见。 其他说明:星火投标平台的具体操作方法非常友好简单,在官网提供的详细指导下,即使是初学者也能迅速上手,并且提供了多途径客服支持选项以确保用户体验流畅无阻。

2025-03-10

智慧政策系统的多功能综合应用及其实现方案-聚焦文件解析、知识图谱和智能问答

内容概要:本文介绍了智慧政策系统的总体架构及其具体模块功能。它是一个涵盖政策信息查询、自动测评及反馈、智能化处理与分析等多方面的集成平台。尤其针对当前政务信息化改革的需求,系统利用前沿的大数据、自然语言处理(NLP)等AI技术支持,如通过paddleOCR、Layoutreader等技术处理各类公文;同时运用文本解析、关键字提取等方式整理并归类相关信息建立知识库;借助向量化索引提高搜索性能,并通过实体及联系建立知识图谱以便用户更好地理解和利用数据。此外还提供了基于LLM的语言模型问答服务以及企业专属财税福利计算器等功能。最终实现了高效、全面的服务政府机关到民间团体乃至个人的目标。 适合人群:政府官员、政策研究专家、企业和机构决策者、技术人员和其他希望了解如何运用先进技术优化公共信息服务的相关从业者。 使用场景及目标:本系统适用于需要获取最新最全政策动向的单位和个人,在面对复杂繁琐的官方文书时希望能够得到便捷有效的指引和支持的人群尤为适用。其主要目的在于打破信息孤岛,增强政令传达效率的同时也让受益群体更容易享受到应有的权益保护和服务质量。 其他说明:文中特别强调了对政策内容深入分析和技术

2025-03-03

DeepSeek高效使用技巧:职场、学术、自媒体的内容生成与问题求解利器

内容概要:文章探讨了深受欢迎的AI工具DeepSeek的有效利用方法。文中指出多数使用者未能发挥其最大价值主要是由于不当提问导致的非有效回应。为此,本文通过实例展示了一个简化的但极为有效的“4步提问法”,该方法包括明确提问者的身份背景、设定具体的任务内容、加入必要的细节约束以及指定所需的输出格式。对于不同的群体,如职场白领制作报告或PPT、大学生进行文献查阅或优化论文,乃至网络自媒体工作者撰写个性化博客或推广文案等方面,给出了详尽的应用指导,并强调了如何根据应用场景调整询问方式从而获得最佳效果。 适用人群:适用于想要改善与优化自身工作效率,或是寻求更优质的学术研究支持,亦或是期望通过网络媒体创作吸引观众并增强影响力的各界人士。 使用场景及目标:无论是为了在工作场合中展现专业的数据分析、报告制作等技能;还是为了帮助学生快速准确地搜索相关资料并且有效避免学术不端行为(如查重率过高),又或者是为个人或品牌的自媒体平台创造出更具创意性、话题性的高质量文章,此文中介绍的方法都能极大地提升使用者对DeepSeek这一强大工具的认知度及其实际应用效能。 其他说明:值得注意的一点在于,当使用该公式式的

2025-03-01

DeepSeek内部科普材料

DeepSeek内部科普材料旨在向用户和相关人员介绍DeepSeek的技术背景、功能特点及使用案例等。

2025-03-01

语音对话大模型及其基准测试的全面综述与最新进展

内容概要:本文档对语音对话大模型进行了系统性的总结,涵盖了最新的研究论文和技术资源。首先介绍了通用音频、语音和音乐理解模型(如LTU、SALMONN等)的研究成果,并讨论了联合音频和语音理解的进展。接下来探讨了几项重要的端到端语音对话系统模型(如SpeechGPT、VITA、Moshi等),并对其核心技术进行了详细解析。文档还涉及了多项基准测试(Benchmark)工具,如AIR-Bench、SD-Eval、AudioBench等,为评估模型性能提供了参考依据。最后,文档介绍了全双工建模技术,旨在实现实时对话系统(例如MiniCPM-duplex、SyncLLM)。此外,还包括两份关于语音语言模型近期发展的综述性文献。 适用人群:从事自然语言处理、语音识别、人机交互以及深度学习领域的研究人员、学生或相关从业者。 使用场景及目标:适用于希望深入了解语音对话大模型架构、算法改进及实际应用效果的专业人士。帮助读者获取当前最前沿的技术资料,指导未来研究方向。 其他说明:此文档汇集了大量高影响力的会议论文和技术报告链接,便于进一步深入学习和探索相关领域知识。同时列出了一些开源项目地址,方便感兴趣

2025-03-01

DeepSeek15天指导手册

DeepSeek15天指导手册

2025-02-14

DeepSeek如何赋能职场应用?从提示语技巧到多场景应用-清华大学

DeepSeek如何赋能职场应用?从提示语技巧到多场景应用-清华大学

2025-02-14

DeepSeek从入门到精通-清华大学-202502

DeepSeek从入门到精通-清华大学-202502

2025-02-14

OpenAI官方文档《提升推理能力的最佳实践》

OpenAI官方文档《提升推理能力的最佳实践》

2025-02-14

入门深度学习--探秘lstm

一次部门内部分享的PPT

2021-01-06

自适应确定DBSCAN算法参数的算法研究_李文杰.pdf

传统DBSCAN算法需要人为确定Eps和MinPts参数,参数的选择直接决定了聚类结果的合理性,因此提出一种新的自适应确定DBSCAN算法参数算法,该算法基于参数寻优策略,通过利用数据集自身分布特性生成候选Eps和MinPts参数,自动寻找聚类结果的簇数变化稳定区间,并将该区间中密度阈值最少时所对应的Eps和MinPts参数作为最优参数。实验结果表明,该算法能够实现聚类过程的全自动化并且能够选择合理的Eps和MinPts参数,得到了高准确度聚类结果。

2020-04-02

pyltp安装wheel文件

完美解决python3.6安装pyltp出现的各类错误,各类vs错误,编译错误均可完美解决

2018-08-23

文本挖掘技术——北大杨建武教授

教授的文本挖掘技术课程ppt 包含文本情感分析 特征提取

2018-06-28

机器学习实战 英文版

MachineLearning机器学习实战 英文版 机器学习 大数据 深度学习 人工智能

2017-10-23

数据挖掘与机器学习 WEKA应用技术与实践 完整版

详细讲解weka,机器学习算法 书籍完整版 推荐下载 作者:袁梅宇出版社:清华大学出版社出版时间:2014年07月

2017-09-28

税务数据挖掘论文

有关税务税局挖掘的论文 包含逻辑回归 svm som、在税务稽查方面的应用 ,该资料包下载自知网,论文大部分是硕士论文及期刊论文 打开请用知网caj阅读器

2017-09-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除