大数据
文章平均质量分 88
~kiss~
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
prompt engineering 中的常用计技巧 - 少样本提示、思维链提示、回退提示
少样本提示是指在提示词中提供少量(通常 2-5 个)示例,让模型通过学习示例的逻辑和模式,完成同类任务的提示方法,无需大规模微调模型,适配样本稀缺的场景。思维链提示是通过在提示词中引导模型分步推理,先输出中间思考过程,再得到最终答案的提示方法,专门解决复杂逻辑问题(如数学计算、多步推理、因果分析)。回退提示是一种容错型提示策略,当模型无法直接回答问题(如知识盲区、格式不匹配、输入异常)时,引导模型触发预设的 “回退逻辑”,避免输出无效或错误内容。原创 2025-12-14 23:41:25 · 774 阅读 · 0 评论 -
RAG - 通过 ColBERT的重排了解Re-ranking
re-ranking(重排序)” 是信息检索流程中非常关键的步骤,核心目的是弥补初步召回阶段的不足,提升最终结果的相关性与用户体验。原创 2025-12-14 21:53:10 · 764 阅读 · 0 评论 -
RAG - 高阶检索范式 - 基于表示 - ColBERT - 迟交互机制
配置训练参数bsize=32, lr=1e-5, warmup=20000, nway=64, # nway是负样本数量# 训练(triples是三元组文件:query_id\tpos_doc_id\tneg_doc_id)trainer.train(checkpoint="bert-base-uncased") # 基于BERT预训练权重微调。原创 2025-12-14 14:49:56 · 775 阅读 · 0 评论 -
RAG - 高阶检索范式 - 基于表示模型的检索 - SimCSE - 简单的句子嵌入对比学习
一种极简且高效的句子对比学习方法,核心目标是学习高质量的句子嵌入(Sentence Embeddings),让语义相似的句子在向量空间中距离更近,语义不同的句子距离更远 —— 这正是 “基于表示模型的检索”(如向量检索)的核心需求相较于传统的句子嵌入方法(如 SBERT),SimCSE 无需复杂的数据增强或人工标注,仅通过 “自监督对比学习” 就能大幅提升嵌入的语义区分能力,成为向量检索、语义匹配场景的主流方案。基于传统的词袋模型和主题模型,基于表示能够更深入挖掘文本的上下文语义。原创 2025-12-08 00:42:44 · 815 阅读 · 0 评论 -
RAG - 高阶检索范式 - 迭代式检索
传统单轮召回,根据查询检索候选文档,然后直接进入排序,难以满足用户意图迭代式检索,采用多轮查询-响应的交互形式,反复“检索-回答-判断”循环,逐步改进召回结果的质量(1)根据当前查询进行召回,获得候选文档集合(2)对候选文档排序,生成top-k个最相关文档(3)利用阅读理解、信息抽取等技术,从上述文档总结一个粗略答案(4)评估答案的质量,根据评估结果生成一个改进后的新查询(5)将新查询代入步骤(1),开启新一轮迭代0"文档2:"1iflen>=2else"""文档3:"2。原创 2025-12-07 22:26:29 · 863 阅读 · 0 评论 -
RAG - 高阶检索范式-step-by-step prompting -分步提示
核心思路:将复杂查询分解为一系列递进的提示,引导模型逐步细化和完善问题举例:原始查询:如何预防和治疗儿童肥胖症?c1 = 儿童肥胖症的危害q1 = 儿童肥胖症有哪些危害?如何通过预防和治疗减少这些危害?c2 = 儿童肥胖症的预防措施q2 = 儿童肥胖症的预防措施有哪些?如何在生活中落实这些预防措施?c3 = 儿童肥胖症的治疗方法q3 = 儿童肥胖症有哪些常见的治疗方法?不同的治疗方法有哪些优缺点和适用人群。原创 2025-12-07 21:59:41 · 466 阅读 · 0 评论 -
RAG - 高级检索范式-细化检索逻辑- CoVe和RAG-Fusion
return_tensors=pt 是 Hugging Face 工具链中适配 PyTorch 框架的核心参数作用是将文本处理结果直接转为 PyTorch 张量避免手动格式转换,是 NLP 模型训练 / 推理、RAG 等场景中高频使用的配置推理不需要梯度的核心:目标是 “用固定参数算输出”,而非 “更新参数”,梯度无意义torch.no_grad() 的价值:省显存、提速度、防参数误更新。原创 2025-12-07 16:34:58 · 940 阅读 · 0 评论 -
RAG检索 - FAISS(Facebook AI Similarity Search)
FAISS 是 RAG 检索环节的 “工业级标准工具”,其核心价值在于用成熟的索引结构和工程化优化解决了大规模高维向量检索的 “速度 - 精度 - 扩展性” 难题,是构建生产级 RAG 系统的首选向量检索方案。原创 2025-11-18 01:09:04 · 868 阅读 · 0 评论 -
RAG向量索引 - QALSH(Query-Aware Locality-Sensitive Hashing)查询感知的局部敏感哈希
QALSH是局部敏感哈希(LSH)算法的优化变体,专门用于高维空间的近似最近邻搜索(ANN)检索环节作为 RAG 的核心环节之一,常需对向量化后的文本块执行高维向量的相似性搜索QALSH 用于该环节以提升检索效率RAG 的检索环节会先将文本块和用户查询语句都转换为高维向量,再在向量数据库中搜索与查询向量相似的文本向量随着知识库扩大,高维向量规模会急剧增加,传统精确最近邻搜索会面临计算量大、检索速度慢的问题。原创 2025-11-18 00:13:33 · 409 阅读 · 0 评论 -
RAG向量索引-HNSW Hierarchical Navigable Small World 介绍
HNSW,Hierarchical Navigable Small World,分层导航小世界网络目前 RAG、推荐系统、图像检索等场景中最常用的 近似最近邻(ANN)向量索引算法 之一核心优势是「检索速度极快 + 精度高」,能高效支撑百万级~亿级高维向量的快速检索也是很多向量数据库(如 Milvus、Weaviate、Pinecone)的默认推荐索引分等级的,等级制度的Navigable可航行的;可驾驶的;适于航行的。原创 2025-11-16 23:26:22 · 911 阅读 · 0 评论 -
RAG 场景中常用的向量索引
RAG 中最常用的向量索引集中在「IVF 系列(IVF_FLAT/IVF_PQ)、HNSW、ANNOY 树索引」—— 前两者是企业级 RAG 的主流选择(适配大规模、低延迟、混合检索),后者是入门级首选(轻量易部署)。如果需要支持多模态或精准过滤,优先用 Milvus 搭载 HNSW/IVF_PQ 索引,直接实现 “向量相似度 + 元数据过滤 + 多模态兼容” 的全需求。原创 2025-11-16 23:13:01 · 761 阅读 · 0 评论 -
Milvus-云原生和分布式的开源向量数据库-介绍
官方定义:一款专为高维向量设计的开源向量数据库,支持近似最近邻(ANN)检索和精确检索,提供高吞吐、低延迟的向量查询服务核心目标:解决「亿级高维向量的快速检索 + 企业级稳定性」问题比如 RAG 场景中,当知识库规模达到 10 亿级文档片段(对应 10 亿级向量),且需要支持每秒数千次查询(QPS)时,ANNOY、单机 FAISS 无法承载,而 Milvus 通过分布式架构可轻松应对关键标签:开源、云原生、分布式、多模态支持(不仅支持文本向量,还支持图像、音频等向量)、企业级高可用。原创 2025-11-16 22:15:51 · 1055 阅读 · 0 评论 -
ANN 近似最近邻检索(Approximate Nearest Neighbor)介绍
ANN:是 RAG 检索环节的「核心技术思想」(近似最近邻检索),解决了海量高维向量的快速匹配问题ANNOY:是 ANN 思想的「轻量级实现工具」,由 Spotify 开源,适配 RAG 的中小规模场景,特点是快速、易部署、低成本ANNOY 是 ANN 的 “子集”,是 RAG 中实现高效检索的「入门级首选工具」,更大规模场景可替换为 FAISS、Milvus 等。原创 2025-11-16 17:39:31 · 1025 阅读 · 0 评论 -
ReALM(Retrieval-Augmented Language Model)介绍
ReALM 是 RAG 技术的「进阶形态」,核心价值是通过「检索与生成的深度融合」让语言模型既能利用外部知识库的「新鲜、精准、专属知识」,又能保持生成的流畅性和逻辑性完美解决了传统大模型的知识局限和早期 RAG 的架构缺陷成为当前企业级 AI 应用(如智能问答、知识库管理)的主流技术方案之一。原创 2025-11-16 16:47:01 · 824 阅读 · 0 评论 -
BBPE 分词- Byte-level Byte Pair Encoding 概述
vocabularyn.(某人掌握或使用的)全部词汇;(某一语言的)词汇;(某个学科的)专业词汇,术语;(尤指外语教科书中的)词汇表;(美术、音乐等领域的)表现形式,表达手段未登录词(OOV,Out-Of-Vocabulary)指的是在模型预先构建的词表中不存在的词,这些词无法被现有词表直接匹配,导致分词或理解困难。就是模型 “不认识” 的词,常见于处理新词、专业术语、拼写错误等场景。无论是基于 “完整词” 的词表,还是基于 “子词” 的词表,只要某个词(或子词组合)未被收录,就属于 OOV。原创 2025-11-04 00:23:03 · 769 阅读 · 0 评论 -
Qwen2.5-Omni、TMRoPE-Time Aligned Rotary Positional Embedding 概念
AI 模型直接接收原始语音信号作为输入,无需人工拆分 “语音转文字(ASR)→ 文本理解 → 指令执行 → 文字转语音(TTS)” 等独立步骤通过统一的端到端架构完成 “听懂指令→理解意图→执行任务→生成响应” 全流程的核心能力模型能像人类对话一样,直接 “听” 懂语音指令并精准完成任务,无需中间环节的人工干预或模块拼接区别于传统语音交互的关键。原创 2025-11-02 17:27:33 · 750 阅读 · 0 评论 -
spark-SQL学习
假设 join_df 存储的是 “用户提交的问卷答案”,其中 answers 字段是一个嵌套列表(如 [{“question_id”: 1, “answer”: “A”}, {“question_id”: 2, “answer”: “B”}]),而目标是将每个问题的答案拆分为单独一行,存入 Hive 表。将 DataFrame 转换为 RDD(弹性分布式数据集),此时 RDD 的每个元素是 Row 对象(对应 DataFrame 中的一行数据)原创 2025-11-01 23:56:40 · 1100 阅读 · 0 评论 -
NLP中两种经典的静态词嵌入Word2Vec和GloVe简介
随着 BERT 等预训练语言模型(动态嵌入,可处理多义词)的兴起,静态嵌入的应用场景有所减少两者的思想(如上下文关联、统计规律)仍深刻影响着现代 NLP 模型的设计一句话总结 Word2Vec 训练 W 的逻辑先给 W 填随机数,然后让模型 “用中心词猜上下文”;猜不准就根据误差,微调 W 中每个词的向量;猜得越来越准的过程中,W 自然变成了 “语义相关的词向量离得近,无关的离得远” 的词嵌入表。原创 2025-10-31 13:05:45 · 1020 阅读 · 0 评论 -
Context Engineering概述
Tobi Lütke(托比・卢克)1980 年(另有 1981 年出生的记载)出生于西德科布伦茨,拥有德国和加拿大双重国籍,是全球知名电商平台 Shopify 的联合创始人兼 CEO,同时也是技术创新者、赛车手和投资人。Andrej Karpathy(安德烈・卡帕西)1986 年 10 月出生,斯洛文尼亚裔加拿大籍,是神经网络与计算机视觉专家,在人工智能领域的学术研究、产业应用和教育普及均有深远影响,被马斯克视为 “全球顶级 AI 领袖” 人选之一。原创 2025-10-29 19:37:39 · 894 阅读 · 0 评论 -
CNN(卷积神经网络)和 RNN(循环神经网络)
CNN 是 “空间特征提取器”:适合处理图像、视频等具有局部空间相关性的数据,通过卷积和池化高效提取层次化特征RNN 是 “时序记忆器”:适合处理文本、语音等序列数据,通过循环连接捕捉时序依赖,记住前序信息实际应用两者可结合(如视频分析:用 CNN 提取每一帧的图像特征,再用 RNN 处理帧序列的时序关系)是指卷积核在输入张量上每次操作时所覆盖的局部区域它是 CNN 高效提取局部特征的核心机制,类比于生物视觉系统中单个神经元仅对视野中局部区域刺激产生反应的特性。原创 2025-10-28 20:48:55 · 1174 阅读 · 0 评论 -
TensorFlow入门学习二
深度学习中,Tensor(张量)的激活函数是一类作用于张量数据的非线性函数,用于给神经网络引入非线性特性。它们通常应用在神经网络层的输出张量上,通过对张量中的每个元素进行逐元素运算,改变张量的数值分布,从而让模型能够学习和表达复杂的非线性关系核心作用:神经网络的基本计算(如矩阵乘法、卷积)本质上是线性操作。如果没有激活函数,无论网络有多少层,最终输出仍是输入的线性组合,无法拟合现实世界中复杂的非线性数据(如图像、语言、声音等)。激活函数通过引入非线性,使得神经网络能够逼近任意复杂的函数。原创 2025-10-26 22:46:19 · 584 阅读 · 0 评论 -
TensorFlow学习入门
TensorFlow 的历程本质是 “技术适配需求” 的演进:从内部工具 DistBelief 满足 Google 自身大规模训练需求,到 1.x 系列以静态图占领工业级市场,再到 2.x 系列以动态图转型应对科研用户需求,最终形成 “科研 - 生产 - 端侧” 全场景覆盖的生态体系其核心竞争力始终围绕 “兼容性(多平台、多硬件)、效率(分布式、性能优化)、易用性(API 统一、调试友好)” 三大维度,成为 AI 技术从实验室走向产业落地的关键基础设施。原创 2025-10-26 20:49:24 · 836 阅读 · 0 评论 -
借助智能体编写高效的智能体工具 - Writing effective tools for agents — with agents
2025 年 09 月 11 日 00:00:00 Anthropic 工程团队。原创 2025-09-28 01:04:30 · 923 阅读 · 0 评论 -
MLLM~M3-Agent 智能问答检索部分
文本向量的核心价值是将语言信息数字化,便于机器理解和处理。智能搜索(语义匹配)内容推荐(兴趣匹配)对话记忆(上下文检索)文本聚类(主题发现)情感识别(情绪分析)这些技术在大模型、知识库、推荐系统中非常关键。这三种模式用于将多个文本向量聚合为一个统一向量,便于后续计算相似度或分类求和:强化累积语义最大值:突出关键特征平均:平衡整体语义。原创 2025-09-14 19:57:31 · 640 阅读 · 0 评论 -
MLLM学习~M3-Agent Prompt学习
输入→处理→输出→评估” 全流程Prompt 并非孤立存在,形成了完整的视频理解链路:视频原始数据(语音 / 图像)→ 模块 1(提取语音 + 绑定人物 ID)→ 模块 2(生成情景记忆描述)→ 模块 3(生成语义记忆推理)→ 模块 4(基于记忆问答 / 检索)→ 模块 5(评估结果质量)→ 模块 6(优化结果格式)原创 2025-09-13 23:36:02 · 781 阅读 · 0 评论 -
MLLM学习~M3-Agent如何处理视频:视频clip提取、音频提取、抽帧提取和人脸提取
FFmpeg 是一套功能极强的跨平台音视频处理工具集,几乎涵盖了音视频编解码、转换、剪辑、封装、流媒体传输等所有核心环节,被广泛应用于专业软件(如 Adobe 系列、剪映)、服务器流媒体服务(如直播平台)、嵌入式设备(如监控摄像头)等场景,是音视频领域的 “基础设施级” 工具。FFmpeg 是音视频领域的 “瑞士军刀”—— 它不提供图形界面(需通过命令行或二次开发使用),但胜在功能全面、性能高效、兼容性极强无论是个人轻量化处理,还是企业级专业应用,FFmpeg 都是不可或缺的核心工具。原创 2025-09-13 18:17:57 · 1252 阅读 · 0 评论 -
一种具备长期记忆的多模态智能体
与传统 “单轮检索增强生成(RAG)”[20](将记忆一次性加载到上下文)不同,M3-Agent 通过强化学习实现多轮迭代记忆检索—— 例如,面对 “Alice 喜欢什么饮品” 的指令,智能体会先检索 “Alice 的身份标识(<face_0 > 对应 < voice_3>)”,再基于该标识检索相关偏好知识,最终生成答案。本文提出 M3-Agent—— 一种具备长期记忆的多模态智能体框架,通过 “实体中心多模态记忆” 与 “强化学习多轮推理”,实现了接近人类的记忆与推理能力;对照物,明显不同的事物;原创 2025-09-10 01:31:27 · 707 阅读 · 0 评论 -
Multimodal Agent with Long-Term Memory: M3-Agent 简介
M3-Agent: 具备长期记忆的多模态智能体本文介绍了一种具有(equipped with)长时记忆功能的新型(novel)多模式agent框架M3-Agent。像人类一样,M3-Agent可以处理实时的视觉(visual)和听觉(auditory)输入,以建立和更新其长期记忆。除了情景记忆(episodic memory),它还发展语义记忆(semantic memory),使其能够随着时间的推移积累世界知识。原创 2025-09-09 13:55:35 · 1074 阅读 · 0 评论 -
Elasticsearch 的 translog
translog 是 ES 保障数据持久性的 “核心保险”通过 “顺序写日志” 的方式,解决 Lucene 内存缓冲 “性能高但易失” 的问题,同时支持故障恢复和分片同步理解 translog 的工作机制和配置,能帮助开发者在 “写入性能” 和 “数据安全性” 之间找到平衡,优化 ES 集群的稳定性。原创 2025-09-07 19:13:03 · 662 阅读 · 0 评论 -
大模型Chain-of-Thought~CoT提高LLM对复杂推理问题的解决能力
CoT思维链是一种引导AI模型解决复杂问题的推理方法,核心是让模型像人类一样分步骤思考,而非直接输出结果,减少跳跃性错误通过将问题拆解为多个中间推理步骤(例如“先计算A,再分析B,最后得出C”),模型能清晰地处理数学题、逻辑推理等需要多步分析的任务问题:3人3天喝3桶水,9人9天喝几桶?回答:3人1天喝1桶 → 1人1天喝1/3桶水->1人9天喝3桶 → 9人9天喝27桶通过在输入文本中引入一系列中间推理步骤,引导语言模型逐步进行思考和推理,从而得出最终答案。原创 2025-09-06 00:19:00 · 1025 阅读 · 0 评论 -
MCP SDK 示例 - everything & thinking
一个MCP 全功能服务端,集成了 MCP 协议支持的所有核心能力(工具调用、提示词管理、资源读取、补全、信息诱导等),可通过标准输入输出(Stdio)或 HTTP 协议对外提供服务服务端通过一系列 API 注册 MCP 协议支持的核心功能,覆盖 “Tool、Prompt、Resource” 三大核心模块功能类型 注册操作 核心作用。原创 2025-09-01 00:50:42 · 1044 阅读 · 0 评论 -
MCP SDK 示例一
ElicitationHandler 是 MCP 中实现 “交互式信息补充” 的关键,让服务端能动态引导客户端完善请求,避免因信息不全导致的请求失败,提升交互的流畅性。原创 2025-08-31 22:27:14 · 974 阅读 · 0 评论 -
MCP SDK 学习二
在 MCP(Model Context Protocol,模型上下文协议)中,Completion suggestions(补全建议) 指的是服务端响应客户端 Complete 方法请求时,生成并返回的 “针对性内容补全结果”—— 本质是服务端根据客户端的输入需求(如文本片段、指令描述等),通过预设逻辑(如调用大模型、匹配模板库、查询数据源等)生成的 “补充 / 完整内容”,用于满足客户端的交互或业务需求。原创 2025-08-31 21:09:58 · 819 阅读 · 0 评论 -
MCP Go SDK学习一
本文档探讨模型上下文协议(Model Context Protocol,MCP)Go SDK 的设计方案。github.com/modelcontextprotocol/go-sdk/mcp 包中包含一个原型实现prototype,我们通过该原型探索了 MCP 的设计空间。本文档中的许多理念均源自该原型,但我们已在原型 API 的基础上进行了调整与扩展,因此本文档应被视为权威参考。canonicalkəˈnɑːnɪkl根据教规的,按照宗教法规的;真经的,正经的;标准的,典范的;准确的,权威的;原创 2025-08-31 00:41:44 · 919 阅读 · 0 评论 -
MCP Go SDK
JSON Schema 是一种基于 JSON 格式的规范,用于定义和验证 JSON 数据的结构、类型、约束条件。规定 JSON 数据必须包含哪些字段(如 name、age)限制字段的类型(如 age 必须是整数)设定数值范围(如 age 必须 ≥ 0)定义数组元素的类型(如数组元素必须是字符串)支持复杂结构(如嵌套对象、枚举值、条件约束等)},这个 Schema 规定:JSON 必须是对象,包含 name(非空字符串)和可选的 age(非负整数)原创 2025-08-30 00:57:29 · 959 阅读 · 0 评论 -
大模型RAG(Retrieval-Augmented Generation)
一种结合了检索与生成能力的人工智能技术,主要用于增强大型语言模型在特定任务中的表现。原创 2025-08-28 19:50:48 · 262 阅读 · 0 评论 -
MCP协议的两种传输方式
在 MCP(Model Context Protocol)协议中,客户端(Client)与服务器(Server)的通信依赖于传输层实现常见的两种传输模式是标准输入输出(stdio)传输和网络(Network)传输。原创 2025-08-26 10:46:43 · 969 阅读 · 0 评论 -
MCP之weather client demo
用户运行客户端,指定 MCP 服务器脚本路径客户端启动并连接到 MCP 服务器,获取可用工具列表用户输入查询(如 “查询加州的天气预警”)客户端将查询发送给 Claude 模型,并告知可用工具Claude 决定需要调用工具(如 get_alerts),客户端通过 MCP 协议调用服务器的对应工具工具返回结果(如加州的天气预警信息)客户端将工具结果发送给 Claude,Claude 生成自然语言回答客户端显示最终回答给用户重复步骤 3-8,直到用户输入 ‘quit’ 退出。原创 2025-08-26 00:21:57 · 214 阅读 · 0 评论 -
MCP之weather server demo
其他遵循 MCP 协议的客户端可以轻松发现并使用这些功能,体现了 MCP 协议 “像 USB-C 接口一样标准化连接” 的设计理念。原创 2025-08-25 23:47:04 · 461 阅读 · 0 评论 -
MCP-模型上下文协议入门
MCP(Model Context Protocol,模型上下文协议)2024年11月底,由 Anthropic 推出的一种开放标准,旨在统一大模型与外部数据源和工具之间的通信协议。主要目的解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口周边设备;[计] 外围设备MCP 是一种开放协议,用于标准化应用程序向大型语言模型(LLMs)提供上下文的方式。原创 2025-08-18 00:10:37 · 834 阅读 · 0 评论
分享