- 博客(887)
- 收藏
- 关注
原创 月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant
最后,两款方案其实都满足了我们大部分需求,但考虑到Reddit 是一个依然在高速增长的平台,且未来的数据体量与运维难度还将节节攀升,选择Milvus 的更强扩展性,能让整体运行更放心,也更适配Reddit 公司的情况。最后,每个方案的总分会用方案在某项需求的得分乘以这项需求的权重,再加起来(比如 Qdrant 在 “重排序 / 分数合并” 这一项得 3 分,权重是 2,那这项就是 6 分,所有项都这么算再求和)。,一同进步,开源让客户自身也能深度参与、贡献代码的方案,这样一旦遇到问题,也自主快速修复。
2025-11-20 17:59:07
978
原创 Milvus 落地顶级汽车资讯平台:如何支撑易车上亿用户的搜车需求?
(仅做变更数据同步,不做全量数据同步,不会影响业务),通过 Flink CDC 抓取 MySQL、SQL Server、MongoDB 等业务数据源变动,经 Kafka 传输、Flink Job 处理拼接、embedding 后,秒级推送至 Milvus 集群,延迟从 1 天降至秒级。对待召回数据生成相似问,提升召回率。,将文档、网页、图片等多源数据的清洗、加工、向量化封装成自动化任务,不仅保障了数据逻辑的一致性,还能充分利用大数据集群资源,提升数据处理效率,为 Milvus 提供了高质量的向量数据输入。
2025-11-18 17:57:26
423
原创 沃尔沃RAG实战:企业级知识库,早就该放弃小分块策略
此外,对于Milvus的选型,沃尔沃也没选择比较新的 PyMilvus v2 SDK 及其内置的embedding集成功能,而是选择了 SDK v1 中基于collection的旧版本,从而保证团队能够设计详细的元数据结构,并明确定义每种文档的存储、索引和检索方式。此外,针对格式繁多的非结构化数据,Milvus 支持的字段类型多达 64 种,这让沃尔沃不仅能存储嵌入向量,还能存储丰富的元数据 —— 从文档类型、来源到部门级分类等关键信息,覆盖全面。理由是,他们觉得较短的片段能带来更高的精度。
2025-10-29 18:16:00
1012
原创 先分块再向量化已经过时!先embedding再chunking才是王道
仅需调整 3 个核心超参数(最大分块大小、一二句之间的最低语义相似度需求、新句子与块内句子最大相似度的最低门槛),且超参数逻辑与分块大小自适应 —— 分块规模越大,新句子纳入的阈值越高。:计算当前分块 C 内所有句子向量间的最小 pairwise 余弦相似度,识别分块内语义最不相似的句子对,衡量分块内句子的关联紧密程度,进而判断新句子是否与分块内句子足够相似。核心决策逻辑为:若分块 C 内的最小相似度小于新句子与分块 C 的最大相似度,则新句子加入分块 C,否则开启新分块。(衡量新句子与分块的适配度);
2025-10-28 17:57:42
736
原创 DeepSeek-OCR解读:视觉如何成为长上下文压缩的新思路
更重要的是,在计算效率层面,会将在线处理复杂度大幅降低。而 DeepSeek-OCR 通过 文本→图像→视觉 token的转换,直接将计算基础从文本 token 转为视觉 token,相当于用更低复杂度的载体重构问题。例如处理含折线图的财报时,视觉 token 可保留数据趋势,解码器能直接输出可编辑的 HTML 表格,避免传统方案仅能提取图下文字说明的局限。简单来说,用视觉模态作为长上下文的压缩载体,DeepSeek-OCR在保证精度的同时,可以实现模型算力与效率的突破。
2025-10-22 18:54:15
1134
原创 大模型落地,已经走到了用上下文工程续命时刻
当你的AI应用需要从海量上下文中快速找到最相关的信息时,这种性能表现直接决定了用户体验的好坏。DeepMind在Gemini 2.5的技术报告中详细描述了这种现象:在Pokemon游戏实验中,AI智能体偶尔会产生关于游戏状态的错误判断,并将这些错误信息写入上下文。,甚至在完全不需要工具的场景中也会错误地尝试调用工具。从1KB的文本消息到100MB的视频片段,从简单的数值记录到复杂的嵌入向量。而且,基于“Lost in the middle”现象,大模型会给上下文的开头和结尾更高的权重,忽略中间部分内容。
2025-10-13 17:58:40
1061
原创 Filevine四亿刀融资跻身法律AI独角兽,背后的infra怎么搭
在Filevine看来,无论法律类AI还是更多行业的AI产品,其本质都不是取代传统人类,而是通过向量数据库等产品,来解决人类工作中的脏活、累活,以及多数无意义的案头工作。:一个案件通常包括数千份文件,包括法庭文件、诉状和命令、证词记录和专家证人陈述、历史案件档案和先例文件,此外,复杂的医疗记录,每个病人通常有数百页。在传统的法律工作流程中,律师60–80% 的时间,都被花在寻找、过滤、对齐法律条文以及各种信息上,每天消耗的时间至少6小时起步。,日均文件上传量超过 2,000 万页,总处理文档超十亿份。
2025-09-24 18:07:58
680
原创 百图生科:如何搭建针对50亿蛋白质序列、上亿文献的AI检索系统
生物数据形态多样,涵盖蛋白质结构、DNA 序列、细胞成像、科研文本等,生命科学的突破往往就藏在跨模态数据的关联中 ——比如生物体的DNA会影响其所能产生的蛋白质大类,而蛋白质结构与细胞病变之间也往往有着对应关系。基于稳定高效的基础设施,百图生科的目标是把技术转化为真正解决行业问题的可落地方案。具体路径上,通过大模型海量的生成、预测与优化能力,AI几乎可以生成无限药物组合可能,去针对过往未被考虑的疾病治疗靶点,生成具有优化特性的新药物分子或生物制剂,辅助和优化传统制药中的高通量筛选和生成设计环节。
2025-09-23 18:07:55
1013
原创 索引选不对,成本贵十倍!HNSW与IVF如何做选型
如果采用了 PQ/SQ8 压缩,如果采用了 PQ/SQ8 压缩,系统会用查表法(lookup table method) 来加速距离计算:在查询开始时,预先计算查询向量与码本的距离,之后只需“查表+加和”即可快速得到近似距离。读者(查询向量)进门不用瞎转,直接锁定最相关的 2-3 个区域,在小范围里找书,效率自然翻倍。它的核心思路是“先粗分,再细排”:通过 k-means 聚类将海量高维向量划分到不同簇中,查询时只需进入最相关的少量候选簇,既避免了全表暴力扫描,又能兼顾速度与精度。
2025-09-18 18:11:11
1346
原创 企业级向量数据库选型,Milvus 和Zilliz Cloud哪个更合适?
需要特别注意的是,对于多数新用户而言,Milvus 的自主运维需要一定的时间沉淀与技术认知积累,因此这类用户往往更倾向于选择商业化的 Milvus 产品(如云厂商托管版 Milvus、或者Zilliz cloud)。整体来说,通过灵活的机器类型、计算存储分离、降低的运维开销、AUTOINDEX 和弹性扩展,Zilliz Cloud 比自托管的 Milvus 更具成本效益,总拥有成本(TCO)可下降 50%以上。这些特性共同为您的组织带来了更高效、自动化和强大的向量搜索体验。
2025-09-17 18:23:11
1139
原创 报名倒计时丨9月20日Milvus社区北京Unstructured Data Meetup
Unstructured Data Meetup 以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。活动受众包括,AI工程师,数据科学家,大数据工程师,AI产品经理等群体。通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索非机构化数据和 Gen AI 的最新进展及演进方向。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!
2025-09-15 18:11:52
371
原创 Meta如何给RAG做Context Engineering,让模型上下文增加16倍
Meta 团队在 Slimpajama(书籍、arXiv 领域)、PG19、Proof-Pile 等主流数据集,以及 RAG、多轮对话、长文档摘要等任务中对 REFRAG 进行了全面验证,其优势主要体现在效率提升、上下文扩展、场景适配三个维度。同时,因为 LLM 是自回归生成的(依赖前文 token),REFRAG 的方法保证了原始 token 仍能参与生成,不破坏上下文连续性。目标是让解码器基于压缩上下文(编码器输出)的生成结果,尽可能接近基于完整上下文的结果,为下游任务(如 RAG)奠定基础。
2025-09-12 19:08:21
1306
原创 Milvus × 蜜度:如何基于向量数据库构建全网多模态舆情监控系统
对于蜜度来说,舆情管理的核心之一是热点图像数据处理,虽然数据底库的总量不大,只有几十万,但是需要扛住上千的并发访问,为此,蜜度采用了Milvus的内存多副本特性,在load 集合的时候加载了 50 多个副本,从而达到了5000+的qps。作为一家以语言智能与垂直大模型为核心的AI企业,蜜度科技一直服务于政企与媒体客户,提供高效、智能、安全的信息处理解决方案。例如,我们可以同时用向量搜索找出“语义相似”的图片,同时叠加时间范围、区域、事件标签等属性过滤器,从而实现更贴近用户业务的检索逻辑。
2025-09-10 18:10:55
747
原创 实测|Perplexity最新AI浏览器产品Comet,真正的agent全家桶!
Comet不仅找到了标记为"good first issue"的入门级任务,还根据难度和技术领域进行了分类,并提供了每个issue的简要描述和解决思路。同时,直接的协议控制也提供了更精细的页面状态管理能力.比如,面对Milvus这样复杂的开源项目时,让开发者不再需要在数百个GitHub页面间来回跳转,花费数小时阅读文档却仍然一头雾水,让复杂的技术学习变得像与ChatGPT对话一样简单?Milvus是全球领先的开源向量数据库产品,其快速迭代和高活跃度,带来了许多独特的新版本特性和众多复杂的产品概念。
2025-09-09 17:59:59
1469
原创 英伟达新论文:多数LLM应用等不到盈利,SLM比LLM更适合做agent
此外,小模型针对特定任务微调的难度与效果也往往更优,更重要的是大模型的泛化能力,应对的是复杂输入,但是agenticAI存在的必要性,即在于把复杂任务拆解成一系列简单可执行的子任务。部署 “数据采集工具”,记录智能体所有 “非人机交互(non-HCI)的模型调用”—— 包括输入给 LLM 的提示词(prompts)、LLM 输出的响应、智能体调用外部工具(如计算器、数据库)的具体内容,还可以有选择的记录 “响应延迟”(为后续优化速度做准备)。也是因此,坚持“事事都用 LLM”,实质上是在错配算力,
2025-09-04 18:07:01
736
原创 报名开启丨9月20日Milvus社区北京Unstructured Data Meetup
Unstructured Data Meetup 以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。活动受众包括,AI工程师,数据科学家,大数据工程师,AI产品经理等群体。通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索非机构化数据和 Gen AI 的最新进展及演进方向。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!
2025-09-03 18:00:41
509
原创 向量检索快比LLM还贵?不支持S3的向量数据库,迟早要淘汰!
先粗略查一批,再按条件筛 —— 好处是好实现,能利用统一的底层索引结构,缺点是在过滤条件较多时,TopK 结果可能严重不足(我们测到删除 50% 数据后,TopK 20 只能返回 15 个结果)。现如今,S3自身的定位,从简单的对象存储升级成为了一个多模冷存储,不仅仅是向量,图,KV,时序等多种模态,未来常见的业务几乎都可以通过S3Table的模式加速。在我们看来,在 AI 应用里,数据不应该被粗暴割裂成在线和离线,很多情况下,他们是随时动态转化的。因此,过去向量数据库最在意的召回速率,反而不再重要。
2025-09-03 18:00:41
919
原创 Zilliz Cloud功能上新:智能扩缩容上线, SSO 、Audit Log再升级
关于 Zilliz Cloud 安全与合规实践的更多内容,可访问 Zilliz 信任中心(Zilliz Trust Center)https://zilliz.com/trust-center。功能上,Milvus 2.6 延续并加强了 2.5 版本引入的全文检索功能,进一步强化了搜索功能,并整体升级底层架构以满足更严苛的性能、成本与规模需求。此外,开源的Milvus 2.6 的所有功能,也在此次Zilliz Cloud功能升级中迎来内测(如有需要,可联系对口销售即可开通)。
2025-08-27 18:06:09
725
原创 闪灵AI :如何靠AI视频检索,让小团队广告提案生产效率提升十倍
过去,在创意环节,广告公司想给车企想拍一支科技感汽车穿梭山林的 TVC方案,光找参考素材也得耗掉一整天:视频平台素材效果参差不齐,硬盘里的优秀历史素材,想找到最精准的画面片段,找文件夹、拖拽时间轴也要耗费不小的时间精力。低频冷数据存在S3对象存储,保持低成本。一开始,闪灵AI使用的是开源 Milvus 搭建检索系统,能实现输入文字或图片,毫秒级匹配相似视频片段的效果,但随着素材量增长到近 1000 万向量、二三十万条视频,新的问题出现了:自己搭集群太吃内存,一台服务器根本扛不住,而且运维成本特别高。
2025-08-26 18:24:53
588
原创 直播预告丨从码农到 B 站百万播放 KOL!技术人转型传播秘籍大公开
为了方便大家的交流以及技能的分享,我们组织了北辰使者说这个栏目。两位嘉宾会结合真实经历,从 “如何与 Milvus 结缘、开启社区参与” 讲到 “码农必备的 KOL 意识”,更会揭秘百万播放爆款《鲁迅说没说》(直播最后还设有 Q&A 自由讨论环节,你可以现场提出技术传播、开源参与的困惑,与嘉宾深入交流,找到适合自己的转型方向。同时,还会分享 Milvus 北极星计划的参与体会,给想入局开源与技术传播的朋友实用建议。欢迎大家锁定直播间,和我们一起解锁技术人 “破圈” 新路径,让你的技术价值被更多人看见!
2025-08-19 18:01:11
400
原创 Word2Vec、 BERT、BGE-M3、LLM2Vec,embedding模型选型指南|最全
混合类型” 是近年的创新方向,如 BGE-M3 能生成包含稠密向量、稀疏向量,以及多向量表示 —— 即使文本中未出现 “机器学习”,模型也能通过语义推理在向量中赋予该术语一定权重,既保留了关键词匹配的精确性,又增强了语义理解能力。稀疏向量:通过线性变换与 ReLU 激活,生成包含 “相关术语权重” 的稀疏表示,即使文本中未出现某术语,模型也能通过语义推理赋予其权重(如 “iPhone 新品” 会关联 “苹果公司”“智能手机” 等术语)。Embedding 的本质是从非结构化数据到计算机语言的 语义翻译。
2025-08-15 18:04:41
924
原创 报名倒计时丨8月23日南京Unstructured Data Meetup火热招募中
Unstructured Data Meetup 是以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。我们致力于通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索行业最新进展。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!8月23日,南京场Unstructured Data Meetup 将在。日13:00-17:30,
2025-08-13 18:12:06
320
原创 LLM、RAG、workflow、Agent,大模型落地该选哪个?一个决策矩阵讲透
当任务满足 “三可” 条件 —— 可拆解(子任务间耦合度越小越好)、可验证(每个子任务结果可独立校验)、成本可控(预期 ROI够高,可以打平token消耗成本)时,可尝试 multi - agent;以智能客服为例,可通过 Workflow 实现 “用户提问→意图识别→任务分配” 的标准化分流,再让 Agent 处理具体任务中的动态决策(如 根据用户历史订单推荐退款方案),依此降低人工干预频率,兼顾稳定可控与场景适应能力。若仅是处理单篇长文档(如万字报告分析)且对成本不敏感,可短期依赖长上下文大模型。
2025-08-13 18:12:06
1299
原创 最佳实践|Zilliz 如何助力MiniMax的AI落地与预训练数据管理
但通常来说,这数百亿文档中会存在大量重复冗余内容,不仅浪费计算资源,更导致大模型反复“咀嚼”相同的知识,在重复内容上过拟合,降低了对新信息的泛化能力。其中,MinHash 负责将文档压缩为签名(目前,MinHash 向量,需要用户自己生成),LSH 负责高效缩小搜索空间,从而快速定位潜在重复,帮助企业完成百亿级语料下的预处理优化。更关键的是,这些数据并不是静态的。为此,我们不仅需要更大的计算资源,也对非结构化数据的管理提出了更高的要求,对应的数据存储、处理、传输和检索系统升级已经迫在眉睫。
2025-08-06 18:53:25
926
原创 Milvus × 联想:向量数据库如何让制造业库存周转率提升10%
要补的话,补多少才合适?早期我们主要靠人工加正则表达式,从这些描述里提取关键词来判断机型,但部分物料的模糊匹配准确率并不理想,而随着物料越来越多、描述越来越乱,这套方法不仅效率低,出错率还不小,维护起来也特别头大。更重要的是,大家不仅能回忆当初,还能基于数据做出更扎实的总结和判断,帮助采购团队精准制定补货策略,避免缺货风险,同时控制好库存规模,提升资金效率。有了这个基础,不管是老物料还是新物料,只要录入信息,就能通过相似度检索快速找到最像的那类物料,然后一键分类搞定,效率和准确率都上了一个台阶。
2025-07-31 18:11:59
1245
原创 Milvus北辰使者的来信:Milvus Workshop是什么,我们为什么做这件事
Milvus Workshop 通过提供结构化、动手实践的学习体验,为用户在其 AI 和 ML 项目中充分利用 Milvus 提供了入门指南。它通过提供丰富的教程、示例代码和实践项目,降低 Milvus 的学习门槛,帮助开发者更高效地掌握和应用向量数据库技术。社区协作需求:开发者希望有一个开放的平台,可以分享 Milvus 的使用经验、案例和最佳实践。促进社区协作:鼓励开发者贡献自己的案例、工具和经验,打造一个活跃的 Milvus 学习社区。Milvus 的崛起与社区需求。Milvus北辰使者。
2025-07-25 18:25:43
1046
原创 直播预告丨运维部署有妙招!Milvus 稳定运行秘籍大公开
刘川丰将结合实战经验,详解 Milvus 运维部署的最佳实践,助力大家解决日常运维中的痛点问题,让 Milvus 运行更稳定高效。欢迎大家锁定 Zilliz 视频号直播间,和我们一起探索 Milvus 运维部署的门道,提升 Milvus 使用体验!客户催上线,老板一句“今天下班前搞定”,你却要手动改一堆 YAML、调资源、配高可用、还得盯着监控别挂了服务?更有自由讨论环节开放提问,现场提出在 Milvus 运维部署中遇到的困惑,与讲师深入交流。7 月 31 日 20:00-21:0。
2025-07-24 20:15:40
378
原创 ES vs Milvus vs PG vector :LLM时代的向量数据库选型指南
但只有开源是不够的,大型开源项目的迭代维护是需要很高的人力投入,单靠个人开发者几乎无法支撑,业界知名的数据服务相关的开源项目,比如Spark、MongoDB、Kafka,背后都是有成熟的商业化公司在运营。在此基础上,VDB的商业化方案,则应该保持云中立,在保证弹性、低运维投入的基础上,能满足不同业务、不同地区产品,以及不同阶段企业的多样化需求。Top-K相似性检索是最常见的向量检索需求,但除此之外过滤检索、阈值检索、分组检索和混合检索,也是一个企业级向量数据库的必备功能。互联网时代,关系型数据库为王。
2025-07-17 19:31:50
1187
原创 实战|从grok4与kimi2谈谈,大模型进入十万亿训练数据时代,如何做数据查重
但一个问题是,来自公域互联网的这些预训练数据中往往会存在大量重复冗余内容,如果将其一股脑不加选择的用于预训练,不仅浪费计算资源,更会导致大模型反复“咀嚼”相同的知识,在重复内容上过拟合,降低了对新信息的泛化能力。根据IDC的预测,到2027年,全球范围内,没有统一格式、缺乏明确定义字段的非结构化数据,总量将达到近250ZB,占比达到整体数据总量的86.8%。(2)能用上Minhash LSH的场景,通常是针对百亿、千亿甚至万亿数据的查重,这对服务背后的性能、工程化能力全都提出了极为苛刻的要求。
2025-07-15 20:17:04
1218
原创 直播预告丨解锁运维部署最佳实践,让你的 Milvus 更稳定!
刘川丰将结合实战经验,详解 Milvus 运维部署的最佳实践,助力大家解决日常运维中的痛点问题,让 Milvus 运行更稳定高效。欢迎大家锁定 Zilliz 视频号直播间,和我们一起探索 Milvus 运维部署的门道,提升 Milvus 使用体验!客户催上线,老板一句“今天下班前搞定”,你却要手动改一堆 YAML、调资源、配高可用、还得盯着监控别挂了服务?更有自由讨论环节开放提问,现场提出在 Milvus 运维部署中遇到的困惑,与讲师深入交流。7 月 31 日 20:00-21:0。
2025-07-14 19:05:14
520
原创 推出了四个MCP后,我们发现MCP的落地速度已经赶不上吹牛速度
目前已经支持使用英语、中文、西班牙语等语言与数据库交互,例如:“查找与该产品描述相似的文档” 或 “创建一个存储 512 维图像嵌入的集合”,“创建一个免费的 Milvus 集群”,用户无需打开控制台,也不需要配置细节,即可获得即用型数据库实例。更直白来说,MCP本身很好,但大模型在精准理解人类意图环节就出了问题,或者大模型本身在执行过程中有幻觉,那MCP自然也无法满足需求。开发成本降低,大模型的工具使用能力增加,过去一些繁琐专业的操作,可以借助大模型以自然语言交互的方式来完成。
2025-07-08 18:35:16
790
原创 超级黑马Read AI如何在美国把会议转录做成一门大生意
Assistant(会议助手):自动加入 Zoom、Meet、Teams 等会议,实时收集发言、注意力、情感、发言频率等互动数据,自动记录每个发言人的“语气”和“情绪走势”(这是其核心功能,也是其争议来源)。Read AI 选择扩充其产品矩阵:日历同步、CRM同步、邮件汇总、即时通讯汇总、视频会议汇总功能依次上线,基于以上数据,Read AI又推出了会议总结、会议分析、多平台信息检索等功能,从前,用户要自己提问,才能得到回应。此外,用户要的不是原话,而是理解:他想知道,客户是不是在动摇;
2025-07-07 18:48:33
1065
原创 我们是向量数据库的领军企业,我们在等你来
回顾历史,过去四十年的PC时代,如何更好的管理基础数据,诞生了Oracle这样三万亿(RMB)市值的巨头;目之所及,所有你听过的全球知名企业:英伟达、苹果、OpenAI、PayPal、AWS、微软、Google、阿里云……2. 精通Pulsar/Kafka/RabbitMQ、Etcd/Zookeeper等主流中间件系统的应用、排障、调优,并具备一定的二次定制能力。很显然,面对人工智能这样一个更广阔的市场,非结构化数据这样一个更大的蓝海,我们关于未来的想象力,不止于此。
2025-07-03 18:46:00
1231
原创 深度分析 | 自动驾驶数据挖掘的三座大山与向量数据库胜负手
在自动驾驶算法持续迭代的背景下,Zilliz 允许对已有数据的 embedding 进行批量替换,配合 alias 机制可帮助业务在无感切换模型的同时保持数据查询的稳定性:Zilliz 支持同时写入由不同模型生成的向量,并可通过混合搜索(hybrid search)对多向量列进行检索,为模型对比和联合分析提供便利。同一时期,作为国内智驾投入最为激进的车企,小鹏正式宣布,面向智驾经验用户即刻推送无限XNGP智能辅助驾驶功能,并且,该功能将不限城市、不限路线,有导航的地方就能使用。
2025-07-03 18:46:00
1302
原创 G2发布最新向量数据库报告,Zilliz斩获最佳性能与最易用荣誉
举个简单的例子,很多向量数据库的报告,主要看的还是一些古早Benchmark测评数据,但这些Benchmark通常会做出一些不切实际的假设:比如,所有数据默认已经全部导入,索引已经完全建立。此外, Zilliz Cloud还提供了“易于使用的仪表盘和 API,用于数据库管理和监控”,以及简洁明了的文档体系,便于用户上手。从应用广度来看,向量数据库的场景仍在不断横向拓展,从RAG建设、知识库构建,搜索、推荐,再到生物制药、大模型数据管理、自动驾驶数据挖掘,每一个场景都有着完全不同的成本、性能、安全性考量。
2025-07-02 18:33:57
929
原创 从8万+数据源提炼洞察,ChatGPT+Zilliz +LangChain如何成创新药研发新范式
与此同时,创新药产业还长期被专利悬崖所制约:即一款创新药的专利有效期通常仅有20年,而除掉漫长的6-10年临床,企业对药品的实际独占权仅有12-14年。也就是说,在这中间,加速任何一个环节尤其是耗时最久的临床期的效率与变革,无论对药企的发展,还是对病人的生存质量,都至关重要。,以及企业的内部私有数据,在进行数据汇总时,会分析和交叉核对不同来源的数据进行二次验证,从而保证信息的准确性以及及时性。能够处理数十亿个向量、具备商业级的系统可靠性、能够同时处理结构化信息,以及PDF在内格式复杂的非结构化内容。
2025-07-01 20:08:44
1001
原创 开源|VDBBench 1.0正式官宣,完全复刻业务场景,支持用户自定义数据集
比如,SIFT 和 GloVe 这类数据集通常用于较小规模的低维向量,但如今的模型,尤其是大模型(例如 OpenAI 和 Cohere 的嵌入模型),其向量维度通常远超这些传统数据集,且规模上也大得多。通常来说,带过滤条件的搜索是一个常见的实际应用场景,比如,在电商或推荐系统中,用户往往会根据不同的标签或特征筛选数据(如“颜色==红色”)。通过这样的数据集,我们能够测试系统在大规模高维数据上的表现,包括存储、查询和检索的性能,确保测试结果能够真实反映现代大数据场景下的挑战。
2025-06-27 18:49:04
1009
原创 直播预告丨聊聊Milvus 2.6新功能及背后的开发故事
圆桌环节更有技术负责人、QA大佬和社区主理人分享 Milvus 2.6 开发背后的故事,并现场解答社区用户问题。7 月 1 日晚上 20:00-21:00,Zilliz 视频号直播间,Zilliz 合伙人。欢迎大家锁定 Zilliz 视频号直播间,与我们一起探索 Milvus 2.6 的技术魅力!和研发VP 栾小凡将带来《一步到位,详解 Milvus 2.6 新功能》的分享,点击下方预约,共享知识探索之旅!开发者生产力拉满的新功能。性能不打折的技术升级。
2025-06-26 18:23:56
427
原创 成本降50%、准确率提升40%,美国头部地产AI 公司用Agent弯道超车
针对关键交易,检索到的上下文会通过多个大型语言模型(如 Claude 或 OpenAI GPT)进行验证,以确保信息的准确性与多视角的理解,从而增强系统的稳健性和可信度。如此一来,你问:“XX交易的关联方以及各自适用的交易规则都有哪些”时, 大模型无法直接回答的问题,使用RAG技术,将相关的历史资料汇集,就能生成一个足够准确又智能的回复。与此同时,客户的要求也越来越多,比如交易完成,所有的embedding数据就要删除,来保护客户隐私——高频的数据增删,对索引的构建与维护能力,提出了巨大的要求。
2025-06-25 18:09:59
697
原创 干货|从FiDRAG到GraphRAG,RAG选型终极指南
随着RAG技术的不断演进,开发者可以根据需求选择合适的变体,应用于不同的领域和场景,解锁AI技术的新潜力。它能够快速定位关键信息,支持文本和图像的多模态检索,提升了检索的速度和精度。:与传统方法一次性检索所有数据的模式不同,新的RAG模型能够根据问题的具体需求,动态判断是否进行外部信息检索,显著提升了效率并减少了不必要的数据浪费。通过Zilliz Cloud的托管Milvus服务,开发者可以轻松地部署这些先进的RAG变体,推动AI技术的发展,助力各行业创造更加智能和高效的系统。
2025-06-24 18:30:08
930
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅