• 博客(2696)
  • 收藏
  • 关注

转载 RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

为什么同样是做 RAG,有的效果拔群,有的却差强人意?分块(Chunking)策略可能是那个被你忽略的关键环节。AI中的分块是指将大型文档分割成称为“chunk”的较小片段。这些片段可以是段落、句子、词组或受token限制的片段,这使得模型能更轻松地仅搜索和检索所需内容。这种分块技术对于优化检索增强生成(RAG)的性能至关重要。在RAG中,检索到正确的信息是关键,但当知识库非常庞大,可能包含数百万字或文档时,使用有效的RAG分块技术对于从这类大型数据集中高效检索相关信息,就变得至关重要了。举个例子,你有一个

2025-11-21 18:09:06 71 1

原创 多智能体设计模式和智能体框架,你会了么?

硬编码方式,根据关键词、模式或结构化数据进行路由。此方法比 LLM 路由更快、更确定,但灵活性较低。•。

2025-11-19 15:30:30 653

原创 Joycode 无法跨项目读取源码怎么办?MCP Easy Code Reader 帮你解决!

本篇文章主要介绍 MCP Server,它可以帮助你在使用 Joycode 编写代码时,根据调用链路将多个项目或 Jar 包中相关的代码读取到上下文中,供 Code Agent 帮我们分析逻辑和编写代码,而无需再手动将源码复制到对话框中发送给 AI,提高 Code Agent 准确度和编码效率。MCP 已发布和 Joycode MCP 市场,欢迎大家使用。

2025-11-19 15:28:34 878

原创 宝剑锋从磨砺出——零售数据库内核,为大促铸剑!

癸卯七月风雨大作京东零售·袁博文僵卧双九不自哀,尚思为东戍轮台。夜阑卧听珊瑚雨,铁马内核入梦来。前言略长,只关心技术的同学可直接跳过看第二章这个问题在技术人心中其实没有标准答案,每个人都有每个人的见解。架构师眼里大抵是高屋建瓴,统领全局;技术大牛的视角可能是剖根溯源,精刀细琢;新人小白或许更单纯,无非就是学习进步,快速成长为大牛之类了。但在我——一个京东数据库人的眼里,技术的底色或许应该是五彩斑斓的吧。经常听人说,每个人呱呱坠地那一刻,都是一张白纸,父母在其上着墨。对于技术人来说又何尝不是呢?初学一门技术,

2025-11-19 15:26:24 847

原创 京东云张晨 受邀参加KCD 杭州站 x OpenInfra Days China,分享AI时代的大型集群数据处理之道

我将分享一套经实际部署的方案经验,如何在严苛的真实场景中基于虚拟机的隔离提升安全性与效率,并剖析其实际应用价值与注意事项。他的分享将为业界同行应对相似挑战提供宝贵的思路与实战经验。这一变革对底层设施提出了前所未有的新要求:更极致的弹性伸缩、更高效的算力利用、更复杂的跨域调度和更全面的安全防护。这是一个绝佳的机会,在活动上可以直接聆听杰出的开源基础设施领导者的演讲,学习用户案例,建立人脉,并融入当地社区。它充分展现了开源社区的开放精神和跨社区协作的强大力量,我们将共同推动 AI 与云计算技术 的进步与发展。

2025-11-17 17:43:34 732

原创 【原理到实战】实验异质性分析

实验的异质性,一般被称为HTE(即Heterogeneous Treatment Effects),意为实验中同一个treatment对不同的实验样本,得到的策略效果可能是不一样的。另外还有一些重要的概念需要大家理解英文简称英文全称中文译名含义公式ATE平均处理效应所有实验对象的平均实验效果CATE条件平均处理效应满足一定条件的实验对象的平均实验效果ITE个体处理效应某个实验对象的实验效果。

2025-11-12 16:10:45 769

原创 最新MCP规范解读,看这篇就够了!

Prompt就像是「对话模板」或「快捷指令」,把常用的复杂指令预设好,用户一键调用。用生活中的例子类比,就像微信的「快捷回复」或IDE中的「代码片段(Snippet)」。

2025-11-12 16:08:41 634

原创 多智能体设计模式和智能体框架,你会了么?

硬编码方式,根据关键词、模式或结构化数据进行路由。此方法比 LLM 路由更快、更确定,但灵活性较低。•。

2025-11-12 16:07:43 634 1

原创 Cursor 一年深度开发实践:前端开发的效率革命

这个过程强制我理解每一行变更,重新建立起对代码的掌控感。如上图,通常 cursor 在修改完成后都会自动生成总结(也可以通过添加 rules 控制),可以结合总结阅读 diff。

2025-11-10 18:39:22 1117

原创 并发丢数据深度剖析:MySQL锁机制与事务实战踩坑及解决方案

id` bigint(50) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增ID',`metric_def_id` bigint(11) unsigned NOT NULL DEFAULT '0' COMMENT '指标定义id',`logic_table_id` bigint(11) unsigned NOT NULL DEFAULT '0' COMMENT '逻辑表id',

2025-11-10 18:32:03 630

转载 AB实验分析智能体(工程篇)【AI业务应用方向】

然而,在这一过程中,仅关注正向指标的提升是不够的,还需通过深入的数据分析,识别潜在的风险因素——即在实现预期指标提升的同时,是否对其他关键指标带来了隐性的负面影响,并评估此类代价是否在可接受范围内,从而做出更为全面和审慎的决策。使得分析质量有了明显的飞跃。为了实现实验分析Agent真正意义上的“助手化”体验,在调研了京东ME开放平台的能力后,发现将以往依托平台的产品化能力前置到京ME端是可行的,让产研同学能够“触手可得”实验分析能力,无需跳转至独立的分析平台,从而显著提升操作便捷性与整体用户体验。

2025-11-10 10:14:49 48

原创 告别 “盲买”!京东 AI 试穿 Oxygen Tryon:让服饰购物从“想象”到“所见即所得”

线上电商购物模式下,消费者在选购服装时,往往只能通过静态图片和文字描述来想象衣服上身的效果。这种信息获取方式存在极大的局限性,导致消费者在收到商品后,因实际穿着效果与预期不符而产生大量退换货。据相关数据显示,时尚电商领域的平均退货率高达 30% - 40%,部分商家甚至更高。这不仅给消费者带来了糟糕的购物体验,也让商家承受着高昂的运营成本。​对于商家而言,高退货率意味着物流成本的增加、商品损耗的加剧以及客服压力的增大。同时,低效的转化也限制了业务的增长速度。

2025-11-04 18:35:07 908

原创 基于业务知识和代码库增强的大模型生成代码实践

3.

2025-11-04 18:32:47 918

原创 JoyCode:SWE-bench Verified打榜技术报告

SWE-bench Verified 是由普林斯顿大学等机构开发的软件工程基准测试,专门用于评估AI系统解决真实软件工程问题的能力。该基准测试收集了来自 scikit-learn、matplotlib、requests 等知名开源 Python 项目的真实 GitHub Issues,要求AI模型理解问题描述、分析现有代码库结构,并生成能够修复 Bug 或实现新功能的代码补丁。

2025-11-03 15:32:43 645

原创 给Java同仁单点的AI“开胃菜“--搭建一个自己的本地问答系统

1.以上便是 完成了一个超简易的AI问答 功能,如果想搭一个问答系统,可以用Springboot搞一个Web应用,把上面的代码放到 业务逻辑中即可;2.langchain 还有其他很多很强大的能力,prompt Fomat、output Fomat、工具调用、memory存储等;3.早点认识和学习ai,不至于被它取代的时候,连对手是谁都不知道;

2025-11-03 15:24:06 1007

原创 纳尼?自建K8s集群日志收集还能通过JMQ保存到JES

在京东内网环境部署K8S并收集日志, kafka+es的替代方案考虑使用JMQ+JES,由于JMQ的底层是基于kafaka、JES的底层基于ES,所以该替换方案理论上是可行的。

2025-11-03 15:20:26 379

原创 真实案例解析缓存大热key的致命陷阱

Redis的高并发性能毋庸置疑,但是我们却忽略了一个大key和热key对网络带宽的影响,本次引发问题的大热key大小达到了1.5M,经过事后了解京东Redis对单分片的网络带宽也有限流,默认200M,根据换算,该热key最多只能支持133次的并发访问。针对这种庞大的活动,我们开发团队也提前预料到了可能会出现的大key和热key问题,所以在查询活动缓存之前增加了一层本地jvm缓存,本地jvm缓存5分钟,缓存失效后再去回源查询Redis中的活动缓存,本以为会万无一失,没想到最后还是出了问题。

2025-10-30 11:07:02 980

原创 java小知识-ShutdownHook(优雅关闭)

java里有个方法Runtime.getRuntime#

2025-10-30 11:06:29 521

原创 提供方耗时正常,调用方毛刺频频

调用方A -> JSF -> 提供方B大多数情况下,调用方耗时 和 提供方耗时 基本没有差别个别情况下,调用方耗时 远高于 提供方耗时,大概5分钟20+次。

2025-10-30 11:06:01 692

原创 纯配时效服务-双Redis集群设计

纯配时效服务作为物流下单环节中计算时效的重要组成部分,直接决定了下单的成功与否。其性能与稳定性至关重要,因为它们直接影响整个物流下单系统的运行效率及客户满意度。一个高效且稳定的纯配时效服务能够确保预计送达时间准确无误地展示给用户,从而提升客户体验和信任度。反之,若纯配时效服务出现故障或延迟,可能会导致订单处理延误,甚至影响客户的业务运营。因此,在设计和维护纯配时效服务时,必须确保其具备高可靠性和快速响应能力,以应对各种突发情况,确保物流链条的顺畅运行。

2025-10-29 20:08:31 744

原创 由 Mybatis 源码畅谈软件设计(七):从根上理解 Mybatis 一级缓存

*** 部门名称*//*** 部门电话*//*** 部门成员*/DepartmentMapper.xml,两条 SQL:一条根据 ID 查询;一条清除缓存,标记了fulshCache标签,将其设置为 true 后,只要语句被调用,都会将本地缓存和二级缓存清空(默认值为 false)</select></select></select>一级缓存基于SqlSession,不同SqlSession间不共享一级缓存一级缓存被保存在的中,本质上是HashMap执行。

2025-10-29 20:07:24 885

原创 由 Mybatis 源码畅谈软件设计(四):动态 SQL 执行流程

本节我们探究动态 SQL 的执行流程,由于在前一节我们已经对各个组件进行了详细介绍,所以本节不再赘述相关内容,在本节中主要强调静态 SQL 和动态 SQL 执行的不同之处。在这个过程中,SqlNode相关实现值得关注,它为动态 SQL 标签都定义了专用实现类,遵循单一职责的原则,并且应用了。最后,我们还会讨论动态 SQL 避免注入的解决方案,它是在 Mybatis 中不可略过的一环。

2025-10-29 20:05:58 707

原创 EasyExcel碰到问题记录

默认情况下,EasyExcel 会在磁盘上创建一个缓存文件,然后将数据写入这个缓存文件,最后再将缓存文件写入到 Excel 文件中。生成表格列比较多,制定特定的宽度会让表格很长,即使单元格内容一个字,也会很宽,不是很友好,可以通过设置sheet的自适应宽度来设置。Easyexcel使用中,生成多行表头模版时,同一行如果多个列内容一样,会被自动合并单元格,要避免这个问题,需要通过特殊处理。:内存模式下,所有的数据都会被加载到内存中,这可能会导致内存溢出问题,特别是当你处理大型数据集时。

2025-10-28 17:04:39 408

原创 递归算法实践--到仓合单助力京东物流提效增收

难点:将根据SKU分堆之后剩下的采购单分别加到不同的分堆中,这个方案也是思考了好久之后想到的,然后构造成递归进行计算,最终进行去重;性能:递归算法中大部分计算都是重复的,但是经过记录中间计算结果,将计算过的采购单集合直接剪枝,计算时间就不会随着采购单的数量增长而指数增长,真实情况也是随着单据数量的增加、SKU和等级的种类增多依然健壮;

2025-10-28 17:04:09 628

原创 研发排查问题的利器:一款方法调用栈跟踪工具

在系统值班时,经常会有人拿着报错截图前来咨询,作为值班研发,我们则需要获取尽可能多的信息,帮助我们分析报错场景,便于排查识别问题。例如,下图就是一个常见的的报错信息截图示例。从图中,我们可以初步获取到一些信息:•菜单名称:变更单下架,我们这是变更单下架操作时的一个报错提醒。•报错信息:序列号状态为离库状态,请检查。•其他辅助信息:例如用户扫描或输入的86开头编码,SKU、商品名称、储位等。这时会有一些常见的排查思路:1、根据提示,将用户输入的86编码,按照提示文案去检查用户数据,即作为序列号编码,去看一下序

2025-10-27 17:07:33 900

原创 JDD Oxygen智能零售论坛 | 《大模型时代的广告营销变革与实践》

其实现在整个行业的大模型,已经走过了 “从零散能力到系统能力” 的关键阶段,从过去几年的大模型发展历程来看,尤其是从22年以对话式大模型发布以来,业内的日常对话式的大模型不论是基础模型还是领域精调的模型都日益成熟,甚至是实现了局部的“跨学科整合”。现在的大模型不再只懂 “单一技能”,像经验中学习、数学逻辑推理,甚至文本图像创作、代码编写、日常对话这些单个领域,都已经发展得比较成熟了 —— 这就好比以前是 “专才”,现在变成了 “全才”,但能不能能应对广告营销里从策略到执行的多环节需求,依然存在不小的挑战。

2025-10-27 17:03:57 670

原创 常用Web 实时通信技术:原理+选型,一篇通关

WebSocket 的工作流程分为。

2025-10-27 17:01:32 754

原创 GEO-AI时代的新战场

GEO(Generative Engine Optimization,生成式引擎优化)是 2025 年兴起的新一代数字营销技术,核心目标是通过系统化策略提升内容在生成式 AI 搜索引擎(如 ChatGPT、豆包、DeepSeek 等)中的可见性和权威性,确保品牌信息在 AI 生成的回答中被优先引用。与传统 SEO(搜索引擎优化)不同,GEO 直接针对 AI 的语义理解、知识抽取和内容生成逻辑进行优化,是 AI 时代流量入口争夺的核心战场,并非 SEO 的替代品,而是 AI 浪潮下内容优化的升级形态。

2025-10-21 13:31:38 1101

原创 详解ROMA中复杂图表的渲染实现

通过此次图表的重构,在App冷启时,以 iPhoneXS Max 设备为例,首页首屏渲染图表数据的时间平均缩短了200ms;冷启首页首屏图表的渲染成功率,由之前的平均90%提升至接近100%;非首页首屏的图表渲染几乎零延迟;对于异常情况导致的环境初始化失败的问题,也在接受渲染指令时自检渲染环境并重启环境初始化,自动恢复数据的渲染。如果你也对图表渲染或者对跨端框架 ROMA 感兴趣,可留言交流。

2025-10-21 13:30:38 998

原创 前端部署新方案-技术篇(总体架构设计)

集团前端部署平台是由京东科技前端工委会牵头,联合京东零售、京东健康等8个C-1部门历时6个月共同研发的统一部署解决方案。平台核心提供快捷模式(PC/H5资源一键部署),致力于为前端研发提供高效、便捷的部署新体验。

2025-10-21 13:29:10 811

原创 探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

生成式推荐在2025年迎来爆发并非偶然,而是LLM技术成熟度与推荐工业场景需求共振的结果。1、LLM生态成熟•分布式训练框架,通过数据并行、模型并行和流水线并行策略,结合混合精度训练、梯度累积等优化技术,显著缩短了模型训练周期。同时,融合监督微调(Supervised Fine-Tuning,SFT)与人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)技术栈,有效提升了模型与复杂业务目标(如点击、转化)的对齐能力。•推理性能优化。

2025-10-20 16:16:45 1121

原创 把算法焊死在模型上系列-后端眼中的RAG平台架构

作者:京东科技 管顺利。

2025-10-20 16:10:45 821 2

原创 Hudi系列:表类型(Table & Query Types)

四. 表类型四、简介Hudi 表类型定义了数据的存储方式以及如何在表上执行写入操作(即如何写入数据)。反过来,查询类型定义了如何将底层数据暴露给查询(即如何读取数据)。Hudi 引入了以下目前已在业界广泛使用的表类型,根据实际情况权衡取舍。Copy On Write :Merge On Read:读取时合并 (MoR) 表类型通过使用定期压缩将轻量级日志文件与基础文件合并,从而平衡写入和读取性能。

2025-10-17 11:44:55 592

原创 Hudi系列:Hudi核心概念之索引(Indexs)

简介Hudi 中最基础的索引机制会一致地跟踪从给定键(记录键 + 可选分区路径)到文件 ID 的映射。其他类型的索引(如二级索引)都以此为基础构建。一旦将记录的第一个版本写入文件组,记录键和文件组/文件 ID 之间的映射就很少会发生变化。只有以删除 + 插入形式实现的集群或跨分区更新才会将记录键重新映射到不同的文件组。即便如此,给定的记录键在时间线上的任何完成时刻都只与一个文件组相关联。对比其它(Hive)没有索引的区别。

2025-10-17 11:43:33 735

原创 图解AI核心技术:大模型、RAG、智能体、MCP

本文整理了来自Daily Dose of Data Science最热门或最新的文章,其中极具特色的动图以生动形象的方式,帮助我们更好的理解AI中的一些核心技术,希望能够帮助大家更好的理解和使用AI。

2025-10-16 19:25:37 845

原创 Hudi系列:Hudi核心概念之时间轴(TimeLine)

Hudi的核心是维护在不同时刻(Instant)在表上执行的所有操作的时间轴,提供表的即时视图,同时还有效地支持按时间顺序检索数据。hudi保证在时间线上的操作都是基于即时时间的,两者的时间保持一致并且是原子性的,以下是有效的操作类型。▪1.3 时间线上的Instant action操作类型。1.3 时间线上的Instant action操作类型。▪1.1 时间轴(TimeLine)概念。▪1.4 时间线上State状态类型。▪4.3 总结了两种表类型之间的权衡。▪1.2 Hudi的时间线由组成。

2025-10-14 15:57:03 426

原创 Hudi系列:Hudi核心概念之文件布局(Storage Layouts)

•每个切片包含一个基本文件 (parquet/orc/hfile)(由配置 - hoodie.table.base.file.format 定义),由在特定时刻完成的提交写入,以及一组日志文件 (.log.),由在下一个基本文件请求时刻之前完成的提交写入。日志文件包含不同的块(数据、命令、删除块等),这些块对基础文件的特定更改进行编码。•Hudi 采用多版本并发控制 (MVCC),其中压缩操作合并日志和基本文件以生成新的文件切片,清理操作删除未使用/较旧的文件切片以回收文件系统上的空间。

2025-10-14 15:56:04 355

原创 浅析cef在win和mac上的适配

通常来说,若应用程序中,同时存在多个cef版本,比如89,106等,主要是主版本号不同,则直接判断CEF_VERSION_MAJOR的数值即可,另外的三个小版本可以不做过多关注,若大版本相同,则需要进行小版本的详细区分。使用cef在win和mac上用的同一套文件,利用Qt的宏定义对平台进行了区分,利用cef版本对不同版本进行兼容,因此同样的源代码文件,在两个平台都可以运行,不同的cef版本也可以同时运行,比较方便维护升级。以上的路径,都需要明确指定绝对路径,即完整的访问路径资源,不能使用相对路径,比如…

2025-10-14 15:55:02 600

转载 京东云上线统信云主机OS!订阅式正版授权,云上国产化再添重磅选择

即日起,预装正版授权的统信服务器操作系统镜像正式登陆京东云云主机官方镜像,以灵活的订阅式服务,为企业用户提供更丰富、更便捷的云上国产化选择,全面覆盖x86、ARM等多种芯片架构。京东云始终秉持“开放、共生、共赢”的生态理念,致力于为客户提供安全、稳定、高效的云计算基础设施,将持续深化与国产软硬件伙伴的战略合作,共同构建更加成熟、自主、创新的云上信创生态,助力千行百业实现数字化转型的自主可控与长期共赢。统信 UOS镜像的上线,进一步丰富了京东云在信创领域的解决方案矩阵。扫一扫 ,了解更多云主机国产化能力。

2025-09-29 13:50:39 87

原创 递归算法实践--到仓合单助力京东物流提效增收

京东物流到仓业务「」为了减少商家按照京东采购单分货备货过程,对齐行业直接按照流向交接,提升商家满意度;」揽收操作APP提效;到仓合单功能应运而生;

2025-09-28 18:18:41 378

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除