• 博客(2543)
  • 收藏
  • 关注

原创 大促数据库压力激增,如何一眼定位 SQL 执行来源?

)@Override// ...})@Overridetry {// 1. 找到 StatementHandler(SQL 执行时,StatementHandler 的实际类型为 RoutingStatementHandler)= null) {// 其中 delegate 是实际类型的 StatementHandler (静态代理模式),获取到实际的 StatementHandler。

2025-06-10 11:21:28 156

原创 由 Mybatis 源码畅谈软件设计(九):“能用就行” 其实远远不够

或者为其。

2025-06-10 11:20:19 293

原创 前端开发中依赖包有问题怎么办

作者:屠永涛。

2025-06-10 11:19:15 261

原创 JDK从8升级到21的问题集

第一步:在本地进行编译,提前识别出语法错误、版本冲突及不兼容问题。主要有以下几种场景:Base64:参照【Base64编解码改造】升级版本jsr250、jaxb-runtime、jakarta.annotation-api:参照【注解包冲突典型案例】升级版本升级版本升级版本。

2025-06-06 16:39:39 497

原创 设计模式-策略模式

作者:京东工业 孙磊。

2025-06-06 16:38:45 156

原创 【银河麒麟高级服务器操作系统】正式上线云主机官方镜像

为此,京东云与国产操作系统领军品牌麒麟软件达成深度合作,双方已完成银河麒麟高级服务器操作系统与京东云平台在海光、鲲鹏、Intel、AMD等多款x86、arm处理器的适配认证,基于此,京东云正式推出。京东云此次上线的银河麒麟操作系统镜像,改变了云上使用商业化操作系统授权的采购模式,只需在购买云主机时一键选择银河麒麟高级服务器操作系统镜像,即可自动完成授权绑定,真正实现“开箱即用”。,以订阅式服务模式,为企业提供更灵活、更便捷的云上国产化解决方案,目前该镜像已上线至官方镜像,并在全地域发布。

2025-06-06 16:37:51 334

原创 做「长期主义者」的技术人们

近年来,传统的深度稀疏模型已经进入瓶颈,稀疏大模型是成为新的技术升级方向,但概率预估与生成式模型的差异,以及工业级的高请求、低延迟要求,使升级充满挑战。Taro 是由京东发起的开放式跨端跨框架解决方案,支持以 Web 的开发范式来实现小程序、H5、原生 APP 的跨端统一开发,从18年开源至今,在 GitHub 已累计获得 36,000+ Stars。2、在技术工作的初期,我往往会从一个个具体的问题点切入,比如优化某个算法的性能、解决特定的技术难题等。在技术发展的浪潮中,有人辗转风口,有人深耕沉淀。

2025-06-03 16:58:08 649

原创 Taro on Harmony C-API 版本正式开源

Taro on Harmony C-API 版本经历了京东鸿蒙 APP 的实践,综合性能、生态以及开发体验来讲,毫无疑问已经成为了开发鸿蒙应用的最佳框架选型之一。当下,我们也仍然在不断完善着鸿蒙的适配方案,基于当前的 Taro on Harmony C-API 方案,我们会进行多线程的架构升级以及 React 的 C++ 化,进一步提升 Taro 在鸿蒙端侧的性能,并极大地降低应用的丢帧率,整体进展也已经处于验证和测试阶段。

2025-06-03 16:56:47 721

原创 解剖DeepSeek四把刀,一场深到源码,大到行业,细到人心的手术盛宴

在这个算力与算法疯狂博弈的时代,DeepSeek就像一剂强效兴奋剂,能让追赶者瞬间爆发,却有可能治不好核心技术的贫血症,下一个十年AI王座的归属,恐怕要看谁能再这条钢索上走出最精妙的平衡。反观OpenAi彻底闭源的API模式,DeepSeek这招即赚了口碑,又卡住了技术咽喉。第三刀:刺穿精度幻象,在数学推理测实际上,DeepSeek-R1确实追评了GPT-3,但当用医疗影像诊断任务实测时,FP8精度导致的梯度消失问题暴露无疑:例如模型可能会把0.8cm的肿瘤误判为0.1cm,这种误差在现实场景中足以致命。

2025-06-03 16:54:32 373

转载 做「长期主义者」的技术人们

近年来,传统的深度稀疏模型已经进入瓶颈,稀疏大模型是成为新的技术升级方向,但概率预估与生成式模型的差异,以及工业级的高请求、低延迟要求,使升级充满挑战。Taro 是由京东发起的开放式跨端跨框架解决方案,支持以 Web 的开发范式来实现小程序、H5、原生 APP 的跨端统一开发,从18年开源至今,在 GitHub 已累计获得 36,000+ Stars。2、在技术工作的初期,我往往会从一个个具体的问题点切入,比如优化某个算法的性能、解决特定的技术难题等。1、在技术实践中,“简单”往往是最难实现的。

2025-05-29 10:22:19 176

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 179

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 85

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 140

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 88

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 50

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 114

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 68

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 19

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 79

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 125

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

该方法在选择性移除不太重要的tokens的同时,保留了最有信息量的tokens,即使在移除大量数据的情况下,也能提升模型性能。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。通过上述实验,不仅确认了“沙漏”效应的存在,还阐明了其对模型性能的具体影响,从而为未来的优化提供了坚实的基础。

2025-05-28 16:15:39 57

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 34

转载 EMNLP 2024 | 突破RQ-SID“沙漏“瓶颈,提高生成式搜推上限

基于此,我们对该现象进行了深入的理论与实验分析,并提出了相应的解决方案。解决沙漏现象的方法有多种,在此简单的从分布角度提出两种简单易行的方法:一种启发式的方法是直接移除第二层,从而消除长尾效应的影响。需要注意的是,这里首先要生成一个L层的语义ID(SID),然后再移除第二层,这与直接生成一个两层的SID不同,因为后者可能仍然存在大的路由节点。然而,当交换后给定第一个标记时,输出任务变为预测第二或第三层的SID,这使得任务变得更简单,并且长尾分布不再影响结果(因为给定了真实的SID1),因此效果显著提升。

2025-05-28 16:15:39 10

原创 供应链计划性能优化解决方案-Clickhouse本地Join

作者:京东零售 姜波。

2025-05-27 14:31:35 602

原创 架构提效的矛盾和矛盾的主要方面

他深知自己作为新人,在这方面还有所欠缺,因此,他决定采取一个他认为更为“高效”的方法:在某个关键位置添加一个临时的标志位(flag),然后在所有需要改动的地方都加上if判断,以确保新特性能够按时上线,同时尽量减少对现有系统的影响。到此,我们介绍了架构提效中的稳定、性能和代码这三个主要的方面,限于篇幅和架构本身的实践性,还需要我们在架构提效上进行持续的优化。当然架构也有自身的矛盾统一,在架构提效上,系统的运行正常和问题频出是一对矛盾,功能的快和慢是一对矛盾,工程的整洁有序和无序是一对矛盾。

2025-05-27 14:29:43 885

原创 业务监控—一站式搭建jmeter+telegraf+influxdb+Grafana看板

这个jar包的JVM指标如何?jar包的火焰图是什么样的?对此,只能望洋兴叹。基于以上背景,对jar监控做了一些调研和实战。是一个由InfluxData开发的开源时序型数据库。它由Go语言写成,着力于高性能地查询与存储时序数据。InfluxDB被广泛应用于存储系统的监控数据,IoT行业的实时数据等场景。Influxdb有如下三大特性•基于时间序列•可度量性•基于事件相应的,我们也可以使用prometheus。

2025-05-27 14:25:37 862

原创 Java的SPI机制详解

SPI(Service Provicer Interface)是Java语言提供的一种接口发现机制,用来实现接口和接口实现的解耦。简单来说,就是系统只需要定义接口规范以及可以发现接口实现的机制,而不需要实现接口。SPI机制在Java中应用广泛。例如:JDBC中的数据库连接驱动使用SPI机制,只定义了数据库连接接口的规范,而具体实现由各大数据库厂商实现,不同数据库的实现不同,我们常用的mysql的驱动也实现了其接口规范,通过这种方式,JDBC数据库连接可以适配不同的数据库。

2025-05-26 15:53:30 535

原创 在零售技术做AI的95后:我们这样搞定技术难题

虽然应用的算法有差异,但是同为深度学习相关任务,提升模型性能时的优化思路、训练技巧乃至模块实现方式都有很多共通之处,其技术迭代的方向和角度,也往往能带给我很多启发,跨领域的知识迁移,往往能碰撞出意想不到的创新火花。面对快速变化的时代和复杂的业务,我会主动追踪前沿进展,跟进顶会、开源社区的动态,保持对领域趋势的敏锐性,同时提升的跨领域技能与知识,深入理解用户需求与市场趋势,结合算法能力提供真正有商业价值的方案,掌握良好的代码工程实践、持续集成和自动化部署,提高算法从实验到生产的效率。来替代单一奖励大模型呢?

2025-05-26 15:51:25 651

原创 简述大前端技术栈的网络原理

•。

2025-05-26 15:49:13 839

原创 从校园实验室到京东零售:一位算法工程师的风控实战录

面对流量洪峰、以及洪峰中涌现的虚假流量,我曾引以为傲且平稳调度的模型出现了资源和作弊识别之间的掣肘,实验室里的“完美指标”、优秀的“AUC、TPR、FPR”,在海量流量面前凸显苍白,工业界需要的是能在混沌中能持续进化的解决方案。为了解决这个“既要精准又要快速”的难题,我采用了蒸馏技术:让大模型担任”资深教授”,小模型作为“尖子生”,通过特征层蒸馏,将大模型的“办案经验”提炼传授给小模型,经过十余个版本的迭代打磨,最终实现了精度与速度的完美平衡。这种平衡不仅需要对技术有深刻的理解,还需要对业务有深入的洞察。

2025-05-22 16:26:54 745

原创 提高IT运维效率,深度解读京东云基于自然语言处理的运维日志异常检测AIOps落地实践

利用京东内部历年大促场景的数据积累,对算法进行不断的优化训练,在监控、数据库、网络、资源调度等多个纵向场景取得突破,可移植性强,自研通用化智能基线算法学件10+,自研通用化异常检测算法学件10+,场景化异常检测算法方案5+,具备多种自研通用化根因定位算法学件,可以自动触发多维实时根因定位 ,从上万维度属性值中定位到根因维度,自研5种以上增量式学习模板提取与相关分析算法学件,运维知识图谱内涵盖节点30W+,以应用为中心向外延伸出的图谱关系达90W+,赋能根因分析快速精准查询调用。学习速度设定为2e4。

2025-05-22 16:25:55 782

原创 提高IT运维效率,深度解读京东云AIOps落地实践(异常检测篇)

作者:京东科技 张静时间序列的异常检测是实际应用中的一个关键问题,尤其是在 IT 行业。我们没有采用传统的基于阈值的方法来实现异常检测,而是通过深度学习提出了一种无阈值方法:基于 LSTM 网络的基线(一个 LSTM 框架辅助几个优化步骤)和无监督检测(神经网络和多种机器学习算法的组合)协同综合分析时间序列。当时间序列显示出清晰的周期性形态的情况下基线表现良好,而无监督检测在效率要求高且周期性不太清晰的情况下表现出色。通过两个并行模块的互补设计,可以在不依赖阈值设定和调整的情况下实现无阈值异常检测。京东云内

2025-05-22 16:17:24 1105

转载 从清华实验室到京东零售技术:一位算法工程师的风控实战录

面对流量洪峰、以及洪峰中涌现的虚假流量,我曾引以为傲且平稳调度的模型出现了资源和作弊识别之间的掣肘,实验室里的“完美指标”、优秀的“AUC、TPR、FPR”,在海量流量面前凸显苍白,工业界需要的是能在混沌中能持续进化的解决方案。为了解决这个“既要精准又要快速”的难题,我采用了蒸馏技术:让大模型担任”资深教授”,小模型作为“尖子生”,通过特征层蒸馏,将大模型的“办案经验”提炼传授给小模型,经过十余个版本的迭代打磨,最终实现了精度与速度的完美平衡。最终,产出价值体现在误判率的降低和业务损失的减少上。

2025-05-22 15:53:08 80

原创 代码革命的先锋:aiXcoder-7B模型介绍

在科技的璀璨星河中,每一次技术的突破都如同新星的诞生,照亮了未来的无限可能。随着代码大模型的能力日益增强,它们在解决复杂编程问题上的卓越表现,不仅在提高软件开发的效率和质量上发挥着重要作用,在推动编程自动化的浪潮中扮演着关键角色,更激发了程序员们的创新潜能,让他们能够将更多的精力投入到探索和创造中。aiXcoder-7B模型的出现,预示着软件开发领域将迎来一场新的革命。随着技术的不断进步,aiXcoder-7B将成为软件开发领域中的“新质生产力”,帮助企业实现智能化开发,推动技术行业的生态发展。

2025-05-20 14:25:31 783

原创 大型前端应用如何做系统融合?

A平台与B平台同属于同一系统链路上,前者主要致力于为用户提供注册入驻服务,后者则专注于提供具体业务操作服务。两者皆为运营人员所依赖的在线管理工具。在经历了为期两个月的紧张工作后,我们成功地将两个大型项目进行了深度整合,取得了显著的阶段性成果。通过这一融合过程,我们不仅统一了项目的代码规范和架构,还显著提升了组件的复用率。尽管在这个过程中我们遇到了诸多挑战和曲折,但最终的成果——用户体验的显著提升——使一切努力都显得弥足珍贵。我们深知,每一个成功的项目背后都有无数次的尝试和优化。

2025-05-20 14:23:31 549

原创 大厂B端/G端数据可视化项目如何做设计评审

根据自己多年的B端/G端数据可视化项目设计经验,总结了这篇数据可视化项目如何做设计评审的文章。内容侧重于数据可视化项目,但对于非可视化项目的设计评审也是通用的。文中介绍的流程和方法,尤其是通过STAR法则来阐述自己设计思路的创意,是我在实际工作中一直使用、并受益良多的技巧;文章中也提到了很多只有经过实战打磨才能发掘的一些细节的问题和处理方式,希望所有这些积累和沉淀能给大家带来帮助和启发,期待大家喜欢这篇文章,后续我每月至少更新一篇经验文章,欢迎各位设计小伙伴关注和交流~

2025-05-20 14:21:33 946

原创 缓存之美:从根上理解 ConcurrentHashMap

关键字(保证可见性和禁止指令重排)来保证并发安全,并对节点进行了优化:采用了链表和红黑树的实现,在链表节点数量大于等于 8 且数组(在后文中会称每个元素位置为桶)大小大于等于 64 时会转变为红黑树,在扩容逻辑中,当树节点小于等于 6 时又会转换成链表(删除逻辑中链表转换红黑树的逻辑并不严格按照大小为 6 的阈值),优化空间利用并提高查询效率。:在扩容时,直接指定新表的大小是旧表的两倍(也是 2 的 n 次幂),元素的重新分配变得更加简便,要么元素的位置要么保持不变,要么移动到新位置。

2025-05-19 18:18:21 587

原创 财务合同MCP实践

作者:CHO 李航。

2025-05-12 13:55:07 239

原创 EI与MCP的故事

调用方式不同也需要开发者依赖并适配。至此,一个标准化的通信协议则成为了下一个爆点。

2025-05-12 13:53:13 1042

原创 财务合同MCP实践

随着MCP的普及,能否从业务角度,以MCP化的交互方式让业务简单通过自然语言描述进行对系统的操作,从而带来成本更低更便捷更快的体验。ii. 通过MCP client进行MCP匹配调用-如果不在上文中的合同列表内则大模型会先进行查询确保合同有效。iii. 用户确认后调用合同查询MCP server。ii. 通过MCP client进行MCP匹配调用。iii. 查询结束自动调用延期MCP server。i. question: 请帮我查询待签署的合同。i. 通过自然语言描述我希望延期的合同。

2025-05-07 14:24:23 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除