• 博客(1339)
  • 收藏
  • 关注

原创 淘系技术,实力为2019年双11而战!稳!

今年,双11走到了第11个年头,史无前例的,阿里经济体内有49支技术团队共同参与作战,也是第一次,双11的核心系统将100%跑在云上,这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴(汤兴)说的“「善战者,无智名,无勇功」,这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀,一个字 “稳”!年年双11,回回新玩法,“在吗,盖楼吗?”成为了好友聊天的日常,每天蹲...

2019-11-12 00:38:06 22407 7

原创 虚拟线程/有栈协程对于Java的意义

但是 java 的虚拟线程并不是完美的,假设有某种场景,使得虚拟线程挂载在载体线程上,而无法卸载(称之为pin),而此时,虚拟线程调用了阻塞IO被阻塞,那么载体线程也将会被阻塞。后来随着多核技术的兴起,Linux 也提供了多线程的能力,这时“绿色”线程的劣势就暴露出来了,它本质上还是只能使用操作系统的单核进行并发,无法充分利用多核进行并行操作,并且所有的线程阻塞、调度逻辑都需要由 java 实现,而不能使用操作系统的能力。同理,在协程中,关键问题就在于怎么存储、恢复、切换协程的上下文。

2025-04-02 16:45:02 932

原创 音频生成技术探索与淘宝域实践

在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。此外,收集的数据质量对于最终合成语音的效果有着决定性的影响,优质的训练数据对于模型的效果至关重要。但是,随着规模的增大数据集的质量也出现了一定程度的下降,数据集中出现了噪音、多人对话的音频。这样的交叉验证进一步保障了转录文本的准确性。

2025-03-31 19:20:39 743

原创 淘宝客户端动态化页面搭建

而且由于需要携带的信息变多,协议包大小也会有所增加。业务可以通过LifecycleManager.registerLifecycle注册页面的生命周期监听器,对外暴露的生命周期包括系统生命周期(Android onCreate/onDestroy,iOS didAppear/disAppear等),以及自定义的一些页面生命周期切面,比如网络请求、数据处理、预加载等切面。虽然页面整体布局方式大致一致,但是各个版本之间的代码基本是割裂的,如果需要升级协议,每次的工作量都是巨大,而且切流过程也是比较复杂。

2025-03-28 15:07:19 1045

原创 技术人的大模型应用初学指南

基于已有开源大模型进行微调训练,如果采用预训练的方式对模型的所有参数都进行训练微调,由于现有的开源模型参数量都十分巨大,如最新千问72B模型(qwen/Qwen1.5-72B-Chat)有720亿参数,对所有的参数都进行处理,那GPU资源成本会非常高,可能高达数百万每年,为了解决这个问题,社区提出了大模型微调的概念:PEFT (Parameter-Efficient Fine-Tuning),即对开源预训练模型的所有参数中的一小部分参数进行训练微调,最后输出的结果和全参数微调训练的效果接近。

2025-03-26 15:30:40 901

原创 AI赋能:大模型创新的模板生成与内容填充

在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。图3-3展示给定一个非表格类模板,以及两个充电宝的商品信息,模型首先会对提供的 HTML 模板进行分析,从给定的商品信息中提取模板填充所需要的素材(标题、副标题、段落标题和正文)等,然后进行准确的、自适应的内容填写。

2025-03-17 15:27:50 423

原创 淘宝直播AI提效探索的一些心得

这个案例取自服务端代码生成项目上,其实内部的aone copilot在通用任务上做的非常好用了,官方统计的采纳率也达到了25%,是个非常不错的code copilot的产品,但是对于业务侧的开发来说,这类copilot生成的代码,属于基础实现代码,因为不太能很好的结合当前业务下沉淀的服务、方法来做代码生成,因此我们需要把这部分所谓的服务、方法、工具等接口信息和使用case给到LLM,它才能结合这样的context去做最终代码的生成;随着你继续预测更多的词,这些小比例的错误会累积起来,出错的可能性也会增加。

2025-03-14 14:50:06 966

原创 多模态自动布局技术发展及其在淘内内容场的应用

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...

2025-03-12 15:27:05 628

原创 MLLM在电商域互动内容生产的实践

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...

2025-03-07 16:20:32 745

原创 大模型时代的视频动静态封面生产方案及业务实践

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

2025-03-05 16:36:29 916

原创 淘宝全新图生视频大模型“淘宝法象”,助力商家降本增效

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

2025-03-03 15:26:54 1201

原创 大模型时代的内容分析Agent解决方案与业务实践

一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AI...

2025-02-28 18:41:08 682

原创 视频级虚拟试衣技术在淘宝的产品化实践

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...

2025-02-26 18:14:06 1148

原创 多模态人物视频驱动技术回顾与业务应用

一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AI...

2025-02-24 18:00:01 1008

原创 【首度揭秘】淘宝2025春晚云参演证背后的AIGC技术

随着人工智能技术的飞速发展,AIGC(生成式人工智能)逐渐走入大众视野。在2025年央视春晚这一国民级舞台上,一项基于AIGC的创新互动玩法——“春晚云参演证”应运而生。用户只需上传个人照片,即可通过AI换脸技术融入九大类春晚经典节目场景(如主持、歌舞、相声等),实现“一键智能换脸+场景沉浸式角色扮演”的全新体验。这项技术不仅打破了专业演出的壁垒,让普通观众瞬间化身为“AI数字演员”,还通过零门槛...

2025-02-21 16:23:49 545

原创 探索淘宝购物车SurfaceView闪黑的解决方案

如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。我们希望通过混合架构(Native 业务容器 + Weex 2.0)作为未来交易终端架构的重要演进方向,在 Native 容器侧充分发挥原生语言的性能优势、常驻 App 的调控与管控能力、手势识别与交互优势来解决体验问题。本专题《淘宝交易终端架构探索》是我们摸索出的部...

2025-02-14 17:44:27 909

原创 淘宝订单列表Fragment转场动画卡顿解决方案

如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。我们希望通过混合架构(Native 业务容器 + Weex 2.0)作为未来交易终端架构的重要演进方向,在 Native 容器侧充分发挥原生语言的性能优势、常驻 App 的调控与管控能力、手势识别与交互优势来解决体验问题。本专题《淘宝交易终端架构探索》是我们摸索出的部...

2025-02-12 17:02:41 998

原创 淘宝App交易链路终端混合场景体验探索

如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。我们希望通过混合架构(Native 业务容器 + Weex 2.0)作为未来交易终端架构的重要演进方向,在 Native 容器侧充分发挥原生语言的性能优势、常驻 App 的调控与管控能力、手势识别与交互优势来解决体验问题。本专题《淘宝交易终端架构探索》是我们摸索出的部...

2025-02-10 18:09:13 788

原创 高质量编写非功能性代码的一些实践

本文围绕软件开发中的非功能性质量交付展开讨论,强调了在编码实践中容易被忽视的非功能性需求的重要性。文章指出,非功能性质量(如可维护性、可靠性等)往往因缺乏明确的需求定义和约束机制而难以保证,且其交付水平受个体能力影响较大。为提升非功能性质量,作者以Java语言为例,详细分析了几对相关概念或实践,并提供了具体建议。写在前面软件的质量包含功能性、性能、可靠性、可维护性、可移植性等等。工程师产出的代码,...

2025-02-07 16:58:49 1018

原创 淘天业务技术2024年度热门文章盘点

1. Agent调研--19类Agent框架对比本文主要探讨了19类Agent框架的对比,介绍了单智能体和多智能体框架的特点与应用,详细分析了几种主流的Agent框架,分别从任务规划、模型选择、执行任务等方面进行了阐述;最后分享了多智能体系统的优点和挑战。阅读全文2. AI助手:淘宝交易研发效率提升50%本文介绍了AI助理在提升交易系统研发效率中的应用。通过智能日志分析、自动化测试数据生成和经验沉...

2025-02-05 17:24:15 976

原创 MktAI助理:数据与AI结合的营销效率提升利器

在当今数据驱动的营销环境中,如何高效地处理和分析海量数据成为了一个关键挑战。传统的“写SQL——刷数据——搭看板”模式不仅耗时费力,还可能导致业务同学面临找数难、查询慢等问题。为了解决这些痛点,我们团队研发了MktAI助理,旨在通过结合DATA+AI技术,提升营销数据的处理效率和洞察质量。本文将详细介绍MktAI助理的研发背景、底层能力及具体实践案例,展示其如何助力业务同学实现更高效的自助查询和分...

2025-01-24 18:02:21 1046

转载 2025 AI展望:Scaling Law新叙事加速AI变革

我们正身处一场技术革命的历史开端,以 ChatGPT 为标志的这轮 AI 科技浪潮是算法和软件诞生以来人类科技最重要的技术变革,由此开启了以智能为核心的第四次工业革命。这次 AI 变革是由以 Scaling Law 为底层逻辑的基础模型驱动,其整体的发展脉络由基础模型的技术逻辑主导。进入 2025 年,我们清晰地看到,Scaling Law本身仍然成立,但以堆算力以及一味追求扩大模型尺寸的迭代路径...

2025-01-22 21:56:49 357

原创 代码优化实战:圈复杂度治理之函数抽离技巧

在软件开发过程中,代码的复杂度直接影响到程序的质量、可测试性和维护性。本文深入探讨了圈复杂度治理方法,并结合实际案例详细介绍了如何通过函数抽离来降低代码复杂度。通过这些实践技巧,开发者可以更有效地提升代码质量,实现更加优雅和可维护的代码结构。圈复杂度▐ 是什么衡量代码复杂度的标准,表示完全覆盖代码所需测试的最少次数。▐ 为什么圈复杂度越大说明程序代码可能质量低且难于测试和维护。▐怎么做ID...

2025-01-20 20:56:01 1013

原创 架构思考与实践:从通用到场景的转变

在当今复杂多变的商业环境中,企业架构的设计与优化成为了一个关键议题。本文通过一系列随笔,探讨了业务架构的价值、从通用架构到场景架构的转变、恰如其分的架构设计以及如何避免盲目低效等问题。通过对多个实际案例的分析,笔者揭示了架构设计不仅仅是技术问题,更是对企业现状和未来发展的深度理解与把握。本文适合希望深入了解业务架构及其实践意义的读者阅读。价值理解:(业务)架构的价值当我们需要了解一个人时,需要“察...

2025-01-17 18:06:16 1043

原创 AI驱动全端开发:淘宝信息流效率提升的探索

2023年,在淘宝App部分购后场景,我们将运行多年的Native信息流切换为Weex信息流。如今面对这个多达四套以上代码的业务,我们是如何解决不同端之间开发和协同效率的棘手问题呢?前言购后是指用户在淘宝支付成功后进入的订单列表、订单详情等多个履约服务页面,而购后信息流即指这些页面中的商品推荐信息流。经过一年的代码迁移和性能优化,购后信息流Weex版本在手机淘宝的各种场景中表现出色,让用户能够更快...

2025-01-15 21:36:05 1201

转载 营销大促会场视觉改版体验优化

营销会场一直是大促活动的标志性产品,伴随大家走过了每一个“双11”、“618”;如今淘宝的活动更加丰富频繁,我们也一直在为会场这个成熟的产品持续做优化升级。部分历史会场截图今年,我们对营销会场做了一些至关重要的优化,分收敛、统一、提效三个阶段逐步实现,解决了诸多历史问题的同时也融入了我们对于会场新的思考。会场设计优化的三个阶段收敛:删繁就简会场是通过模块搭建的方式来实现的,模块会在不同活动中反复使...

2025-01-13 17:08:08 145

原创 AI对研发工作的多维度助力:以聊天室项目为例

在当今快速发展的技术领域,AI 已成为推动项目进展的重要力量。本文以一个聊天室项目的开发为例,详细探讨了 AI 在提升研发效率、赋能研发人员以及解决实际问题方面的多维度助力。从项目的初步构思到最终上线运营,AI 不仅显著缩短了开发周期,还降低了对研发人员技能的要求,使得项目能够顺利推进并成功应对各种挑战。此外,文章还展望了 AI 在未来研发工作中的提升方向,并提出了通过整合研发工具实现整体效率提升...

2025-01-10 21:04:35 982

转载 简化代码模块设计:两种高效编程范式

一次项目包含非常多的流程,有需求拆解,业务建模,项目管理,风险识别,代码模块设计等等,如果我们在每次项目中,都将精力大量放在这些过程的思考上面,那我们剩余的,放在业务上思考的精力和时间就会大大减少;这也是为什么我们要 总结经验/方法论/范式 的原因;这篇文章旨在建立代码模块设计上的思路,给出了两种非常常用的设计范式,减少未来在这一块的精力开销。领域模型驱动的代码范式领域模型驱动的代码范式,是围绕着...

2025-01-08 21:32:13 147

原创 Java21特性解读

当前JDK的版本已经到了23了,不过最近的LTS版本是21,刚好最近准备把直播侧serverless应用的JVM环境升级到java21(目前是11),在升级前对21的特性做一个简单的了解和熟悉,下面是个人熟悉过程中的笔记,大家可以按照每一节特性中的代码自己在本地run下,可以更快地做个了解。JDK的版本其实最近几年开始,已经是6个月一个版本了,LTS版本大概差不多间隔4-6个版本(不定),每次升级...

2025-01-06 21:22:25 1184

原创 一种可复用的AI提效方案:AI点灯

在当今飞速发展的时代,AI技术正不断渗透到我们生活的各个层面,深刻改变着传统的工作方式和生活模式。面对这一重大变革,我们不能被动观望或抗拒,而应积极拥抱AI,将其作为成长的助力。只有与AI协同发展,才能在这场技术革新的浪潮中立于不败之地,顺势而为才能事半功倍。大模型的典型特征强项:1. 自然语言理解与生成2. 广泛的知识覆盖3. 高效的文本处理4. 学习与适应5. 计算能力强弱项:1. 理解与推理...

2025-01-03 17:20:58 1387

原创 淘宝获2024年度CCF技术发明一等奖

2024年9月28日,中国计算机学会2024年度“CCF科技成果奖”评选结果公布。淘宝联合中国科学院计算技术研究所、中国科学院计算机网络信息中心申报的《面向大规模互联网服务的协同传输关键技术及应用》获得“CCF技术发明一等奖”。获奖公示链接:https://www.ccf.org.cn/Awards/Awards/2024-09-29/830336.shtml本项目面向大规模互联网服务,研制了应用...

2024-12-31 14:01:03 290

转载 淘宝内容AI团队2024年8篇论文总结

我们是淘天业务技术内容AI团队,负责运用最新的生成式AI能力,挖掘淘宝核心用户场景(首页信息流、搜索、用增、消息等)的用户痛点问题,通过AIGC内容生成、智能交互等方式,改善用户购物体验,降低平台&商家经营门槛。团队主要研究可控内容生成、多模态大模型、人格化Agent等技术域,在图像生成、视频生成、多模态大模型等前沿技术领域有广泛的布局,并在巨浪、信息流、搜索等淘天核心内容业务场景进行深入...

2024-12-30 19:02:43 425

转载 淘宝天猫集团荣获2024中国运筹学会“运筹应用奖”提名

淘天集团自营事业部算法团队与浙大合作研发供应链优化决策引擎荣获中国运筹学会“运筹应用奖”提名。在刚刚结束的第九届中国运筹学会上,淘天集团自营事业部算法团队与浙大管理学院教授合作的项目《电商供应链运营优化决策支持系统研发与实施》荣获该学会科学技术奖“运筹应用奖”提名荣誉。中国运筹学会科学技术奖“运筹应用奖”是国内运筹学学界最具代表性的应用奖,每两年评选一次,旨在激励我国运筹学的应用与实践活动的开展,...

2024-12-27 21:16:05 95

原创 消息中间件稳定性建设之SLA浅述

最近参与了部门消息服务的架构升级和稳定性保障,以此文简单总结下当建设和负责维护中间件稳定性时必备的SLA基础知识,一并调研了目前国内外商业化的云消息中间件产品SLA相关情况,最后附上个人在维护消息中间件和支持不同业务场景时的一些通用性粗浅思考,有不恰当的地方欢迎大家探讨交流。SLA基础概念无论你是一名个人云开发者,正在众多云服务提供商的套餐和支持方案中进行比较和选择;或是作为企业的采购负责人,评估...

2024-12-25 20:41:43 911

原创 Weex购物车长列表横滑操作优化“编年史”

Weex购物车诞生已经一年有余,在长列表的交互优化上花费了不少时间,本篇文章重点回顾一下长列表下横滑操作的优化历程。前情提要横滑交互是一个需要复杂描述的过程, 体验感觉使用文字较难描述,故本文有大量的对比视频,请放心食用。另外先在此列举下基本概念及操作的代称,便于后续描述和理解。代称操作列表一个长的,可以竖向滚动的列表卡片列表里一个个竖向排列的子项横滑手指在卡片上进行的左右滑动操作竖滑手指在列表上...

2024-12-23 20:09:31 1143

原创 AIGC在生鲜领域的落地应用

随着人工智能生成内容(AIGC)技术的快速发展与广泛应用,生鲜电商行业正迎来新的机遇。本文旨在简述2024年AIGC在生鲜领域的实际应用。特别是聚焦于生鲜领域业务,通过文本、图片以及动图等多种表示形式,探索生鲜商品更优质且契合场景需求的表达范式,并简单介绍相应的技术实现方案。背景立足于较为有特色的生鲜行业,为了在竞争激烈的市场中脱颖而出,提高消费者购买欲望,平台需要多种直观且富有吸引力的方式来展示...

2024-12-20 19:31:57 523

原创 低成本增量计算:大数据处理的新趋势

自"三驾马车"伊始, 大数据处理技术已经发展了二十年。在前十年中, Hive+Spark 这套离线处理技术就已经基本完善; 近十年来, Flink的快速发展又有效地解决了实时处理的问题。然而, 低成本的近实时处理依然面临挑战。近来, 随着业界对近实时处理及流批一体架构的需求愈发强烈, 增量计算开始重新被关注。Flink在1.20中推出了MaterializedTable(MT) 来统一流批两种...

2024-12-18 17:47:37 979

原创 内容AI: 目标驱动的图像生成

现有的文生图技术已经较为成熟,Flux、SD 3.5和Midjounery等最先进文生图模型已经可以生成足够“以假乱真”的图像。在淘系内部,现有文生图模型已经被应用于各种需要创意图像的业务,例如 AI 会场等。但是,文生图技术的缺陷在于文本作为控制条件的指导性仍然较弱--例如我们无法仅利用文本生成一个带有“GitHub”样式的包包的营销图(见图1)。图1. 现有文生图模型与本文方案效果展示然...

2024-12-16 18:47:20 911

原创 MyBatis布尔字段映射陷阱全过程解析

在开发过程中,我们常常会遇到一些看似简单却令人困惑的问题。本文记录了一次将 boolean 改为 Boolean 后,MyBatis 插入数据时出现的意外情况。本文不仅逐步揭示了问题的根本原因,还提供了解决方案,并强调了在开发中遵循规范和仔细排查问题的重要性。背景为了实现某个功能,需要为已有的表新增字段,其中有一个字段需要表达的含义是:是否有对话条数。加字段要遵守规范,咱就去看了《阿里巴巴开发规...

2024-12-13 18:25:08 950

原创 JDK11升级后内存问题解析

今年天猫国际技术团队计划从4月份开始先升级并应用JDK11。升级后台系统时一切比较顺利,但升级核心应用时出现了两个意外情况,也是比较典型的问题,这里记录一下。问题一在4月份的非核心应用升级过程中出现的问题有一定的沉淀,此次核心应用升级除了包版本冲突等常规问题,升级过程中一切顺利,预发环境也顺利部署完毕。预发部署一段时间后问题注入。问题表现为预发机器重启完毕后,过一段时间就会出现服务不响应,cpu...

2024-12-11 18:12:00 1311

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除