
百度技术分享
文章平均质量分 93
百度Geek说
这个作者很懒,什么都没留下…
展开
-
百度智能云向量数据库创新和应用实践分享
在大模型时代,数据库与大模型相互成就。我们也看到了很多新的趋势,从底层的 IaaS,模型会从云端扩展到端,PaaS 会从现在纯文本模型扩展到多模态,上层应用会从当前主流的 Copilot 扩展到 Agent,更充分利用大模型的自主决策能力。在向量检索这个场景中,存储的是非结构化数据,业务使用的越广泛,需要存储的数据就越多,因此在架构选型的时候,建议更早的预判到未来的业务增量,提前选择一个长期收益都很大的产品。我们会看到从客户场景角度,需要的是一个专业全面的能力的数据库,不是一个简单的插件可以完成的。转载 2024-09-12 10:06:09 · 401 阅读 · 1 评论 -
代码语言的魅力
本期技术加油站《代码语言的魅力》给大家带来3个部分的内容:浅谈V8 Hidden Classes和Inline Caches;浅析Java逻辑运算与位运算;理解Golang的type func(),希望能为大家的技术提升助力!原创 2022-06-10 15:17:38 · 175 阅读 · 0 评论 -
H.265编码原理入门
本文从 H.265 整体编码流程的角度,介绍了 H.265 编码涉及到的分块、预测、变换、量化、编码、环路滤波等技术点。通过了解这些编码原理,为我们后续进一步学习音视频开发技术奠定扎实的基础。...原创 2022-06-10 10:41:59 · 3212 阅读 · 0 评论 -
百度工程师教你玩转设计模式(单例模式)
单例模式属于创建型模式(Builder Pattern),意图在于保证一个类仅有一个实例,并提供一个访问它的全局访问点。原创 2022-06-10 10:15:17 · 222 阅读 · 0 评论 -
小程序启动性能优化实践
本文从性能优化的价值、性能指标的定义域衡量以及如何优化性能这几部分内容来帮助大家快速对小程序性能优化相关的方法有一定的理解。原创 2022-06-09 16:11:22 · 938 阅读 · 0 评论 -
GDP Streaming RPC 设计
GDP (Go Develop Platform)是百度内使用的 RPC 框架,具备完善的 RPC Client 和 RPC Server 能力,可以用来开发 API、Web 及后端服务等各种应用。GDP Streaming RPC 是基于 GDP RPC 能力开发的流式 RPC 框架,在实现功能基础上设计的一套面向流传输场景的传输框架,提供了流式传输应用场景的方案。百度内使用流式 RPC 方案首选为 baidu-rpc (开源项目为 brpc)streaming,GDP str原创 2022-03-08 15:48:34 · 2666 阅读 · 0 评论 -
Android包体积优化上篇- 资源混淆优化
什么时候进行包体积优化?一般在app初创期时,由于业务代码较少,包体积也不大,相应这个时候对包体积的优化收益也较少。当业务逐渐成熟功能,迭代逐渐变多,包体积也会逐渐增加。增加包体积主要影响如下几个方面:1: 如果针对app,会影响到下载转化率,但手百内部直播属于插件,所以不存在转化率的问题,存在插件的下载时长问题,进而在一定程度上影响插件冷启首屏;2: 渠道商合作的要求,这个要求只在app里面,如果是插件不受其影响,app的体积越大,渠道商的资费会更高,如要求更大的ROM空间,更长的安装时间,这些都极原创 2022-03-01 14:18:03 · 2301 阅读 · 0 评论 -
前端SSR的落地实践
全文3268字,预计阅读时间8分钟目录:一、名词解释二、业务背景:新增服务市场业务线三、困境:服务端的渲染由后端主导,前端只负责产出静态(浏览器端执行)js文件四、重新开始:前端也能做服务端渲染,js也能在服务端生成html1:引入Node.js做服务渲染层2:确定SSR技术方案node-vue-ssr五、新的挑战:Node.js和SSR的加入,同构逻辑冗杂六、合理分层:拆解不同端的复杂度,一次开发多端生效,提高开发效率七、配置化开发:每一层开发单元如何工作传递给下一层.原创 2022-02-22 14:31:27 · 1328 阅读 · 0 评论 -
百度搜索中“鱼龙混杂”的加盟信息,如何靠AI 解决?
从粗放式流量覆盖到精细化用户时长提升的转变,以及构建个性化、场景化文案创意的生成,迫切需要一套自动化、系统化的智能内容生成解决方案,来缓解人工创作下的耗时长、成本高等问题。本文将从行业背景出发,全面介绍下招商加盟行业下内容场景的特点,最后重点介绍加盟星在招商加盟行业下探索的 AI 创作解决方案。原创 2021-12-14 13:33:37 · 1067 阅读 · 0 评论 -
全面解锁Kubernetes?百度爱番番技术实践全解析
百度爱番番为什么会选择 Kubernetes ?谁来帮我搞定 Kubernates 集群?迁移的工作量大么?有什么收益?那么接下来,我们将现身说法,针对大家可能关心的问题做个概述。原创 2021-12-09 10:39:01 · 458 阅读 · 0 评论 -
百度文库新一代文档阅读器,核心技术点全解析
文库有数十亿文档,包括 word、ppt、excel、txt 和 pdf 等十几种常见办公文档,核心技术是转码和展现,转码的目的是把不同文档进行解析转换成一套通用的数据格式,由后端实现,而展现是把文档数据进行渲染。在这之前,文库前端采用的HTML+CSS进行渲染,这种方式在后面的业务发展过程中遇到了阻力,比如很难实现文档导出长图、文档标记、关键字高亮、水印、文档内容分析、防复制等。原创 2021-12-07 10:39:25 · 757 阅读 · 0 评论 -
详解预训练模型在信息检索第一阶段的应用
百度Geek说 关注我们,带你了解更多百度技术干货。 69篇原创内容 ...原创 2021-11-30 10:56:27 · 2239 阅读 · 0 评论 -
百度商业大规模高性能全息日志检索技术全解
百度Geek说 关注我们,带你了解更多百度技术干货。 68篇原创内容 ...原创 2021-11-29 10:44:50 · 186 阅读 · 0 评论 -
短视频个性化Push工程精进之路
导读:短视频Push系统是一套支持百度内多款app及多业务场景的分布式Push系统,目前支撑着好看视频,直播,度小视,好看大字版等app的推送业务,提供基于用户基本特征的个性化推送,热门活动和热点事件的运营推送,基于关注关系或订阅关系的业务实时推送等场景的支持。旨在通过个性化推荐系统及运营编辑方式稳定高效的给用户通知栏消息推送自己喜欢的内容信息从而达到提高用户活跃度,提升用户留存的业务目标。全文5886字,预计阅读时间15分钟。背景:在这个信息爆炸的互联网时代,能够及时和准确获取信息是当今社会要解决的关键问原创 2021-11-16 14:17:07 · 2073 阅读 · 0 评论 -
基于etcd实现大规模服务治理应用实战
百度Geek说 关注我们,带你了解更多百度技术干货。 65篇原创内容 ...原创 2021-11-11 14:23:47 · 612 阅读 · 0 评论 -
质效中台助力实现质量度模型规模化落地
百度Geek说 关注我们,带你了解更多百度技术干货。 64篇原创内容 ...原创 2021-11-10 11:20:29 · 228 阅读 · 0 评论 -
百度爱番番数据分析体系的架构与实践
导读:讲述在业务快速迭代发展过程中,为了让大数据更好地赋能业务,高效的为用户提供有业务价值的数据产品和服务,百度爱番番的数据团队构建实时和离线大数据基础平台的心路历程,包括如何应对业务、技术、组织等方面的挑战和解决实际痛点过程中的思考与实践。全文9911字,预计阅读时间24分钟。一、前言作为一站式的公私域智能营销与销售加速器,爱番番既承载着百度内部生态的各类推广平台的线索数据(例如:搜索、信息流、基木鱼自建站等营销推广平台的业务沟通、询价收集、表单留资等用户行为形成的线索)的落潜、管控、跟进以及转化等业务能原创 2021-11-05 10:53:11 · 479 阅读 · 0 评论 -
托管页前端异常监控与治理实战
百度Geek说 关注我们,带你了解更多百度技术干货。 64篇原创内容 ...原创 2021-11-04 14:02:44 · 402 阅读 · 0 评论 -
iOS 崩溃日志在线符号化实践
导读:本文将介绍什么是符号化?如何做本地符号化?为什么做在线符号化?全文14328字,预计阅读时间28分钟。一、 什么是符号化?在日常开发中,应用难免会发生崩溃。通常,我们直接从用户导出来的崩溃日志都是未符号化或者部分符号化的,都是一堆十六进制内存地址的集合,可读性较差。未符号化或者部分符号化的崩溃日志对闪退问题的解决几乎毫无帮助,如下所示:Last Exception Backtrace:0 CoreFoundation 0x1ca4cd27c 0x1ca3b5000 + 11475161 li原创 2021-10-28 14:34:30 · 1359 阅读 · 1 评论 -
好看视频Android重构——围绕于播放器的重构实践
百度Geek说 关注我们,带你了解更多百度技术干货。 55篇原创内容 ...原创 2021-09-23 14:50:48 · 316 阅读 · 0 评论 -
百度商业大规模微服务分布式监控系统——凤睛
导读:作为凤睛早期的接入方、后期的核心成员,笔者经历了整个项目前后四年的变迁,看过项目的艰难开端、中期的默默积累以及后期的蓬勃发展。每一次架构的变迁都带着技术浪潮的烙印,也看到项目成员利用有限资源来解决实际问题而持续不断的创新。凤睛是百度商业业务系统的性能监控系统(APM),它侧重于对Java应用的监控,基本接入了百度绝大部分Java应用(覆盖数千个业务应用,数万个容器)。它能够对主流中间件框架( Spring Web、RPC、数据库、缓存等)进行自动埋点,实现全栈式性能监控和全链路追踪诊断,为百度各业.原创 2021-04-27 15:02:59 · 187 阅读 · 0 评论 -
⼤规模短⽂本聚类的设计和实践
点击关注「百度Geek说」更多技术干货等着你导读:大规模短文本聚类系统,旨在精准高效地将海量搜索query进行总结归纳,凝练成为含义内聚表达清晰的“需求”,不仅可以更好地满足用户需求,还能找到内容满足的长短版。如何保证聚类系统的高准确性,如何提高聚类系统的运行效率,是我们团队的工作重点。我们通过多级拆分、精准匹配语义相似度、误差修正等手段,逐步提升了系统的各项效果和性能指标。本文基于我们的实际工作经验,分享了大规模短文本聚类的设计和实践。第五期百度Geek说「周一见」活动火热进行中,转发文章截图发给小编,有原创 2021-04-20 11:16:26 · 352 阅读 · 0 评论 -
百度交易中台之订单系统架构浅析
导读:百度交易中台作为集团移动生态战略的基础设施,面向收银交易与清分结算场景,为赋能业务提供高效交易生态搭建。目前支持百度体系内多个产品线,主要包含:小程序,地图打车,百家号,招财猫,好看视频等。本文主要从业务模型与架构设计两个方面介绍订单系统的构建过程。本期公布第四期「周一见」活动中奖名单,详情见文末~一、订单系统应具备怎样的能力?订单打通用户、商家、商品、库存、售后等关键业务,是驱动交易全流程运转的核心。而订单系统承上启下,作为入口,涵盖了订单流程管理、库存与营销管理、算价引擎、履约子流程、售后以及退款原创 2021-04-08 15:32:08 · 1677 阅读 · 3 评论 -
百家号在线视频编辑器的技术演进
导读:随着移动互联网的发展,视频化浪潮借着5G的东风扑面而来。然而众多用户在进行视频化创作的过程中,被传统视频编辑器复杂的功能和陡峭的学习曲线劝退。为此,百度百家号业务研发团队结合用户的实际创作需求,开发出一款简单易用的在线视频编辑和发布工具——百家号在线视频编辑器。本文将细致地介绍这一编辑器的技术原理,架构和演进方向,并从一角揭示百度内部的技术合作与创新机制。*第四期百度架构师「周一见」活动进行中,本期赠送小度音箱,详细活动规则见二条推文~前言随着移动互联网的快速发展,人们越来越习惯于在手机上观看视频内容原创 2021-04-01 15:29:55 · 1390 阅读 · 0 评论 -
百度直播消息服务架构实践
导读:直播业务的核心功能有两个,一个是实时音视频推拉流,另一个是直播间消息流的收发。本文主要介绍百度直播服务内的消息服务系统的设计实践和演化。第三期百度架构师「周一见」活动火热进行中,文末有惊喜福利~一、背景直播间内用户聊天互动,形式上是常见的IM消息流;但直播消息流不仅仅是用户聊天。除用户聊天外,直播间内常见的用户送礼物、进场、点赞、去购买、主播推荐商品、申请连麦等互动行为的实时提醒,也是通过消息流下发的。此外,直播间关闭、直播流切换等特殊场景,也依赖消息流的实时下发。消息流可以认为是直播间内主播与用户间原创 2021-03-25 14:49:24 · 928 阅读 · 0 评论 -
百度Feed稳定性架构实践
导读:百度Feed信息流推荐系统服务于手百、好看、全民、贴吧等公司绝大多数信息流业务场景,随着业务的高速发展,整个系统承载的流量已经高达数十亿,在庞大的流量规模背后是数百个微服务和数万台机器做支撑。如何保证整套系统对外的高可用性是整个系统能力建设的关键,也是我们团队的一个非常核心的工作方向。为了保障信息流推荐系统常态5个9的可用性目标, 本文将基于我们实际的工作经验分享介绍百度Feed在线推荐系统是如何建设高可用性架构的。第三期百度架构师“周一见”活动开启,文末有惊喜福利~一、背景百度Feed信息流推荐系统原创 2021-03-23 15:15:45 · 1088 阅读 · 1 评论 -
万象:百度的海量多媒体信息处理系统
导读: 与传统网页不同,富媒体数据的理解与处理相比于此前的网页会更难、更具有挑战。万象系统是百度搜索为了解决富媒体信息海量处理问题而设计和开发的系统,文中对万象系统进行了一次全面的总览介绍,万象系统目前在百度已经承接了搜索所需要的所有图片、视频数据的加工和处理,管理着超大量级的图片和视频实体特征数据,每天支持数十亿的处理吞吐,为百度产品的效果提升奠定了基础。一、背景互联网信息经历过近几年的发展,已经从早期单纯的网页形式发展成如今的图文视频并茂的时期。我们现在看到的信息呈现方式不仅仅是枯燥的全版文字网页.原创 2021-03-18 14:03:51 · 1052 阅读 · 0 评论 -
前端工程化之H5性能优化篇
**导读:**从粗糙到精致,从简单到复杂,全球互联网Web App(网页应用)平均体积已增压到1.6Mb,随着音视频等富媒体内容的流量池膨胀,终端设备上的用户对网页装载速度尤其敏感。页面不能做到秒开,就会有大量用户选择离开。重视并改善网站性能,优化即时网页装载时间,加速即时网页在浏览器平台终端状态展现,进而可以带来网站流量增长。本文源自百度直播研发部,提出了前端渐进增强的页面渲染方案,即“路由分离+预静态化+WebView预创建”方案,来替代模板同步渲染方案,并采用工程化的方式将能力打包下沉赋能产品线。.原创 2021-03-18 13:47:59 · 981 阅读 · 0 评论 -
为什么我们开发 San 项目时要用 CLI?
导读:本文是 San CLI 的使用和原理的第一篇,主要介绍 San CLI 的初衷和使用,下一篇介绍具体的实现原理。一、什么是 CLICLI,是命令行界面(command-line interface )的英文缩写,命令行界面是在图形用户界面得到普及之前使用最为广泛的用户界面。我们就不看图形用户界面和命令行界面的定义了,直接举两个例子直观些。这是图形用户界面:这是命令行界面:虽然命令行界面没有图形用户界面使用广泛,但后者并不能取代前者,原因这里列举一些:远程操作。如果我们要远原创 2021-03-09 14:36:45 · 284 阅读 · 0 评论 -
百亿级流量的百度搜索中台,是怎么做可观测性建设的?
导读:百度搜索中台系统不但承接了搜索的阿拉丁流量,也致力于构建各个垂直业务的搜索能力。随着业务的不断发展,系统的流量规模已经达到百亿级别。而在百亿流量的背后,是千级别的微服务模块和数十万的实例数量,如何保证这套复杂系统的高可用、高性能和高可控,全要素多维度的可观测性成为搜索中台系统能力的关键。本文首先会介绍什么是可观测性以及云原生时代为什么更要关注可观测性,然后阐述搜索中台是如何以极低的机器成本打造百亿流量的实时指标监控(Metrics)、分布式追踪(Traces)、日志查询(Logs)和拓扑分析(Top原创 2021-03-05 16:39:43 · 565 阅读 · 2 评论 -
十亿级流量的搜索前端,是怎么做架构升级的?
导读:前端发展飞速,从最开始的静态页面到 JavaScript,再从 PC 端到移动端,随着大前端的复杂度不断提升,很多公司开始前后端分离,剥离出前、后端架构设计。那我们来看看,前端架构设计是什么?曾经非常简单的前端架构发展到现在有哪些问题,遇到前端代码体量巨大、跨团队协作效率、代码耦合、技术栈落后等问题又该怎么解决?一、什么是前端架构?前端架构这一词,相信很多人的定义都不太一样;按照拆词的解释来看,我理解为“前端”+“架构”。前端是指,Web 端的前台页面,包括网页的内容、样式、脚本等,这三者通常原创 2021-03-02 16:08:36 · 342 阅读 · 0 评论 -
大牛荐书 | 百度技术大牛都在读的7本书!
2月马上就要结束了,各位“技术打工人”有没有从假期模式完全调整过来呢?为了帮大家快速充电,我们特别邀请百度技术大咖推荐了7本压箱底的好书,帮大家排雷避坑,花最少的时间读最值得读的书。当然,如果你有想读的技术方向书籍也可以评论区留言告诉我们~原创 2021-02-25 15:47:09 · 272 阅读 · 0 评论 -
百度Hydra工具在移动端UI兼容性测试上的高效应用
导读:尽管自动化测试技术日新月异,但是自动化case构建成本、执行稳定性等问题的存在,使手工测试依然移动端质量保证的重要手段。传统手工测试必须通过人工操作的方式执行测试用例,效率提升依赖测试人员的操作熟练度。本文从介绍百度内UI兼容性测试现状切入,引出“一机多控”并以此概念为基础打造的工具Hydra。然后从技术实现的角度,介绍了Hydra整体的设计思想以及部分核心模块的设计。一、背景1.1 移动端UI兼容性测试移动端的UI兼容性测试,顾名思义就是对移动端应用在不同机型、不同分辨率、尺寸的移动设备上U.原创 2021-02-18 18:01:46 · 1570 阅读 · 8 评论 -
中间件技术在百度云原生测试中的应用实践
导读:百度测试中间件是百度QA自主研发的底层基础技术,历经10年的不断发展,采用数据平面+控制平面的总体架构,与google istio设计理念异曲同工,支持8大功能,9大测试场景,覆盖百度集团各大产品线,目前接管拓扑1w+,接管链路1w+,利用中间件技术,可以大幅提升联调环境搭建效率、模块免测率,大幅提升环境仿真度,线上环境安全性,是测试中必不可少的核心工具。原创 2021-02-09 16:32:34 · 492 阅读 · 4 评论 -
【百度技术分享】San介绍以及在百度APP的实践
导读:San是百度自研的高性能MVVM框架,它是一个快速、轻量、灵活的JavaScript组件框架,体积小巧,兼容性好,性能卓越,目前已落地百度APP包括搜索、feed、小程序等核心业务,服务于亿级用户,开源社区已超过36位贡献者,Star数量超过4.3K。原创 2021-02-05 13:59:07 · 893 阅读 · 0 评论 -
百度单测生成技术如何召回线上服务的异常问题?
导读:线上系统异常问题一直以来都是使人”闻风丧胆”的,传统手段在解决这类问题时面临着相应的技术瓶颈。基于此,探索基于单元测试召回异常问题的方法,实现了一套通用且无人参与的单测生成系统,在百余模块上落地取得了一定的效果。从近代码手段的单元测试着手,围绕基于单测生成技术召回异常问题的应用实践展开。主要介绍该方案0到1的整体建设思路、并从理解代码、构造高覆盖测试用例数据、生成测试用例代码以及分析失败用例这四方面展开介绍。原创 2021-02-04 16:51:45 · 263 阅读 · 0 评论 -
如何为多元化的产品场景选择完美的色彩组合?
色彩即是一种感受,也是一种信息。在多元化的产品场景中,如何运用一套科学的视觉策略,建立一套合理的页面个性化配色体系,解决产品展示形态单一、页面同质化严重、信息层级扁平等问题,提升产品的惊喜感、协调感、沉浸感。智能取色将在设计、策略、服务等多个维度给你答案!原创 2021-01-29 17:25:02 · 686 阅读 · 6 评论 -
百度信息流和搜索业务中的弹性近线计算探索与应用 | 文末送福利
我们结合推荐系统和搜索系统的业务特点,设计并实现了一套介于在线和离线之间的弹性近线计算架构。相比于在线计算,突破计算速度限制,为业务计算复杂度提供了更大空间;相比于离线批量计算,提供了时效性更强,稳定性更高的策略计算方式。原创 2021-01-28 15:35:57 · 674 阅读 · 0 评论 -
【百度官方技术分享】百度智能小程序框架性能优化实践
百度智能小程序框架性能优化实践阅读原文导读:今天给大家讲的题目是《百度开源小程序框架架构演进和性能优化实践》。本次分享包含两部分,第一部分是百度智能小程序整体的框架及演进,主要讲百度小程序开发全流程概况、百度智能小程序框架,以及百度小程序多宿主运行保障;第二部分是百度小程序框架的性能优化,主要讲整个小程序的启动过程,以及从开发者角度,有哪些重要的优化点。一、百度智能程序整体框架及演进整个移动互联网一直是在 NA 和 H5 之间寻找权衡,NA 的性能好、能力强;H5 灵活性更高。我认为渲染分为两派原创 2021-01-14 12:07:49 · 656 阅读 · 1 评论 -
百度秘籍:如何简单优雅的适配textview行间距?
TextView的行间距在不同设备下的一致性表现不尽如人意,这给视觉review带来了不少麻烦,降低了RD&UI的工作效率,本文将探索出了一套低风险高兼容性的解决方案。该方案能够完全统一TextView的行间距,保证了TextView行间距在不同机型上的一致性体验,这极大程度减少了TextView相关的视觉联调时间,提高了大家的工作效率。原创 2021-01-21 17:23:50 · 230 阅读 · 0 评论