百度视觉技术部多模态感知与理解招聘(社招/校招/实习)

招聘岗位:

  1. 校招/社招/实习(可转正)

  2. Base 北京/深圳

工作职责:

  1. 前沿算法研发: 负责文心一言在视频理解方向的算法研究与开发,探索和实现世界领先的(SOTA)视频理解模型。

  2. 核心任务攻关: 聚焦于一项或多项核心视频理解任务,包括但不限于:

  • 视频问答 (Video QA) & 对话: 实现模型对视频内容的深度推理和对话能力。

  • 视频描述/摘要生成 (Video Captioning/Summarization): 让模型能用自然语言精准描述或概括视频内容。

  • 时序行为定位与识别 (Temporal Action Localization & Recognition): 精准识别视频中人物的行为及其发生的时间段。

  • 视频主题/事件检测 (Video Topic/Event Detection): 对长视频进行结构化分析,理解其核心主题与关键事件。

  • 大规模数据构建: 负责视频理解所需的大规模、高质量多模态数据集的构建,包括数据采集、清洗、标注和管理策略的制定与执行。

  • 大规模训练: 负责视频理解大模型的分布式训练、微调和性能优化,解决训练过程中的效率和收敛性挑战。

  • 技术落地与创新: 与业务团队紧密合作,推动算法在产品中的实际应用与效果验证,并从中提炼出新的算法迭代方向。

  • 职位要求(实习生可放宽条件):

    教育背景:计算机科学、人工智能、电子信息、自动化或相关领域的硕士或博士学历。

    专业经验——在以下至少一个领域有深入的研究或项目经验:

    • 视频理解 (Video Understanding): 如行为识别、视频分类、时序定位等。

    • 多模态学习 (Multimodal Learning): 熟悉CLIP、ALIGN等多模态预训练模型,了解跨模态融合、对齐等技术。

    • 大语言模型 (LLM) / 视觉语言模型 (VLM): 有LLM或VLM的微调、开发经验。

    在CVPR, ICCV, ECCV, NeurIPS, ICLR, AAAI等顶级人工智能会议/期刊上发表过相关论文者优先。

    优势:

    1. 大牛导师一对一指导;

    2. 深度参与文心大模型项目;

    3. 免费水果、健身房;

    4. 有竞争力的薪资;

    团队组建不久,组内校招、实习、社招、人才计划的HC充足,欢迎投递!

    联系人:wuzhiheng03@baidu.com

    更多内容欢迎加入我们的求职星球了解,一个专为自动驾驶、机器人、具身智能和大模型求职打造的社区。简历可直达面试专家~

    AutoRobo知识星球

    这是一个给自动驾驶、具身智能、机器人方向同学求职交流的地方,目前近1000名成员了,成员范围包含已经工作的社招同学,如智元机器人、宇树科技、地瓜机器人、地平线、理想汽车、华为、小米汽车、momenta、元戎启行等公司。同时也包含2024年秋招、2025年秋招的小伙伴,方向涉及自动驾驶与具身智能绝大领域。

    星球内部有哪些内容?这一点结合我们已有的优势,给大家汇总了面试题目、面经、行业研报、谈薪技巧、还有各类内推公司、简历优化建议服务。

    招聘信息

    星球内部日常为大家分享已有的算法、开发、产品等岗位,基本都是公司第一时间分享给我们的!涉及校招、社招、实习等岗位。

    面试一百问

    AutoRobo内部为大家汇总了自动驾驶、具身智能方向的一百问,都是工作、求职中用到的干货。

    自动驾驶相关:

    • 毫米波视觉融合一百问

    • 3D&4D毫米波雷达量产一百问

    • 车道线检测算法与量产一百问

    • 规划控制相关问题/面试一百问

    • BEV感知一百问(纯视觉+多模态融合方案)

    • 多传感器联合标定一百问!优化方法及实战技巧

    • 多模态3D目标检测一百问

    • 多传感器融合与跟踪一百问

    • Cuda与TensorRT模型部署一百问

    • Nerf与自动驾驶一百问

    • 轨迹预测相关内容一百问

    • Occupancy感知一百问

    • 相机标定一百问

    • 端到端自动驾驶一百问......

    具身智能相关:

    • VLA面试一百问

    • VLN视觉语言导航面试一百问

    • Diffusion Policy面试一百问

    • ......

    行业研报

    选择一个行业深入,前提是要懂这个行业,星球内部也为大家汇总了很多领域研报,让大家清楚的了解这个行业在做什么?发展状态怎么样?前景如何?上下游产业怎么样?

    • 世界机器人报告

    • 中国具身智能创投报告

    • 具身智能产业发展研究报告

    • 具身智能行业深度:发展趋势、市场机遇

    • 当前具身智能行业具体面貌怎样?技术路线是怎样的?

    • 中国人形机器人发展蓝皮书

    • 人形机器人量产与硬件研报

    • ......

    前车之鉴:成功和挂掉的面经

    成功的面试经验固然重要,但失败的经验也值得我们反思。我们从社招到校招,再到实习!从1面到3面,从写代码题目、到项目细节,都给大家梳理了一遍。

    • 自动驾驶决策规划控制算法岗位面经

    • 滴滴出行算法工程师面经

    • 英伟达NV春招面经

    • 上海AI Lab面经

    • 美团自动驾驶SLAM算法岗面经

    • 小米汽车算法岗位面经

    • 华为自动驾驶行为预测岗位面经

    • 理想汽车c++面经

    • 小鹏汽车产品经理面经

    • 智加科技算法实习面经

    • .......

    面试心得

    有的时候写写情怀也不错,前人的经验可以帮助后人少踩坑,以及从一个宏观和客观的角度分析利弊,这里也为大家汇总了蛮多。

    • 面试算法岗基础技能树有哪些点?

    • 转行到自动驾驶行业的心血历程!

    • 作为一名面试官,想分享的一些建议

    • 自动驾驶算法岗位复盘......

    谈薪技巧

    • 岗位谈薪关键回答

    • HR面常见问题汇总

    • ......

    专业基础的书籍

    机器人、自驾、AI类相关书籍汇总:

    欢迎加入

    欢迎有需要的同学加入星球,每天只有3毛钱,我们提供完成的求职服务,扫码和近1000位成员一起交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值