蚂蚁集团大模型数据智能算法工程师招聘(可内推)

职位描述

大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下一个或多个方向:

1、数据知识体系生成:研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系;

2、语料自动分类:基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向;

3、权威评测集建设:研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能;与跨职能团队合作,确保评测集覆盖全面且具有代表性;

4、语料质量评估与合成:建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率;

5、智能标注链路研发:基于大模型数据的标注需求,研发辅助打标算法;设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量;

6、技术创新与优化:持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。针对实际业务需求,提出创新性的解决方案并快速落地。

职位要求

1、计算机科学、人工智能、深度学习或相关领域的硕士及以上学历; 2、熟练掌握PyTorch、Tensorflow 等深度学习框架,理解大模型训练数据的需求,熟悉模型数据的链路; 3、优秀的定义、分析、解决问题的能力,自我驱动,具备较强的学习、创新应用和沟通协调能力,problem-solver。

以下情况优先考虑:

1、有大模型数据体系设计、语料分类、评测集建设、数据标注算法等相关项目的实践经验者优先。曾参与过大型数据集构建或数据质量评估工作的候选人优先考虑;

2、有大模型、智能体、强化学习、数据标注算法等相关技术领域工作经验者优先;

3、拥有计算机视觉、自然语言处理、人工智能相关领域的顶级会议论文发表,或者在相关算法竞赛中获得top排名者优先。

更多求职信息,欢迎加入『大模型之心Tech知识星球』!

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值