这里写目录标题
1 ai领域发展方向与薪资
ai领域大体就几个发展方向:cv ,nlp, 多模态,asr tts语音识别,搜推广,rl强化学习, 其中cv和搜推广已经卷成麻花了,甚至以前我的一个总监领导直接说,搜推广已死,所以要作纯ai领域,最好的还是从nlp入手 不亏的。
在ai领域里,ai算法工程师和应用开发工程师,有区别 但不大,大概有一半或更多的工作是重合的。
但说到底算法需要高学历 985 211,需要看论文 需要复现论文,例如搜推广,经常会作这种事情,复现一个论文的算法,部署在小范围跑一下,看看数据有没有变好。
应用开发岗位呢,调api,使用模型,最多是微调模型,可能有训练可能不会有,是写业务逻辑代码的。
应用研发岗 – 做工程 一本以上 用模型 搞agent 搞rag私有数据库 大模型微调,全链路技术栈 这些
2 学习路线
python + pytorch
深度学习 + 传统机器学习的逻辑回归+决策树+随机森林
cv nlp
做项目 ,锻炼python与pytorch的能力
langchain langgraph 做agent
热题100,每天3道
ai清洗 训练
3 实习项目

3.1 agent智能体
照着bilibili开发一个agent智能体 ,延伸一些,就是持久化,记录上下文,本地部署搭建,等等。
例如 :bilibili大学里的分诊工作流了,智能旅游助手
ht@tp@s://ww@w.bilib@ili.@com/vid@eo/BV1HNE@BzuEdX/?spm_id@_from=333.337.search-card.@all.click&vd_so@urce=@1e65d792e7d6bacb@1c6@84945d033740b
3.2 自然语言处理+gpt

自然语言处理,结合gpt,实现语言对话,输出统计指标,上下文记录,上个月呢,上周呢 等等
- 自然语言处理:对自然语言进行分词,结合维表信息表,维度信息表,解析成指标、维度,解析维度值(where条件),并维护指标、维度和维度值的别名。
- 知识库与反馈:增加知识库,具备反馈能力,存储生成结果的反馈信息(SQL和prompt)。
- 生成prompt与SQL:将自然语言生成prompt,传给大模型生成SQL,再对SQL进行解析获取指标、维度和where条件。
- 查询:根据领域、指标、维度和where条件,生成SQL并执行。
- 结果再次执行:将结果和LLM生成的SQL用calcite再次执行。
- 影响准确性因素:维度和指标及其值的别名维护质量、生成的prompt质量、解析大模型生成的SQL以及生成的SQL,这些都会影响最终结果的准确性。
3.2.1 第一周实习内容
- 1 构思好大体思路,
1 搭建程序给3个单词,拼接sql,用sql查询数据,给出结果
2 给大模型喂表名,表结构后,提供3个单词,让大模型生成sql,用sql查询数据,给出结果
3 +自然语言分词 : 你好,我想查询昨天的北京销量第一名
4 +大模型上下文 : 那么前天呢,那么上个月呢 (先用api,后自己搭建)
5 +根据结果自动生成图片 , 最简单echarts - 2 了解大模型和prompt,重点prompt格式与prompt工程,大模型 (1本地2api)
- 3 搭建程序框架
3.2.2 第一周总结+第二周内容
1 检查上一周实习进展
2 辅导
3.3 第三周总结+第四周内容
1 指导修改简历
2 模拟面试
3 纠正面试中错误
2 数据科学实习
2.1 数据科学岗位工作内容
一般情况要求与业务紧密结合,所以在刚入行选择的时候要慎重,电商,金融,零售,互联网营销等,后期转岗十分困难。
工作内容常见的像:用户行为研究,开发或优化策略模型,工作中与数据分析和大数据领域结合会比较多。
2.2 技能要求
- 熟练使用 Python / R / SQL 进行数据计算和分析,掌握 Pandas、NumPy、Scipy 等工具。
- 统计学,数学等,其中机器学习的各种算法与leetcode刷题一般是基本功,必考项
- python或R的建模能力
- 大数据处理经验,一般情况spark占据主导地位(这一步也有可能由大数据团队来做,但不多)
总结建议:博客帖子+leetcode 长期维护。机器学习框架至少熟练使用一种:PyTorch
2.3 简历优势
1 独立建模能力,或者说对建模有一些自己的总结点
: 例如现在给你一个场景,我想对节假日的销售情况做建模,好制定相应的营销策略,要怎么做:?
这个侧重点是什么呢,是使用数据来提供决策,如果面试遇到这种问题应该是:
- 1 梳理沟通上下游,确认好这个建模是为了什么做的,要用这个建模做什么,来决策配货么,来预测营业额么,来扩大生产么,需要知道这个动作的,源头和目标分别是什么,扩大生产就要做生产与运输销售的建模,配货就是运输,只有知道目标 ,才能知道用法
- 2 需要确认这个东西是一次性还是长久的维护,影响开发决策
- 3 开发周期等等,等知道一切以后,开始根据自己的能力说,自己要怎么做:例如:由下至上还是由上至下
总结:这个问题最重要的是你要表达出,明确的逻辑能力,或者说你要有自己的方法论,我干这个事,第一步第二步,我知道应该做什么,而不是什么都不知道
2 精通机器学习算法
3 常见数据分析工具使用
1228

被折叠的 条评论
为什么被折叠?



