年底了嘛,杂事情太多,让人感到应接不暇。有来自于工作上的事情,还有自己要做的事情。算是把生活填满了。
一、数据Ai指北知识库
一直在研究大模型的方向。基本来说都是应用层,算是入门了应用层的研究🥰。 同时也有很多小伙伴问我大模型怎么去学习。我觉得吧,没必要罗列一堆的路线图,从什么python,机器学习之类的去说,因为每个人的学习模式不一样。我也看了很多的学习路线,聊聊最有价值的逻辑:
1.1 先别管原理。
这玩意就是个工具,你要学会用。对于实际生产你就是要学会写prompt。这个真的是个技术活,很多人把它看简单了。你先去了解一下结构化提示词怎么编写,然后可以利用提示词优化工具去不断优化,看看怎么真的在实际场景里能写出来。
1.2 找个实际的场景
找个实际的场景,用大模型先试试,对于工业场景,先去申请下第三方的api,比如通义千问,也很便宜的。尝试着把业务走通,如果你是学生,也没事,先用开源数据集,走通一些简单的应用场景,想想怎么在推荐搜索做一些数据增强的应用研究。
1.3 当调包侠,先去玩玩RAG
Python版本的可以用Langchain,Java版本的可以用Langchain4j,去试一试RAG知识库场景,利用大模型对问答知识回答。
1.4 玩玩Agent智能体
去了解一下agent,这就是写prompt,只是把一个复杂的任务,拆成一个个子任务,每个子任务都只做一件事,入门我建议你去看看Dify和fastGPT,也是写prompt。
到这个程度我觉得你算是真的入门了。后面的修行就看你的应用场景,是否要微调,主要是你的场景是否需要,如果需要就去认真学习一下,不需要就不用。
先不要去训练,也不用去了解原理,就当开车一样先开起来,你总不会开车前一定要去弄明白三大件怎么造的吧。开明白了,遇到问题多了,你就会修。慢慢你就会成为专家,不要一开始就局限在原理里,然后就入门到放弃了。
总结:
我自己的学习知识库,最近一直在编写,从大模型的提示词开始,一直到大模型的产品。都是从应用逐渐到原理,直接从原理出发真的很枯燥。
大模型的应用理解,我觉得训练大模型的人绝对是少数的,不可能大家都能训练,不会像深度学习那样普遍,计算资源就卡死了一帮人,所以这个时候我们要打开思路,想想自己的业务场景怎么能用大模型做的更好,大模型不是万能的,最后就是一个辅助工具而已。
此时此刻快速的拥抱他,用好他,你就走在了前面。比如kimi,很多人说kimi好的不行,我用过,对比其他类似应用,kimi确实回答的好一些,但是我仔细研究下来,我发现kimi厉害的不是大模型,一个RAG而已,他把query理解做的很好,我感觉kimi对query理解和扩写做了一个大模型训练 ,检索后应该是把排序也优化了一下,然后做好RAG足矣。这就是应用做的好,你说他的底层模型很牛逼?如果真的牛逼,早就拿出来吹了,你要相信咱们行业的个性,整个行业的大模型论文都说自己超越了chatgpt,但是一用就拉胯。
所以说到最后,我的建议是多做应用,用好,你就是行业领先了。
二、大模型知识管理平台v1.0研发
晚上,夜不能寐的时候,都是在研发这个平台。之前文章有聊过它
现在终于算是完成个人文章生成模块的功能,在之前用的是:AiEditor
它好是好,就是只开源了一部分,付费版本太贵了(原谅我无法支持,太贵了)
而且最重要的是不支持:一键转为微信公众号格式和知乎格式。
于是把开源的mdnice集成了进来,并且额外开发了Ai功能,大大的提高效率。
目前是V1.0版本,虽然还有很多没完成,但也算是完成了整个流程。
也有朋友说过和腾讯的ima.copilot智能工作平台类似。确实类似,只不过自己做的话,可以自定义,大模型想用啥就用啥。最核心的功能是:我需要要用垂直微调的模型。这一点ima.copilot智能工作平台就无法做到了。
接下来想做的是:
-
利用Ollama部署垂直微调的大模型(小参数)。
-
优化编辑器的AI功能。
三、大模型日报
这几天也在优化大模型日报V1.0版本,已经真正投入使用。
每周工作日自动向群里发布:
调研过程中发现,许多人在编写日报时为了追求排版的美观性,选择取消了URL链接。
我认为这种做法并不可取。链接不仅是日报内容的重要组成部分,更是证明信息来源可靠性的关键证据。取消链接虽然能使日报看起来更加整洁,但却削弱了其可信度和实用性。
信息爆炸的时代,确保信息的可追溯性和真实性至关重要,而URL链接正是实现这一目标的有效证明。
四、总结
这就是最近这几周在做的事情。
在以往的过去,AI应用很难落地,反正不懂机器学习的小伙伴基本无法使用。
现在不一样了,大模型的出现,大大提高了生产效率。
也许有小伙伴说,目前也就琴棋书画方面,最近OpenAI的直播,不知道小伙伴们看了没有,反正我是看了,还是挺震惊的。
之前我自己的方向是大数据,但是利用工作日外的时间,努力学习大模型的知识。
目前感觉到两方面知识是互相补充的,毕竟大模型的要素之一就是数据。
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
四、AI大模型商业化落地方案
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。