- 博客(109)
- 收藏
- 关注
原创 免费开源!从入门到精通的AI大模型学习宝典及实战指南
国内外最强大语言模型:ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能高效完成信息检索、科研应用、论文写作、助力顶刊、创意灵感、写作翻译、论文润色、图片生成、科研绘图、数据分析、代码生成、成果发表、课题申报、邮件、脚本、文案、翻译等任务。ChatGPT在各个领域具有广泛的应用前景,它可以提高研究效率,节省时间和人力。
2024-08-20 09:56:10
925
原创 80w起!零成本快速入门AI大模型学习指南!
自从ChatGPT在短短一年半内将生成式AI推向主流以来,科技行业掀起了一股前所未有的变革浪潮。从谷歌到亚马逊,从百度到阿里,全球科技巨头纷纷加大在AI领域的投入,这也直接影响了招聘市场。大模型相关的岗位数量显著增长,年薪更是达到了80万至90万元人民币的高位。在这样的背景下,学习AI已成为程序员提升自身竞争力的重要途径。随着AI技术的飞速发展,越来越多的开发者意识到掌握AI技能的重要性。一部分人希望正式转行到新兴的AI行业,需要系统地学习和训练;
2024-08-19 11:12:34
523
原创 提升 RAG 效能:使用最佳的嵌入与重排模型
在本篇博客文章中,我们展示了利用不同的嵌入式系统和重新排序工具来评价和增强信息检索性能的方法。以下是我们的最终结论:•嵌入式系统**OpenAI**和**Voyage**的嵌入式系统,在配合时,无论是在命中率还是 MRR 上都设定了高标准。•重新排序工具: 重新排序工具,尤其是,其重要性不言而喻。它们在提升多种嵌入式系统的 MRR 中起到了关键作用,彰显了其在优化搜索结果方面的重要性。•基础至关重要: 选择合适的嵌入式系统作为初始搜索工具极其重要;
2024-08-18 08:00:00
2121
原创 一文讲透什么是向量数据库?
嵌入模型[1]会将各种数据 (例如文本、图像、图表和视频) 转换为数值向量,以便捕捉其在多维向量空间中的含义和细微差别。嵌入技术的选择取决于应用需求,同时要兼顾语义深度、计算效率、要编码的数据的类型、维度等因素。man、king、woman 和 queen 这几个词映射到的向量空间 (来源:baeldung[2])通过将向量映射到多维空间,可以对向量的语义相似性进行细致的分析,从而显著提高搜索和数据分类的准确性。
2024-08-17 08:15:00
1273
原创 一问讲透什么是 RAG,为什么需要 RAG?
如果使用 pretrain 好的 LLM 模型,应用在你个人的情境中,势必会有些词不达意的地方,例如问 LLM 你个人的信息,那么它会无法回答;这种情况在企业内部也是一样,例如使用 LLM 来回答企业内部的规章条款等。这种时候主要有三种方式来让 LLM 变得更符合你的需求:
2024-08-16 09:50:28
1081
原创 一文彻底搞懂大模型 - Agent(智能体)
什么是LLM Agent?大模型Agent是一种构建于大型语言模型(LLM)之上的智能体,它具备环境感知能力、自主理解、决策制定及执行行动的能力。Agent是能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标。在技术架构上,Agent从面向过程的架构转变为面向目标的架构,旨在通过感知、思考与行动的紧密结合,完成复杂任务。
2024-08-15 10:14:21
1791
原创 2024中大厂AI大模型面试八股文合集,GitHub,牛客,leetcode已爆火!
还有半个月就到金九银十,不知道大家现在都到哪个阶段了,有没有已经找到心仪的工作的朋友?有没有还没准备好面试在各大平台找资料临时抱佛脚的朋友?不管你是现在急切找工作还是找资料备战,我都非常推荐你看看我花2个多月从GitHub,牛客,leetcode上为大家整理收集的2024中大厂AI大模型面试八股文合集,我敢说你看完这份资料,必定能有所收获,不会的能查漏补缺,会的能理解更深刻透彻,在这个竞争压力巨大的环境下拿下一份满意的offer不成问题。
2024-08-14 12:02:58
1876
原创 绝了!国内首本讲解ChatGPT底层架构技术之书,大模型入门必备!!
Transformer是用于自然语言处理的神经网络架构。自然语言处理的英文全称为Natural Language Processing,简称NLP。在大数据和人工智能时代,机器学习和深度学习已经成为各行各业解决问题的有效方法,自然语言处理,是深度学习的重要应用领域之一。而自然语言处理这个研究领域在过去20年中发生了翻天覆地的变化,从传统的自然语言处理方法到深度学习方法,再到目前的Transformer。今天给大家推荐的这本《精通Transformer:从零开始构建最先进的NLP模型。
2024-08-13 11:39:35
1571
1
原创 Hugging Face硬核书 |《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》
自然语言处理一直作为人工智能领域内的重要难题,历史上无数的科学家付出了巨大的心血对其进行研究。著名的图灵测试本质上也是一个自然语言处理任务。在深度学习成为主流后,自然语言处理确立了主要的研究方向,尤其是在谷歌提出了Transformer和BERT模型以后,基于预训练模型的方法,已成为自然语言处理研究的主要方向。今天给大家带来一本《HuggingFace自然语言处理详解》,本书综合性讲解HuggingFace社区提供的工具集datasets和transformers。
2024-08-12 15:02:41
839
原创 学习Transformer,应该从词嵌入WordEmbedding开始
如果你想吃第5个馒头,总要先吃了前4个才可以。学习也一样,需要循序渐进。很多同学觉得Transformer模型难学,看不懂;这是因为Transformer是一个非常复杂的模型。其中包括了很多的基础知识;这些基础知识都需要同学们提前掌握;然后才能开始学习Transformer模型中的特有内容。
2024-08-11 08:30:00
747
原创 抢先掌握AI大模型:独家学习资料,从入门到实战,免费领取!
随着科技的迅猛发展和数字化浪潮的推动,AI大模型技术已经成为引领新一轮科技革命和产业变革的重要力量。市场上对于AI大模型技术的需求持续攀升,无论是传统行业还是新兴领域,都在积极拥抱这一创新技术,希望在激烈的市场竞争中抢占先机。然而,随着大模型技术的广泛应用,也带来了前所未有的机遇与挑战。大模型技术能够深度挖掘数据价值,为各行业提供智能化决策支持,促进业务创新和发展。那么,如何掌握和应用这一先进技术,使其真正发挥价值,成为企业和开发者面临的一道难题。
2024-08-10 10:54:34
247
原创 在当前互联网行情下,Android开发者如何转战AI大模型领域?
许多程序员感受到了前所未有的压力:不敢轻易跳槽、担心被裁员、工作强度不断增大……这一切似乎都在告诉我们,曾经的黄金时代正在远去。对于Android开发者而言,这个感受尤为明显。随着新技术的不断涌现,特别是人工智能(AI)领域的快速发展,很多人开始思考自己的职业道路是否需要做出调整。Android开发的现状随着移动互联网市场的逐渐成熟,Android开发岗位的竞争变得越来越激烈。一方面,市场需求趋于饱和,另一方面,新兴技术如AI、大数据等正在成为新的热点。
2024-08-09 16:56:38
1153
原创 从零到高手:AI产品经理速成计划与独家系统学习资料全放送!!
当下社会,终身学习是这个时代的必修课。每个人都在努力提升自己的能力,学习资料的搜集已经成为我们生活的一部分,资料的搜索、整理很耽误时间,搜索的时候常常被一些广告和虚假内容所迷惑。尽管市面上已经存在大量关于人工智能技术的资料,但专门针对如何成为和做好AI产品经理的系统化教学体系却寥寥无几。能够提供从产品理念到实施细节,乃至行业大牛全程指导的课程更是罕见。这不仅加大了产品经理学习的难度,也限制了他们在这个领域的成长速度。因此特意给大家准备了一份涵盖了全系列的学习资料。
2024-08-09 11:57:33
1071
原创 2024年最新免费AI大模型API汇总及国内大模型使用教程(附代码)
腾讯混元大模型接入地址https://console.cloud.tencent.com/hunyuan/start点击创建密钥,到新页面,新建密钥也可以到调试界面进行调试使用,在最开始表格中的文档查看,进去点击调试好了,选择你的代码复制到本地即可。
2024-08-08 16:38:44
8491
原创 国内AI渗透太快, 普通程序员再不入局就晚了!
现如今,国内的科技巨头纷纷加快新一轮的AI技术革新,大模型正逐步渗透各行各业,国内“百模大战”即将开启。百度文心大模型、华为云盘古大模型、阿里云通义大模型、360智脑大模型等多个大模型产品正应用于各行各业。新东方、满帮、T3出行、企迈等企业已接入通义千问大模型,并且有了实际应用。国内AI岗位招聘需求正在上升,普通程序员找工作越来越难!无论你是前端还是后端岗位,都急需:掌握前沿热点:与业内资深从业者对话,获取更多学习资源。提升工作效率:提高编码效率,利用大模型优化工作流程。
2024-08-08 10:29:29
1014
原创 NLP理解层次:从认知到理解的六个维度
在NLP的框架中,理解层次是一个核心概念,它揭示了人类思维和沟通的复杂结构。NLP认为,我们的思维和行为可以通过改变对问题的理解层次来影响。理解层次由低到高分为六个层次,每个层次都对应着不同的思考深度和行动策略。
2024-08-07 11:42:31
2848
原创 这是一篇很枯燥的技术文章,花了很久很多心思整理的解读大模型Transformer架构
已经记不清这是我第几次解读大模型Transformer架构了,从浅到深,包括自己之前解读完还会从0手写一个大模型出来,去训练,去微调。但是每一次解读后,都会有更深的感受和理解,今天花时间做了一次系统的整理,有需要今后想研究大模型的,可以收藏起来,以后慢慢看。看一次就懂很难,有些地方,需要慢慢读,慢慢品,研究的多了,相信下面这张图,你都能背着画下来了。
2024-08-07 11:27:46
793
原创 AI岗位平均月薪已经超过4.6万,程序员该如何抓住这个机遇?
自从ChatGPT横空出世以来,市场上一直用“iPhone时刻”、“划时代”、“工业革命”等词汇来形容AI领域的飞速进展。如今,随着AI大模型的竞争日益激烈,这个领域正在以前所未有的速度向前发展。随着AI技术的不断发展,我们正站在一个新的时代的门槛上。对于那些渴望在这个领域有所作为的人来说,这是一个充满机遇的时刻。通过不断学习和适应新技术,每个人都有机会成为AI时代的一部分,共同塑造未来的世界。
2024-08-06 16:13:21
681
原创 大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
简而言之,提示工程就是寻找一种编辑查询(query)的方式,使得大型语言模型(LLM)或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕过这些模型的安保措施。现在的互联网上到处都是提示工程指南、快捷查询表、建议推文,可以帮助用户充分使用 LLM。在商业领域,现在也有不少公司竞相使用 LLM 来构建产品 copilot、自动化繁琐的工作、创造个人助理。
2024-08-06 10:41:52
897
原创 解读提示工程(Prompt Engineering)
Prompt提示是什么呢?Prompt提示是模型接收以生成响应或完成任务的初始文本输入。我们给AI一组Prompt输入,用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词,或任何其他形式的文本,用于引导模型产生特定内容的响应。例如,在chatGPT中,用户通常使用 prompt 来与大语言模型进行交互,请求回答问题、生成文本、完成任务等。模型会根据提供的 prompt 来生成一个与之相关的文本,尽量符合用户的要求。
2024-08-06 10:38:27
2555
原创 神经网络算法 - 一文搞懂RNN(循环神经网络)
本文将从RNN解决了什么问题、RNN的基本原理、RNN的优化算法、RNN的应用场景四个方面,带您一文搞懂循环神经网络RNN。
2024-08-05 11:15:19
3081
原创 神经网络算法 - 一文搞懂CNN(卷积神经网络)
本文将从CNN解决了什么问题、人类的视觉原理、CNN的基本原理、典型的CNN及实际应用四个方面,带您一文搞懂卷积神经网络CNN。
2024-08-05 11:09:30
2334
原创 神经网络算法 - 一文搞懂ANN(人工神经网络)
本文将从**生物神经网络、人工神经网络、神经网络训练、、分类与应用、** 四个方面,带您一文搞懂人工神经网络ANN。
2024-08-04 08:00:00
2335
原创 神经网络算法 - 一文搞懂Embedding(嵌入)
本文将从**Embedding的本质、Embedding的原理、Embedding的应用**三个方面,带您一文搞懂Embedding(嵌入)。
2024-08-03 08:00:00
4246
原创 AI产品经理的两种路径:纯AI与AI+的探索与实践
在人工智能(AI)领域,产品经理的角色正在变得越来越重要。根据不同的职业背景和兴趣,AI产品经理可以分为两个主要方向:纯AI产品经理和AI+产品经理。
2024-08-02 20:51:12
804
原创 大白话!神经网络Embedding的原理及作用
人工智能的奥义是:“万物皆可Embedding” 不知道大家有没有这种感受,在学习各种算法模型时,特别是深度学习模型,少不了嵌入(Embedding)的应用。
2024-08-02 17:22:52
959
原创 没有思考过 Embedding,不足以谈 AI
这篇文章把我关于语言模型中embedding的理解都介绍完了。但embedding 还不止这些。图像可以有embedding,句子和段落也可以有 embedding —— 本质都是通过一组数来表达意义。段落的 embedding 可以作为基于语义搜索的高效索引,AI 绘画技术的背后,有着这两种 embedding 的互动 —— 未来如果有一个大一统的多模态模型,embedding 必然是其中的基石和桥梁。由 AI 掀起的时代浪潮毫无疑问地要来了,今天是一个还难以看清未来的节点。
2024-08-02 17:17:31
822
原创 产品经理为什么要学AI?转型AI产品经理需要了解哪些内容?
随着人工智能(AI)技术的快速发展,AI产品经理成为了市场上炙手可热的职业之一。对于传统互联网产品经理来说,转型为AI产品经理不仅能拓宽职业道路,还能在快速变化的市场环境中保持竞争力。那么,产品经理为什么要学习AI?转型AI产品经理需要了解哪些内容呢?
2024-08-01 21:11:42
454
原创 Transformer动画讲解 - Softmax函数
Transformer的Softmax函数:用于将原始注意力分数转换为输入标记的概率分布。这种分布将较高的注意力权重分配给更相关的标记,并将较低的权重分配给不太相关的标记。Transformers通过Softmax在生成输出时,使用注意力机制来权衡不同输入标记的重要性。
2024-08-01 19:53:52
1128
原创 Transformer动画讲解 - 多层感知机
- Transformer的编码器和解码器结构:(1)Transformer的编码器由多个相同的层堆叠而成,每个层包含两个主要的子层:一个多头自注意力(Multi-Head Self-Attention)机制和一个全连接的前馈神经网络(MLP)。(2)Transformer的解码器也由多个相同的层堆叠而成,但每个层包含三个主要的子层:一个Masked Multi-Head Self-Attention机制(用于编码器的输出),一个Multi-Head Encoder-Decoder Attention机
2024-08-01 19:49:48
1136
原创 程序员转型人工智能:从“996”困境到拥抱光明未来
在这个充满挑战与机遇的时代,各行各业的辛酸各有不同,而程序员群体无疑有着自己的独特体验。他们学习着普通人难以理解的计算机语言,工作在“996”的高压环境中,还未及中年就可能面临“聪明绝顶”的尴尬。面对行业的快速更新迭代,他们不得不时刻更新自己的技能知识,以避免被淘汰。在这样的背景下,转型成为人工智能工程师似乎成为了一种无奈之举,但同时也是一条通往光明未来的道路。
2024-07-31 22:29:47
1258
原创 Transformer动画讲解 - 向量化
“Embedding”在字面上的翻译是“嵌入”,但在机器学习和自然语言处理的上下文中,我们更倾向于将其理解为一种“向量化”或“向量表示”的技术,这有助于更准确地描述其在这些领域中的应用和作用。
2024-07-31 21:07:54
1129
原创 Transformer动画讲解 - Cross Attention
编码器-解码器注意力:在“编码器-解码器注意力”层中,查询来自前一层解码器,而记忆键和值则来自编码器的输出。这使得解码器中的每个位置都能关注输入序列中的所有位置。这模仿了序列到序列模型中典型的编码器-解码器注意力机制。
2024-07-31 21:01:15
870
原创 AI时代:抓住未来机遇,成为高薪AI产品经理
AI时代,机遇与挑战并存。对于有志于从事AI产品经理的人来说,抓住时代发展的机遇,勇敢迎接挑战,将成为下一代技术领袖。让我们携手共进,共创AI时代的辉煌。
2024-07-30 16:51:21
811
原创 Transformer动画讲解 - 单头注意力和多头注意力
单头注意力:通过生成查询、键和值向量,计算并归一化注意力分数,最终对值向量进行加权求和,从而得到输入序列中每个位置的加权表示。多头注意力:通过将输入的查询、键和值矩阵分割成多个头,并在每个头中独立计算注意力,再将这些头的输出拼接并线性变换,从而实现在不同表示子空间中同时捕获和整合多种交互信息,提升模型的表达能力。
2024-07-30 11:00:20
1300
原创 Transformer动画讲解 - 注意力计算Q、K、V
Transformer的起源:Google Brain 翻译团队通过论文《Attention is all you need》提出了一种全新的简单网络架构——Transformer,它完全基于注意力机制,摒弃了循环和卷积操作。
2024-07-30 10:52:18
953
原创 AI到底有没有前景?到底要不要学习AI?
在当今这个科技飞速发展的时代,人工智能(AI)已经成为了一个热门话题。对于想要进入这一领域的学习者来说,心中难免会有一些疑问:“AI到底有没有前景?”、“我到底要不要学习AI?”、“我学成之后能找到工作吗?”这些问题都非常合理,毕竟转行或者选择新的职业道路是一项重大的决定。总而言之,AI领域的确有着广阔的前景和发展空间。如果你对这个领域感兴趣,并且愿意为之付出努力,那么完全可以考虑投身其中。当然,在学习的过程中可能会遇到困难和挑战,但只要坚持不懈,就一定能够克服。“没有绝对的天才,只有持续不断的付出。
2024-07-29 16:15:17
2717
原创 Transformer动画讲解 - 注意力机制
从端到端的角度来看,数据在Transformer中的流转可以概括为四个阶段:Embedding(嵌入)、Attention(注意力机制)、MLPs(多层感知机)和Unembedding(从模型表示到最终输出)。
2024-07-29 10:52:30
812
原创 Transformer动画讲解 - 工作原理
Transformer模型在多模态数据处理中同样扮演着重要角色,其能够高效、准确地处理包含不同类型(如图像、文本、音频、视频等)的多模态数据。Transformer工作原理四部曲:Embedding(向量化)、Attention(注意力机制)、MLPs(多层感知机)和Unembedding(模型
2024-07-29 10:48:47
1118
原创 Transformer动画讲解 - 数据处理的四个阶段
从端到端的角度来看,数据在Transformer中的流转可以概括为四个阶段:Embedding(嵌入)、Attention(注意力机制)、MLPs(多层感知机)和Unembedding(从模型表示到最终输出)。
2024-07-28 09:15:00
678
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人