- 博客(16)
- 问答 (4)
- 收藏
- 关注
原创 算法入门笔记02
什么是数据结构,数据结构就是数据的储存位置与顺序。这里有电话薄,我们有两种方式储存信息。这里有两种顺序,一个是获取顺序,一个是按拼音排列顺序。获取顺序是什么样的呢?就是获得了一个人新的数据,将其添加到在表格的最后一行。每次想要查找某个人的电话时,要从头查找,直到找到那个人的电话。这种方式查找比较麻烦,但添加很方便。如果用拼音顺序排序,每次按照姓名的拼音首字母,就可以知道大概处在哪个位置。比如说知道姓张的应该排在最后,比较靠后,姓何的可能排在中间。这样查找起来会方便一些。
2024-09-21 11:56:28
1014
原创 深度学习入门笔记07(如何找到损失函数的最小值)
我们已经知道了如何求损失函数,包括用均方误差和交叉熵误差来求,我们还了解了为什么需要引入损失函数。接下来的重点是如何找到损失函数的最小值。为了解决这个问题,我们需要了解一些数学知识。
2024-09-09 17:51:26
1154
原创 深度学习入门笔记06(重点损失函数)
为什么要定义损失函数,为什么不能用精度做指标?我们来思考另一个具体例子。精度是这样计算的,假设某个神经网络正确识别出了100笔训练数据中的32笔,此时识别精度为32%。如果以识别精度为指标,即使稍微改变权重参数的值,识别精度也仍将保持在32%,不会出现变化。也就是说,仅仅微调参数,是无法改善识别精度的。即便识别精度有所改善,它的值也不会像32.0123 ...%这样连续变化,而是变为33%、34%这样的不连续的、离散的值。也就是说如果以识别精度为指标,则参数的导数在绝大多数地方都会变为0。
2024-09-05 11:15:34
643
原创 深度学习入门笔记05(手写数字识别的代码实践)
定义get_data函数,在函数中又调用了load_mnist函数,使用正规化,将图像展开为一维数组,不使用one_hot_label标签。返回测试输入数据和测试标签数据。定义init_network函数,使用with 语句打开文件(可以读取数据后及时关闭),'rb'表示用二进制只读模式打开数据。init_network()会读入保存在pickle文件sample_weight.pkl中的学习到的权重参数。这个文件中以字典变量的形式保存了权重和偏置参数。:使用pickle模块的load。
2024-09-04 21:04:06
1005
原创 深度学习入门04(关于输出层的设计)
前情回顾:前面我们了解了感知机,包括单层感知机和多层感知机。与门,与非门,或门都是单层感知机,而异或门是不能用单层感知机创造的,我们用图像解释了原因。这个是的内容。我们由感知机的知识,迁移到神经网络。神经网络由三个部分,包括输入层,隐藏层和输出层。我们还用阶跃函数来描述是否达到阈值输出1的这个过程,据此我们引出了激活函数,一个输入之和(考虑了权重与偏置)变成输出的函数。除了阶跃函数,我们还介绍了Sigmoid函数,它的图像更加平滑。
2024-09-03 16:25:57
926
原创 深度学习入门笔记03
至此,我们已经介绍完了3层神经网络的实现。现在我们把之前的代码实现全部整理一下。这里,我们按照神经网络的实现惯例,只把权重记为大写字母W1,其他的(偏置或中间结果等)都用小写字母表示。init_network()函数会进行权重和偏置的初始化,并将它们保存在。
2024-09-01 14:51:27
1031
原创 深度学习入门笔记02
本笔记参考《深度学习入门:基于python的理论与实践》的内容,本文语言通俗易懂,适合小白!书接上回,我们怎么做一个异或门?不知道的伙伴可以先去看看前面一篇笔记。
2024-08-31 20:22:22
1117
原创 深度学习笔记
机器学习就是使机器具备学习的能力,具体来说就是使机器具备找到函数的能力。根据要找的函数的不同,机器学习也有不同的分类。有的就是找一个能够预测未来的一个函数,函数的输出是一个数值。这个找函数的任务被叫做。有的就是让机器做选择题,人类给定选项,让机器做选择。这个任务被称为。Alphago就是一个例子。除了分类和回归,还有一种结构化学习。不是输出预测的数值,或做一个选择题,而是生成有结构的东西,比如画与文章。
2024-08-27 23:08:08
546
原创 【Datawhale AI 夏令营】第四期 大模型应用开发笔记 02 RAG代码分析
昨天介绍了RAG的流程,具体请看这篇笔记。今天将代码进行分析。本文章用到了一些AI工具来帮助我们分析代码。
2024-08-16 08:56:51
1100
原创 【Datawhale AI 夏令营】第四期 大模型应用开发笔记 01 RAG
这怎么找到呢,其实就是比较,我们生成的向量。用户查询首先会经过向量模型得到相应的向量,然后与 数据库 中所有 Chunk 的向量计算相似度,最简单的例如 余弦相似度,然后得到最相近的一系列 Chunk。我们注意到,两个箭头指向chunks,一个是用户输入的问题,一个是数据库中的documents,都被剪成了chunks。2nd Retrieval 其实是第一轮检索出来的chunks按照与用户的问题的相关程度进行排列,相关程度高的 chunks 会被优先展示,从而为用户提供更具针对性和价值的信息。
2024-08-15 00:12:32
565
原创 Datawhale X 魔塔 AI夏令营 第四期笔记2
这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。AIGC(AI-Generated Content)是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。对于技术人来说,了解AI生图的能力的玩法,可以更好地针对自己的业务进行开发和使用,甚至攻克难题开发更实用的工具。分析图片中的光源是否一致,阴影的方向是否与光源相符,是否存在不自然的光线或阴影。
2024-08-14 22:33:55
625
1
原创 #《撕掉数学书》系列之数学在冥冥之中决定了一切
我们想,如果两边同时求导,并且在x₀处导数也相同呢,或者在几何意义上来说,x₀处斜率相同,于是我们就有第二项f'(x₀)(x-x₀),而且我们满足了第一点,即x取x₀时,函数值为f(x₀)。第二项,为cosx 在0处的一阶导数,也就是零,当然我们知道,cox导数的规律是-sinx,-cosx,sinx,cosx以此循环,而在x=0处的各阶导数,就是0,-1,0,1以此循环,第n+1项有(x-x₀)的n次方,求n阶导为了是其导数为fⁿ(x₀),需要先乘以fⁿ(x₀),然后除以n的阶乘!
2024-08-11 22:05:16
701
原创 Datawhale X 魔塔 AI夏令营 第四期
然后直接点击重启内核运行所有单元就行了,大概20到30分钟跑完全部。注意还是不要自己手动一个个去运行,这样容易出错,亲身经历。尝试修改描述词(prompt="")。我根据自己喜欢的动漫《紫罗兰永恒花园》写了描述词。8月8号,我在魔塔社区创建实例,跑通baseline。开启实例将以下文字复制到终端。暑假这个夏令营没有白报!纯小白在七夕节用AI创造一个浪漫故事!关于AIGC的原理与代码,后续更新。真的是纯小白也能行!重新重启内核运行所有代码。这应该比上次会快许多。
2024-08-10 09:57:13
426
空空如也
这是一个创造智能体时出现的小问题
2024-10-08
这个符号是什么牛马?
2024-07-25
一个很难的很基础的线性代数问
2024-07-21
Ai都不会,要一点英语知识
2024-07-21
AI都不会的线性代数,要求具备英语知识?
2024-07-21
TA创建的收藏夹 TA关注的收藏夹
TA关注的人