Baidu_AI_Studio_Learning_1

本文介绍了深度学习的基础概念和发展历程,探讨了从低级特征到高级特征的抽象过程。此外,还详细解释了机器学习的不同类型,包括监督学习、非监督学习、半监督学习和增强学习,并介绍了神经网络的基本结构与训练方法。
部署运行你感兴趣的模型镜像

借鉴于百度的飞桨平台提供的教程
https://aistudio.baidu.com/aistudio/index

深度学习及其发展历程

图灵测试(人和机器作为受试者,作答后,如果考官不能分辨任何机器的回答,那么机器通过图灵测试(这个测试不局限于考试))

发现人的视觉处理是分级的
一种从低层级到高层级的模式

深度学习
低层次特征 - - - - (组合) - - ->抽象的高层特征

机器学习
从大量历史数据中学习规律,从而对新的样本做反应

人工智能
人工智能是计算机科学的一个分支,研究计算机中智能行为的仿真。
每当一台机器根据一组预先定义的解决问题的规则来完成任务时,这种行为就被称为人工智能。
人工智能是一个概括性术语,涵盖了从高级算法到实际机器人的所有内容。

机器学习
是指计算机使用大数据集而不是硬编码规则来学习的能力。
机器学习是人工智能的一个子集;更为具体地说,它只是一种实现AI的技术

监督式学习
输入并且给出预期结果
在这个IO中重新调整自己的计算,在数据集迭代上完善AI(ep:天气预报)
常见任务是分类与回归
分类:比如青年人和老年人的头发颜色和步行速度,对数据进行聚合,归成一类。
回归:拟合对于数据集的趋势预测。
代价在于,当数据很多,打标签会非常复杂。

非监督式学习
是利用既不分类也不标记的信息进行机器学习,并允许算法在没有指导的情况下对这些信息进行操作。
进行逻辑分类。
根据相似性、模式和差异性对未排序的信息进行分组,而不需要事先对数据进行处理
例子是亚马逊等电子商务网站的行为预测AI。
一种算法被称为“聚类”将相似的对象分到同一个组
一种算法被称为“相关”根据自己发现的相似性创建if/then规则
半监督学习:
少量的标记数据和大量未标记数据
假设:
聚类
流形

增强学习:外部环境只给出评价信息而非正确答案
学习机通过强化受奖励的动作来改善自身性能。

多任务学习:
多个相关任务放在一起学习。

深度学习是一种机器学习方法 ,
它允许我们训练人工智能来预测输出,给定一组输入(指传入或传出计算机的信息)。
监督学习和非监督学习都可以用来训练人工智能。

神经网络是一组粗略模仿人类大脑,用于模式识别的算法。
在这里插入图片描述
神经元分为 Input ;Hidden; Output 三层
输入层:输入数据
隐藏层:计算数据
输出层:特定输出
权重: weights 标记某特征的重要程度
在这里插入图片描述
每个神经元都有一个激活函数。它主要是一个根据输入传递输出的函数。 当一组输入数据通过神经网络中的所有层时,最终通过输出层返回输出数据。

训练
大量的计算能力,大量的数据可以训练我们的AI
重点!!
训练的重点是输入一个数据集合
在遍历这个数据集合后

可以生成一个函数来衡量AI输出与实际输出的差异
叫做成本函数
AI输出结果与数据集结果一致时,成本函数为0

降低成本函数
梯度下降方法
梯度的衡量是
稍微改变输入值,看输出值的变化大小
在这里插入图片描述
梯度下降法是一种求函数最小值的方法, 它通过每次数据集迭代之后优化模型的权重来训练模型。通过计算某一权重集下成本函数的梯度,可以看出最小值的梯度方向。

所以要多次遍历数据集

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

### 提高百度飞桨 AIStudio 的 GPU 利用率的方法 在使用百度飞桨 AI Studio 进行深度学习模型训练时,如果遇到 GPU 利用率较低的情况,可以通过以下几个方面优化: #### 1. **确认硬件配置** 确保当前运行环境中已正确启用 GPU。通过设置 `use_cuda` 参数为 `True` 并指定 CUDA 设备位置来验证是否成功加载 GPU 资源[^2]。 ```python import paddle import paddle.fluid as fluid use_cuda = True # 设置为 True 表示使用 GPU place = fluid.CUDAPlace(0) if use_cuda else fluid.CPUPlace() ``` #### 2. **调整数据加载方式** 为了减少 I/O 瓶颈对 GPU 性能的影响,建议优化数据加载流程。具体措施包括: - 使用 `pin_memory=True` 和适当增加 `num_workers` 数量以加速数据传输至显存的过程。 - 如果多线程未显著提升性能,可尝试根据服务器 CPU 核心数量动态调整 `num_workers` 值[^5]。 ```python from multiprocessing import cpu_count dataloader = paddle.io.DataLoader( dataset, batch_size=batch_size, shuffle=True, num_workers=cpu_count(), # 动态分配 worker 数量 pin_memory=True # 启用 pinned memory 加速数据拷贝 ) ``` #### 3. **合理设置 Batch Size** 增大批量大小能够有效提高 GPU 占用率,但需注意内存限制。过大的批尺寸可能导致显存不足而中断训练过程。因此应综合考虑模型复杂度与可用资源之间的平衡关系[^1]。 #### 4. **检查代码实现细节** 某些情况下,由于框架内部机制或者特定算子效率低下也会造成整体计算时间延长从而影响实际吞吐表现。此时可以借助 profiling 工具分析瓶颈所在并针对性改进算法设计或替换更高效的替代方案[^3]。 #### 5. **利用混合精度训练技术** 采用半精度浮点数(FP16)代替单精度(Single Precision FP32),不仅减少了存储需求还能加快运算速度同时维持相近水平的数值稳定性。 ```python optimizer = fluid.optimizer.AdamOptimizer(learning_rate=lr) if amp: optimizer = fluid.contrib.mixed_precision.decorate(optimizer, init_loss_scaling=128.) ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值