自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【Datawhale AI夏令营 CV】 Task 3

在调试的过程中学会看训练日志至关重要。路径为 “runs/detect/…”,每次的训练结果会产生一个train文件,包括了如下内容。weights文件:模型权重 (.pt 文件), 训练过程中保存的模型权重,可以用于后续的测试或继续训练,分为 best.pt 和 last.pt在训练过程中和训练完成后,都可以查看训练日志。可以优先查看results.png,图像中包含的参数解释如下。缩写 作用描述。

2024-08-31 23:59:16 996 1

原创 【Datawhale X 李宏毅苹果书 AI夏令营】 Task 2

在训练神经网络的过程中,经常会遇到损失函数不再减少的情况,尽管此时梯度仍然很大。这意味着模型可能停留在一个非临界点,如鞍点或局部最小值之外的地方。使用固定学习率的传统梯度下降方法可能在某些情况下导致训练陷入困境,尤其是在面对具有挑战性的优化地形时,如在陡峭的山谷或平坦的高原上。

2024-08-31 21:28:34 1588

原创 【Datawhale AI夏令营 CV】 Task 2

物体检测是计算机视觉中的一个核心任务,其目的是识别和定位图像或视频帧中的物体。这项技术被广泛应用于诸多领域,包括但不限于自动驾驶、安防监控、医学影像分析、无人机技术以及增强现实/虚拟现实(AR/VR)。下面是对物体检测流程的一些关键概念和步骤的详细说明:输入特征提取候选区域生成区域分类与边界框回归非极大值抑制 (Non-Maximum Suppression, NMS)

2024-08-29 21:58:01 859

原创 【Datawhale X 李宏毅苹果书 AI夏令营】 Task 1

大的批量跟小的批量的训练准确率(accuracy)差不多,但就算是在训练的时候结果差不多,测试的时候,大的批量比小的批量差,代表过拟合。(从高维的角度考虑低维的问题)下一步的方向是梯度的方向加上前一步的方向,不过因为前一步正好是0,所以更新的方向跟原来的梯度下降是相同的。实际上在计算梯度的时候,并不是对所有数据的损失L 计算梯度,而是把所有的数据分成一个一个的批量(batch),如图所示。后,再计算一次梯度,再往梯度的反方向,再更新一次参数,到了新的位置以后再计算一次梯度,再往梯度的反方向去更新参数。

2024-08-27 18:31:55 1940

原创 【Datawhale AI夏令营 CV】 Task 1

这是一个城市管理领域的赛题,具体来说是在城市监控视频中自动检测和分类各种违规行为的智能识别系统开发竞赛。这个赛题旨在解决城市治理中由于人力不足和效率低下导致的传统管理模式难以应对的问题。具体地,它要求开发一套能够自动检测城市中诸如机动车违停、非机动车违停、占道经营等违规行为的智能系统。该系统通过分析摄像头捕获的视频流来识别这些违规行为,并及时通知相关部门采取措施,从而提高城市管理的效率和质量。

2024-08-26 20:26:22 1931

原创 【Datawhale X 魔塔 AI 夏令营】 Task3 笔记

与仅使用文本的旧方法不同,GLIGEN允许您在描述中添加额外的细节,称为基准输入(grounding inputs),从而使您对图像的最终组成有更多的控制。是GUI的一种,是基于节点工作的用户界面,主要用于操作图像的生成技术,ComfyUI 的特别之处在于它采用了一种模块化的设计,把图像生成的过程分解成了许多小的步骤,每个步骤都是一个节点。Clip Drop:(官方在线)提供文字去除、北京去除与替换、放大、重新打光、物体清除、草图生成、图像变体与扩展、新模型SDXL生成等10多项功能。

2024-08-17 21:03:04 720

原创 【Datawhale X 魔塔 AI 夏令营】 Task 2 笔记

OpenAI 推出DALL-E模型(一个深度学习算法模型,是GPT-3 语言处理模型的一个衍生版本),能直接从文本提示“按需创造”风格多样的图形设计。(DALL-E和DALL-E 2都不是直接基于CNN构建的,而是分别采用了基于Transformer的架构和扩散模型来实现从文本到图像的生成任务。技术报告链接:https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf。吴恩达训练出的能生成“猫脸”的模型。

2024-08-13 15:03:58 992

原创 【Datawhale AI夏令营-大模型应用全栈开发】 Task 1 笔记

大模型是基于语言模型的演化,特别是大型预训练模型,其核心目标是提高语言理解和生成的能力。统计语言模型(SLM):利用马尔可夫假设,通过𝑛元模型进行语言建模。神经语言模型(NLM):基于神经网络,如循环神经网络(RNN),通过学习上下文相关的词表示(词嵌入)来建模。预训练语言模型(PLM):使用大量无标注数据进行预训练,再通过微调适应具体任务(如BERT、GPT系列)。大语言模型(LLM):强调通过扩展法则提升模型性能,展现出涌现能力(如GPT-3、ChatGPT)。

2024-08-11 23:45:00 500

原创 【Datawhale X 魔塔 AI 夏令营】 Task 1 笔记

图片来自Task 1学习手册。

2024-08-11 23:29:01 646

原创 [DEEPFAKE & Datawhale AI 夏令营] TASK3 笔记

数据增强的优势:数据增强(Data Augmentation)是一种在训练集上生成新样本的方法,计算机视觉(CV)和自然语言处理 (NLP) 模型中经常使用数据增强,旨在通过创造变体来增加训练数据的多样性,这些变体保留了原始数据的主要信息,但呈现出不同的表达形式。:数据增强通过生成额外的训练样本,使模型能够在更多变体下进行学习,这有助于模型在未见过的数据上表现得更好。:通过增加训练数据量,模型有更少的机会对特定训练实例产生过度依赖,从而降低了过拟合的风险。

2024-07-20 22:44:35 859

原创 [DEEPFAKE & Datawhale AI 夏令营] TASK2 笔记

迁移学习是一种机器学习技术,它将已在一个任务上学到的知识(如模型参数、特征表示等)应用到另一个相关任务上。

2024-07-16 23:13:30 653

原创 [DEEPFAKE & Datawhale AI 夏令营] TASK1 笔记

在第一阶段,主办方将发布训练集和验证集。参赛者将使用训练集 (train_label.txt) 来训练模型,而验证集 (val_label.txt) 仅用于模型调优。文件的每一行包含两个部分,分别是图片文件名和标签值(

2024-07-14 10:40:44 440 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除