成贤街的猫-优快云博客

原创 Life Long Learning（李宏毅）机器学习 2023 Spring HW14 (Boss Baseline)

神经网络的典型应用场景是，我们有一个固定的数据集，在其上训练并获得模型参数，然后将模型应用于特定任务而无需进一步更改模型参数。然而，在许多实际工程应用中，常见的情况是系统可以不断地获取新数据，例如 Web 应用程序中的新用户数据或自动驾驶中的新驾驶数据。这些新数据需要被纳入训练集以增强模型的性能。这被称为终身学习。人工智能终身学习面临哪些挑战？似乎通过不断更新其数据和相应的网络参数就可以实现终身学习。然而，事实并非如此简单。一个关键障碍是灾难性遗忘。

2025-01-11 20:47:03 1134

原创 Network Compression（李宏毅）机器学习 2023 Spring HW13 （Boss Baseline）

是的，对于同一个模型，结构化剪枝和非结构化剪枝在推理速度上是有差异的。在卷积神经网络中，深度可分卷积通过将传统的卷积操作分解为两个较小的操作（深度卷积和逐点卷积），有效地降低了计算量和参数数量，这正是低秩近似的一种应用。其目标是将教师模型的“知识”转移到学生模型，使得较小的模型在保持高性能的同时，在计算和内存方面更加高效。对于网络剪枝，有一个彩票假设理论，该理论指出：“密集的、随机初始化的前馈网络中包含子网络（中奖票），当这些子网络单独训练时，其测试精度可以在类似的迭代次数下达到与原始网络相当的水平。

2025-01-11 00:40:11 1028

原创 Reinforcement Learning (李宏毅) 机器学习 2023 Spring HW12 （Boss Baseline）

强化学习是一种机器学习方法，它训练智能体在环境中采取行动，以最大化累积奖励。智能体通过试错与环境互动，学习哪些行动会带来奖励（正反馈），哪些行动会导致惩罚（负反馈）。通过不断地学习和调整策略，智能体逐渐学会如何在特定环境中做出最优决策，以达到最终目标。与监督学习不同，强化学习不需要预先标注的数据，而是通过与环境的互动自主学习。强化学习的应用非常广泛，比如：游戏AI：训练AI玩各种游戏，例如围棋、Atari游戏等。机器人控制：控制机器人完成各种任务，例如行走、抓取物体等。

2025-01-08 23:26:40 1051

原创 Domain Adaptation（李宏毅）机器学习 2023 Spring HW11 （Boss Baseline）

领域适配是一种迁移学习方法，适用于源领域和目标领域数据分布不同但学习任务相同的情况。具体而言，我们在源领域（通常有大量标注数据）训练一个模型，并希望将其应用于目标领域（通常只有少量或没有标注数据）。然而，由于这两个领域的数据分布不同，模型在目标领域上的性能可能会显著下降。领域适配技术的目标是通过对模型进行适配，缩小源领域与目标领域之间的差距，从而提升模型在目标领域的表现。以数字识别为例，如果我们的源数据是灰度图像，并且在这些数据上训练模型，我们可以预期模型会取得相当不错的效果。

2025-01-08 19:15:19 1042

原创 Attack（李宏毅）机器学习 2023 Spring HW10 (Boss Baseline)

对抗攻击是指一种故意欺骗机器学习模型（尤其是深度学习模型）的技术，通过向模型提供经过细微修改的输入数据，从而导致模型做出错误的预测或分类。这些攻击利用了模型在训练和推理过程中的漏洞，从而揭示了模型在鲁棒性方面的弱点。以图像分类为例，假设我们已经训练了一个图像识别模型，可以对图像进行分类。为了攻击这个模型，我们在图像中加入一小部分几乎不可察觉的噪声。这张带噪声的图像被输入到模型中，我们期望模型将其错误分类。

2025-01-07 22:50:33 1014

原创 Explainable AI（李宏毅）机器学习 2023 Spring HW9 （Boss baseline）

及模型 [bert - based - cased] 分析以下句子： The police officer is popular with the residents because she is very generous and kind. 对于模型中 12 层，每层中的第 12 个 attention head (i.e. layer 1 head 12, layer 2 head 12, layer 3 head 12,..., layer 12 head 12)，下列哪一个功能可能存在？

2025-01-07 21:43:10 858

原创 Autoencoder（李宏毅）机器学习 2023 Spring HW8 (Boss Baseline)

自动编码器进行图像生成的核心思想是，当模型学会将图像编码为紧凑的潜在空间后，它也可以将这种表示解码，以重建或生成新图像。由于块之间的加法操作，连续块的特征图变得相似，导致学习到的新信息较少，同时一些早期块中的可重用信息在后续块中被遗忘。概率潜在空间：与普通自编码器不同，变分自编码器（VAE）学习潜在空间的概率分布，通过从分布中采样来生成新的、有意义的样本。模糊重构：由于潜在空间中引入了随机性，VAE通常比普通自编码器产生更模糊的重构，这种随机性在潜在表示上做出了平滑的折衷，从而牺牲了图像的清晰度。

2025-01-07 20:43:02 887

原创 BERT（李宏毅）机器学习 2023 Spring HW7 (Boss Baseline)

自监督学习是一种无监督学习技术，通过数据本身的结构或特征生成标签，从而使模型能够学习。与传统的监督学习需要手动标注数据不同，自监督学习不依赖人工标注的数据。相反，它通过设计任务自动从数据中创建学习信号。自监督学习的核心思想是利用输入数据本身进行监督，通过构造代理任务（也称为预训练任务），使模型能够学习数据的有用表示。这些预训练任务的目的是教会模型数据中的有价值模式或结构，而无需使用手动标注的数据。

2025-01-06 19:12:26 732

原创 Generative Model（李宏毅）机器学习 2023 Spring HW6（Boss Baseline）

而DDIM的逆向过程是确定性的，这意味着它可以跳过许多步骤，在更少的迭代中生成高质量的图像。第二个组件是生成模型，通常是扩散模型，它接收噪声和来自文本编码器的输出，生成一个中间结果，通常是图像的压缩版本。逆向过程是确定性的并且是隐式建模的，这意味着与DDPM不同，DDIM不需要在每一步进行采样，而是通过修改调度来在较少的时间步中生成图像。去噪过程从一张完全噪声的图像开始，逐步减少噪声，直到生成一张清晰的图像。生成器的目标是创造尽可能真实的数据（如图像），而判别器的任务是判断数据是真实的还是由生成器生成的。

2025-01-06 08:05:10 1426

原创 Transformer（李宏毅）机器学习 2023 Spring HW5 (Boss Baseline)

许多机器学习任务，如语音识别、机器翻译与语音翻译等，都有一个共同的特点：它们都需要将一个输入序列转换为一个输出序列，并且输入序列和输出序列的长度通常是不固定的。Seq2Seq（Sequence-to-Sequence）模型正是为了解决这类问题而设计的。Seq2Seq 模型是一种用于处理序列数据的深度学习模型，主要用于将一个输入序列转换为另一个输出序列。传统的Seq2Seq模型主要基于循环神经网络（RNN），特别是长短期记忆网络（LSTM）和门控循环单元（GRU）。。

2025-01-04 05:02:01 1060

原创 Self-Attention（李宏毅）机器学习 2023 Spring HW4 (Boss Baseline)

该方法的核心思想是在计算键和值时，引入两个线性投影矩阵。例如，在语言处理中，“狗咬人”和“人咬狗”的词嵌入是相同的，如果没有位置信息，模型就无法区分这两个句子截然不同的含义。神经网络的输出也呈现出多样性，常见的输出形式包括用于回归任务的单一输出，或者用于分类任务的类别标签，用于表示数据的特征或嵌入的向量，用于生成序列数据的序列，或者图结构等。与以往的加性间隔方法不同，本文提出的方法通过对特征和权重的归一化，确保了间隔能够有效地导致较大的角度间隔，从而增强了类别之间的区分性，进一步提高了模型的性能和稳定性。

2025-01-03 04:54:26 1162

m0_66773231的博客