AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）

最新推荐文章于 2024-12-22 23:38:57 发布

shiter

最新推荐文章于 2024-12-22 23:38:57 发布

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏：自然语言处理实战入门【Generative AI重制版】人工智能系统解决方案与技术架构 AI赋能行业实战：‌最佳实践与落地案例深度解析！‌ 文章标签：人工智能 AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wangyaninglm/article/details/131036061

AI赋能行业实战：‌最佳实践与落地案例深度解析！‌ 同时被 3 个专栏收录

217 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

人工智能系统解决方案与技术架构

212 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

自然语言处理实战入门【Generative AI重制版】

169 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

GAN 模型与强化学习
- 强化学习
- 生成式对抗网络 ( Generative Adversarial Nets， GAN)
VAE
扩散模型
- 扩散
- 逆扩散
参考文献与学习路径

在这里插入图片描述

GAN 模型与强化学习

强化学习

Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agents ought to take actions in an environment so as to maximize some notion of cumulative reward. （强化学习是机器学习领域之一，受到行为心理学的启发，主要关注智能体如何在环境中采取不同的行动，以最大限度地提高累积奖励。）

强化学习主要由智能体（Agent）、环境（Environment）、状态（State）、动作（Action）、奖励（Reward）组成。智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信号（正奖励或者负奖励）。随后，智能体根据新的状态和环境反馈的奖励，按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。

智能体通过强化学习，可以知道自己在什么状态下，应该采取什么样的动作使得自身获得最大奖励。由于智能体与环境的交互方式与人类与环境的交互方式类似，可以认为强化学习是一套通用的学习框架，可用来解决通用人工智能的问题。因此强化

了解本专栏

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shiter 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。