深度强化学习(Deep Reinforcement Learning)
图神经网络(Graph Neural Networks, GNNs)
Transformer 一种深度学习模型
大语言模型(Large Language Models, LLMs)
人工智能
• Marvin Minsky 将其定义为让机器完成通常需要人类智能才能完成的任务的科学
机器学习(Machine Learning, ML)
• AI 的一个子集,利用数据训练模型,使系统无需显式编程即可完成任务。
常见方法:
• 监督学习:数据有明确的输入和输出。
• 无监督学习:数据没有明确标签,模型寻找数据的隐藏模式。
• 强化学习:通过奖励和惩罚学习动作。
深度学习(Deep Learning, DL)
• 机器学习的一个子集,利用多层神经网络处理复杂任务。
• 特点:需要大量数据和算力,能够自动提取特征。
机器学习的分类
1. 监督学习(Supervised Learning):
• 输入和输出数据均已知,模型根据输入数据预测输出标签。
• 例子:图像分类、回归分析。
2. 无监督学习(Unsupervised Learning):
• 输入数据已知,但没有明确的输出标签,模型需要从数据中发现模式。
• 例子:聚类、降维。
3. 强化学习(Reinforcement Learning):
• 系统与环境交互,通过获得奖励最大化长期收益。
• 例子:游戏 AI、机器人路径规划。
半监督学习 (Semi-Supervised Learning)
• 数据集中包含标注数据和未标注数据的混合。
• 标注数据用于指导学习,未标注数据提供额外信息(如数据分布)。
• 特点:
• 减少标注需求,结合监督和无监督学习的优点。
自监督学习 (Self-Supervised Learning)
自监督是一种无监督学习的形式,数据为自身提供监督信号。
•