
人工智能学习笔记
文章平均质量分 93
个人学历路径记录分享
DreamBoy@
Forever younger , Always learn.
展开
-
Transformer《Attention is all you need》
本文介绍了Transformer模型,这是一种基于自注意力机制的深度学习架构,彻底改变了序列建模方式。研究显示,Transformer摒弃了传统RNN和CNN结构,仅依赖多头自注意力机制,在机器翻译任务中表现卓越。实验表明,该模型在WMT2014英德翻译任务上达到28.4 BLEU值,英法任务上取得41.8 BLEU值,且训练效率显著提升。模型优势包括:计算并行化能力强、长距离依赖捕捉能力优异、训练速度比循环网络快。论文还验证了Transformer在英语成分句法分析任务中的泛化能力,其表现优于传统序列模型原创 2025-05-29 16:05:21 · 656 阅读 · 0 评论 -
OpenManus + DeepSeek 如何使用
安装Anaconda(详细)_anaconda安装教程-优快云博客。DeepSeek API 申请与使用-优快云博客。Anaconda 教程 | 菜鸟教程。Git 安装配置 | 菜鸟教程。原创 2025-04-18 13:42:30 · 1016 阅读 · 0 评论 -
DeepSeek API 申请与使用
1.进入官网DeepSeek | 深度求索2.进入API开放平台3.充值(不充值无法使用)4.用量信息查询,查询请求次数,与对应费用。原创 2025-04-18 12:14:53 · 997 阅读 · 0 评论 -
人工智能通识速览(Part5. 大语言模型)
1.NLP自然语言处理(Natural Language Processing, NLP)是人工智能领域的一个重要分支,专注于研究 计算机如何理解、生成和处理人类语言。它的目标是让机器能够像人类一样“读懂”文本或语音,并执 行翻译、问答、摘要等任务。大模型不仅仅是模型规模庞大,也涵盖了训练数据规模庞大,以及由此衍生出的模型能力的强大。截止 2024 年 6 月,国内外已经见证了超过百种大语言模型的诞生,这些大语言模型在学术界和工业界 均产生了深远的影响。描述了在。原创 2025-04-07 22:28:50 · 544 阅读 · 0 评论 -
人工智能通识速览(Part4. 评估指标)
PR 曲线以精确率(Precision)为纵坐标,召回率(Recall)为横坐标。在不同的分类阈值下,模型会产生不同的精确率和召回率,将这些点连接起来就形成了 PR 曲线。精确率是指预测为正例的样本中真正正例的比例,召回率是指真实正例中被预测为正例的比例。PR 曲线展示了模型在精确率和召回率之间的权衡关系,曲线上的每个点代表了模型在某个特定阈值下的性能表现。原创 2025-04-07 21:56:23 · 902 阅读 · 0 评论 -
人工智能通识速览(Part3. 强化学习)
强化学习是机器学习中的一个重要领域,它涉及智能体(agent)如何在环境中采取一系列行动,以最大化累积奖励。:是一个能够感知环境并采取行动的实体,如机器人、自动驾驶汽车或游戏中的角色等。:智能体所处的外部世界,它会根据智能体的行动产生相应的反馈,包括奖励信号和新的状态。:描述环境在某一时刻的信息,智能体根据当前状态来决定采取何种行动。:智能体可以执行的操作,例如在游戏中移动、跳跃,机器人的前进、转弯等。:环境给予智能体的反馈信号,用于衡量智能体的行动在实现目标方面的好坏程度。原创 2025-04-07 21:08:39 · 876 阅读 · 0 评论 -
人工智能通识速览(Part2. 神经网络)
本文主要包含神经网络相关内容,包含参数优化、激活函数、损失函数、常见的神经网络(包含经典的MLP, 图像领域经典的VGG,ResNet,Yolo,transformer及其变体bert,gpt等, 以及GAN网络结构)原创 2025-03-30 23:11:41 · 927 阅读 · 0 评论 -
人工智能文献翻译训练v2
人工智能文献翻译v2(AlexNet, COT, DeepSeek)原创 2025-03-26 09:22:32 · 675 阅读 · 0 评论 -
人工智能通识速览.(Part1.机器学习)
本文主要包含,机器学习概述,正则化方法,以及常用的机器学的算法,包含集成学习、回归模型,支持向量机、树模型家族,聚类模型等。原创 2025-03-25 20:55:24 · 1067 阅读 · 0 评论 -
人工智能文献翻译训练v1
人工智能相关文献翻译训练v1( Meta - learning,Transformer )原创 2025-03-24 21:38:54 · 1085 阅读 · 0 评论