大模型_Gsen2819的博客-优快云博客

大模型

关注

文章平均质量分 87

关注数：文章数：23 文章阅读量：21201 文章收藏量：290

作者: Gsen2819

四年开发，从0到1学习人工智能大模型，记录---------------执着的生命，令人敬畏！

展开

专栏收录文章

AI大模型从0到1记录学习大模型技术之机器学习 day60-day69

torch.randperm(n)生成从0到n-1的随机排列，类似洗牌print()print()布尔索引print()stopwords = {“的”, “是”, “而”, “由”, “，”, “。”, “、”}definit搭建模型词嵌入层→RNN→全连接层。

原创 2025-12-22 17:20:37 · 919 阅读 · 0 评论
AI大模型从0到1记录学习大模型技术之机器学习 day27-day60

机器学习概述机器学习（Machine Learning, ML）主要研究计算机系统对于特定任务的性能，逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练，使模型掌握数据所蕴含的潜在规律，进而对新输入的数据进行准确的分类或预测。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。人工智能、机器学习与深度学习。

原创 2025-06-12 17:21:15 · 1173 阅读 · 0 评论
AI大模型从0到1记录学习大模型技术之数学基础 day26

可以发现，实标量函数f(X)的梯度矩阵等于Jacobian矩阵的转置，∇_X f(X)=(D_X f(X))^T。另外，实矩阵函数F(X)的梯度矩阵也是其Jacobian矩阵的转置，∇_X F(X)=(D_X F(X))^T。当函数f的自变量在一点x_0上产生一个增量h时，函数输出值的增量∆y与自变量增量∆x的比值在∆x趋于0时的极限如果存在，即为f在x_0处的导数，记作f’(x_0)、df/dx(x_0)或〖df/dx|〗_(x=x_0 )。在微积分中，函数的二阶导数是函数导数的导数。

原创 2025-05-20 18:50:28 · 621 阅读 · 0 评论
AI大模型从0到1记录学习numpy pandas day25

第 3 章 Pandas3.1 什么是PandasPandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。

原创 2025-05-19 18:44:04 · 1617 阅读 · 0 评论
AI大模型从0到1记录学习numpy pandas day24

第 1 章环境搭建1.1 Anaconda1.1.1 什么是AnacondaAnaconda官网地址：https://www.anaconda.com/简单来说，Anaconda = Python + 包和环境管理器（Conda）+ 常用库 + 集成工具。它适合那些需要快速搭建数据科学或机器学习开发环境的用户。Anaconda和Python相当于是汽车和发动机的关系，安装Anaconda后，就像买了一台车，无需自己去安装发动机和其他零配件，而Python作为发动机提供Anaconda工作所需的内核

原创 2025-05-15 22:55:03 · 864 阅读 · 0 评论
AI大模型从0到1记录学习 mysql day23

第 1 章 MySQL概述1.1 基本概念1.1.1 数据库是什么？数据库（DB：Database）：存储数据的地方。1.1.2 为什么要用数据库？应用程序产生的数据是在内存中的，如果程序退出或者是断电了，则数据就会消失。使用数据库是为了能够永久保存数据。当然这里指的是非内存数据库。1.1.3 用普通文件存储行不行？把数据写入到硬盘上的文件中，当然可以实现持久化的目标，但是不利于后期的检索和管理等。1.1.4 MySQL、Oracle、SqlServer是什么？MySQL、Oracle、S

原创 2025-05-14 18:15:53 · 1094 阅读 · 0 评论
AI大模型从0到1记录学习 linux day22

1）Linux提供的Shell解析器有。

原创 2025-05-13 17:14:42 · 965 阅读 · 0 评论
AI大模型从0到1记录学习 linux day21

第 1 章 Linux入门1.1 概述1.2 Linux和Windows区别第 2 章 VMware、Ubuntu、Xshell和Xftp安装第 3 章 Linux文件与目录结构3.1 Linux文件Linux系统中一切皆文件。3.2 Linux目录结构 /bin是Binary的缩写, 这个目录存放着最经常使用的命令的可执行文件，本质是/usr/bin的软链接。 /sbin。

原创 2025-04-27 19:59:43 · 678 阅读 · 0 评论
AI大模型从0到1记录学习数据结构和算法 day20

在分步解决问题的过程中，当它通过尝试发现，现有的分步答案不能得到有效的正确的解答的时候，它将取消上一步甚至是上几步的计算，再通过其它的可能的分步解答再次尝试寻找问题的答案。注意到，A1×B0+A0×B1可以转换为(A1+A0)×(B1+B0)- A0×B0-A1×B1，即(A1+A0)×(B1+B0)-低位部分的乘积-高位部分的乘积，低位部分乘积和高位部分乘积可以复用，我们只需计算(A1+A0)×(B1+B0)，相较于计算A1×B0+A0×B1，减少了1次乘法计算。上升区长度+1，并清空之前的下降区长度。

原创 2025-04-24 13:51:35 · 1063 阅读 · 0 评论
AI大模型从0到1记录学习数据结构和算法 day19

依次将堆顶元素放在末尾，并重新堆化return arrprint(“排序后的数组:”, sorted_arr)复杂度分析时间复杂度其初始构建堆时间复杂度为O(n)。正式排序时，重建堆的时间复杂度为O(nlogn)。所以堆排序的总体时间复杂度为O(nlogn)。堆排序对原始记录的排序状态不敏感，因此它无论最好、最坏和平均时间复杂度都是O(nlogn)。但是与其他O(nlogn) 的排序算法（如归并排序、快速排序）相比，堆排序的常数因子较大，因此在某些情况下效率较低。空间复杂度。

原创 2025-04-16 16:48:28 · 494 阅读 · 0 评论
AI大模型从0到1记录学习数据结构和算法 day18

3.3.1 栈的概述栈（Stack）是一个线性结构，其维护了一个有序的数据列表，列表的一端称为栈顶（top），另一端称为栈底（bottom）。栈对数据的操作有明确限定，插入元素只能从栈顶进行，删除元素也只能栈顶开始逐个进行，通常将插入元素称为入栈（push），删除元素称为出栈（pop）。正是由于上述规定，栈保证了后进先出的原则（LIFO，Last-In-First-Out）。栈的底层实现既可以选择数组也可以选择链表，只要能保证后进先出的原则即可。3.3.2 栈的功能定义方法说明。

原创 2025-04-14 16:35:39 · 805 阅读 · 0 评论
AI大模型从0到1记录学习 day17

对于平均时间复杂度，是对算法的一个全面评价，因此它完整全面的反映了这个算法的性质。我们假定计算机执行算法每一个基本操作的时间是固定的一个时间单位，对于不同的机器环境而言，确切的单位时间是不同的，但是对于算法进行多少个基本操作（即花费多少时间单位）在规模数量级上却是相同的。在 Python 中，并没有像其他一些编程语言（如 C、Java）那样严格意义上的 “数组” 概念，但有多种数据结构可以用来模拟数组的功能，最常用的是列表（list），另外还有 array 模块的数组和 numpy 库的 ndarray。

原创 2025-04-12 22:50:09 · 875 阅读 · 0 评论
AI大模型从0到1记录学习 day16

第 16 章正则表达式16.1 什么是正则表达式正则表达式（regular expression，常简写为regex、regexp或re），是一种用于匹配和操作文本的强大工具，它是由一系列字符和特殊字符组成的模式，用于描述要匹配的文本模式。正则表达式可以在文本中查找、替换、提取和验证特定的模式。16.2 re模块Python的re模块提供了正则表达式匹配操作。import rere模块中提供了一些方法用于查找或处理字符串。16.2.1 searchre.search(pattern, st

原创 2025-04-10 16:18:44 · 977 阅读 · 0 评论
聚类算法 ap 聚类谱聚类

AP聚类是一种强大的聚类算法，特别适合中小规模数据集和不需要预先指定聚类数量的场景。然而，它的计算复杂度较高，不适合处理大规模数据。在实际应用中，可以根据数据特点选择合适的聚类算法。我来给你简单介绍一下 AP 聚类，也叫 Affinity Propagation 聚类（亲和传播聚类）。什么是 AP 聚类？AP 聚类是一种不需要提前指定簇数量的聚类算法。和 KMeans 这种算法不同，它通过让数据点互相“发送消息”，自动决定哪些点是簇的中心（即“代表点”或“样本代表”），最后形成不同的簇。

原创 2025-04-08 18:56:32 · 1117 阅读 · 0 评论
Attention Is All You Need 论文中英对照

注意力就是你所需要的Abstract摘要目前主流的序列转换模型都基于复杂的循环神经网络或卷积神经网络，这些模型包括编码器和解码器。表现最好的模型还通过注意力机制将编码器和解码器连接起来。我们提出了一个全新的简单网络架构——Transformer，它完全基于注意力机制，完全摒弃了循环和卷积。在两项机器翻译任务的实验中，这些模型在质量上表现更优，同时更具并行性，并且训练时间显著减少。

原创 2025-04-08 18:30:56 · 1483 阅读 · 0 评论
AI大模型从0到1记录学习 day15

try:# 请求参数，指定返回中文内容，这里使用默认的所有类型params = {‘c’: ‘a’, # 可以根据需要修改类型，a 代表动画，b 代表漫画等from_who = data[‘from_who’] if data[‘from_who’] else ‘未知’else:return {‘error’: f’请求一言网 API 失败，状态码: {status_code}‘}

原创 2025-04-08 18:28:38 · 784 阅读 · 0 评论
AI大模型从0到1记录学习 day14

第 14 章进程与线程14.1 并发与并行14.1.1 并发单个 CPU 处理多个任务。各个任务交替执行一段时间。14.1.2 并行多个 CPU 同时执行多个任务。14.2 多进程14.2.1 什么是进程进程是操作系统进行资源分配的基本单位。操作系统中一个正在运行的程序或软件就是一个进程。每个进程都有自己独立的一块内存空间。一个进程崩溃后，在保护模式下不会对其他进程产生影响。多进程是指在操作系统中同时运行多个程序。

原创 2025-04-07 19:20:46 · 620 阅读 · 0 评论
AI大模型从0到1记录学习 day12

第 12 章模块与包12.1 模块概述Python中一个以.py结尾的源文件即为一个模块（Module）。其中可以包含变量、函数和类等。通常情况下，我们把能够实现某一特定功能的代码放置在一个文件中作为一个模块。使用模块提高了代码的可维护性，也提高了代码的复用性。即编写好一个模块后，只要是实现该功能的程序，都可以导入这个模块实现。另外，使用模块也可以避免名称冲突，相同名字的函数或变量可以分别存在与不同的模块中。12.2 创建模块模块名区分大小写，且不能与Python自带的标准模块重名。

原创 2025-04-02 18:38:36 · 517 阅读 · 0 评论
AI大模型从0到1记录学习 day11

第 11 章错误和异常11.1 异常介绍Python是一门解释型语言，只有在程序运行后才会执行语法检查。所以，只有在运行或测试程序时，才会真正知道该程序能不能正常运行。Python有两种错误很容易辨认：语法错误和异常。11.1.1 语法错误程序解析时遇到的错误。例如以下程序，因缺少 : 而出现语法错误。

原创 2025-04-01 16:47:08 · 650 阅读 · 0 评论
大模型面试题 ---大模型基础概念 01 （待续）（超全更新）

3.缺乏多样性的训练数据:虽然大型语言模型能够处理大规模的数据，但如果训练数据中缺乏多样性的语言表达和语境，模型可能无法学习到足够的多样性和创造性，导致复读机问题的出现。很多垂领模型，都是在预训练型的基础上，通过针对性的指令微调，可以更好地适应最终任务和对齐用户偏好。减少内存占用:通过按需重新计算中间层，存储激活值所需的内存量显著减少，从而能够在内存有限的硬件上训练更大的模型，启用更深的模型:梯度检查点允许在不超过内存限制的情况下训练更深的模型，使其成为优化大规模 LLM 训练的有价值工具。

原创 2025-03-26 17:46:04 · 2286 阅读 · 0 评论
AI大模型从0到1记录学习 day07

3 "

原创 2025-03-26 16:52:42 · 527 阅读 · 0 评论
AI大模型从0到1记录学习 day06

list(x) 将序列转换为列表5.3 字符串String 字符串是不可变的、有序的。 字符串中元素不可修改。 字符串使用单引号、双引号或三重引号定义。 字符串中每个值都有对应的位置值，称为索引或下标，索引从起始从0开始向后逐个递增，并且从末尾从-1开始逐个向前递减。5.3.1 创建字符串5.3.2 访问字符串5.3.3 字符串相加5.3.4 字符串乘法5.3.5 检查成员是否为字符串中元素5.3.6 原始字符串。

原创 2025-03-25 16:01:18 · 813 阅读 · 0 评论
TensorFlow

它的核心概念是张量（tensors），这是多维数组的一种通用形式，可以表示各种数据类型。：TensorFlow 提供了丰富的 API 来构建各种深度学习模型，包括神经网络、卷积神经网络（CNN）、循环神经网络（RNN）等。总的来说，TensorFlow 提供了强大的工具和库，使得构建和训练复杂的机器学习模型变得更加简单和高效。张量可以是标量（0 维张量）、向量（1 维张量）、矩阵（2 维张量）以及更高维度的数组。：在 TensorFlow 中，变量是一种特殊的张量，用来存储模型参数，如权重和偏置。

原创 2025-03-24 20:59:11 · 261 阅读 · 0 评论

大模型

作者: Gsen2819

AI大模型从0到1记录学习 大模型技术之机器学习 day60-day69

AI大模型从0到1记录学习 大模型技术之机器学习 day27-day60

AI大模型从0到1记录学习 大模型技术之数学基础 day26

AI大模型从0到1记录学习numpy pandas day25

AI大模型从0到1记录学习numpy pandas day24

AI大模型从0到1记录学习 mysql day23

AI大模型从0到1记录学习 linux day22

AI大模型从0到1记录学习 linux day21

AI大模型从0到1记录学习 数据结构和算法 day20

AI大模型从0到1记录学习 数据结构和算法 day19

AI大模型从0到1记录学习 数据结构和算法 day18

AI大模型从0到1记录学习 day17

AI大模型从0到1记录学习 day16

聚类算法 ap 聚类 谱聚类

Attention Is All You Need 论文中英对照

AI大模型从0到1记录学习 day15

AI大模型从0到1记录学习 day14

AI大模型从0到1记录学习 day12

AI大模型从0到1记录学习 day11

大模型面试题 ---大模型基础概念 01 （待续）（超全更新）

AI大模型从0到1记录学习 day07

AI大模型从0到1记录学习 day06

TensorFlow

AI大模型从0到1记录学习大模型技术之机器学习 day60-day69

AI大模型从0到1记录学习大模型技术之机器学习 day27-day60

AI大模型从0到1记录学习大模型技术之数学基础 day26

AI大模型从0到1记录学习数据结构和算法 day20

AI大模型从0到1记录学习数据结构和算法 day19

AI大模型从0到1记录学习数据结构和算法 day18

聚类算法 ap 聚类谱聚类