
大模型
文章平均质量分 86
Gsen2819
四年开发,从0到1学习人工智能大模型,记录---------------执着的生命,令人敬畏!
展开
-
AI大模型从0到1记录学习 数据结构和算法 day20
在分步解决问题的过程中,当它通过尝试发现,现有的分步答案不能得到有效的正确的解答的时候,它将取消上一步甚至是上几步的计算,再通过其它的可能的分步解答再次尝试寻找问题的答案。注意到,A1×B0+A0×B1可以转换为(A1+A0)×(B1+B0)- A0×B0-A1×B1,即(A1+A0)×(B1+B0)-低位部分的乘积-高位部分的乘积,低位部分乘积和高位部分乘积可以复用,我们只需计算(A1+A0)×(B1+B0),相较于计算A1×B0+A0×B1,减少了1次乘法计算。上升区长度+1,并清空之前的下降区长度。原创 2025-04-24 13:51:35 · 895 阅读 · 0 评论 -
AI大模型从0到1记录学习 数据结构和算法 day19
依次将堆顶元素放在末尾,并重新堆化return arrprint(“排序后的数组:”, sorted_arr)复杂度分析时间复杂度其初始构建堆时间复杂度为O(n)。正式排序时,重建堆的时间复杂度为O(nlogn)。所以堆排序的总体时间复杂度为O(nlogn)。堆排序对原始记录的排序状态不敏感,因此它无论最好、最坏和平均时间复杂度都是O(nlogn)。但是与其他O(nlogn) 的排序算法(如归并排序、快速排序)相比,堆排序的常数因子较大,因此在某些情况下效率较低。空间复杂度。原创 2025-04-16 16:48:28 · 425 阅读 · 0 评论 -
AI大模型从0到1记录学习 数据结构和算法 day18
3.3.1 栈的概述栈(Stack)是一个线性结构,其维护了一个有序的数据列表,列表的一端称为栈顶(top),另一端称为栈底(bottom)。栈对数据的操作有明确限定,插入元素只能从栈顶进行,删除元素也只能栈顶开始逐个进行,通常将插入元素称为入栈(push),删除元素称为出栈(pop)。正是由于上述规定,栈保证了后进先出的原则(LIFO,Last-In-First-Out)。栈的底层实现既可以选择数组也可以选择链表,只要能保证后进先出的原则即可。3.3.2 栈的功能定义方法 说明。原创 2025-04-14 16:35:39 · 709 阅读 · 0 评论 -
AI大模型从0到1记录学习 day17
对于平均时间复杂度,是对算法的一个全面评价,因此它完整全面的反映了这个算法的性质。我们假定计算机执行算法每一个基本操作的时间是固定的一个时间单位,对于不同的机器环境而言,确切的单位时间是不同的,但是对于算法进行多少个基本操作(即花费多少时间单位)在规模数量级上却是相同的。在 Python 中,并没有像其他一些编程语言(如 C、Java)那样严格意义上的 “数组” 概念,但有多种数据结构可以用来模拟数组的功能,最常用的是列表(list),另外还有 array 模块的数组和 numpy 库的 ndarray。原创 2025-04-12 22:50:09 · 806 阅读 · 0 评论 -
AI大模型从0到1记录学习 day16
第 16 章 正则表达式16.1 什么是正则表达式正则表达式(regular expression,常简写为regex、regexp或re),是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。正则表达式可以在文本中查找、替换、提取和验证特定的模式。16.2 re模块Python的re模块提供了正则表达式匹配操作。import rere模块中提供了一些方法用于查找或处理字符串。16.2.1 searchre.search(pattern, st原创 2025-04-10 16:18:44 · 874 阅读 · 0 评论 -
聚类算法 ap 聚类 谱聚类
AP聚类是一种强大的聚类算法,特别适合中小规模数据集和不需要预先指定聚类数量的场景。然而,它的计算复杂度较高,不适合处理大规模数据。在实际应用中,可以根据数据特点选择合适的聚类算法。我来给你简单介绍一下 AP 聚类,也叫 Affinity Propagation 聚类(亲和传播聚类)。什么是 AP 聚类?AP 聚类是一种不需要提前指定簇数量的聚类算法。和 KMeans 这种算法不同,它通过让数据点互相“发送消息”,自动决定哪些点是簇的中心(即“代表点”或“样本代表”),最后形成不同的簇。原创 2025-04-08 18:56:32 · 831 阅读 · 0 评论 -
Attention Is All You Need 论文中英对照
注意力就是你所需要的Abstract摘要目前主流的序列转换模型都基于复杂的循环神经网络或卷积神经网络,这些模型包括编码器和解码器。表现最好的模型还通过注意力机制将编码器和解码器连接起来。我们提出了一个全新的简单网络架构——Transformer,它完全基于注意力机制,完全摒弃了循环和卷积。在两项机器翻译任务的实验中,这些模型在质量上表现更优,同时更具并行性,并且训练时间显著减少。原创 2025-04-08 18:30:56 · 770 阅读 · 0 评论 -
AI大模型从0到1记录学习 day15
try:# 请求参数,指定返回中文内容,这里使用默认的所有类型params = {‘c’: ‘a’, # 可以根据需要修改类型,a 代表动画,b 代表漫画等from_who = data[‘from_who’] if data[‘from_who’] else ‘未知’else:return {‘error’: f’请求一言网 API 失败,状态码: {status_code}‘}原创 2025-04-08 18:28:38 · 704 阅读 · 0 评论 -
AI大模型从0到1记录学习 day14
第 14 章 进程与线程14.1 并发与并行14.1.1 并发单个 CPU 处理多个任务。各个任务交替执行一段时间。14.1.2 并行多个 CPU 同时执行多个任务。14.2 多进程14.2.1 什么是进程进程是操作系统进行资源分配的基本单位。操作系统中一个正在运行的程序或软件就是一个进程。每个进程都有自己独立的一块内存空间。一个进程崩溃后,在保护模式下不会对其他进程产生影响。多进程是指在操作系统中同时运行多个程序。原创 2025-04-07 19:20:46 · 559 阅读 · 0 评论 -
AI大模型从0到1记录学习 day12
第 12 章 模块与包12.1 模块概述Python中一个以.py结尾的源文件即为一个模块(Module)。其中可以包含变量、函数和类等。通常情况下,我们把能够实现某一特定功能的代码放置在一个文件中作为一个模块。使用模块提高了代码的可维护性,也提高了代码的复用性。即编写好一个模块后,只要是实现该功能的程序,都可以导入这个模块实现。另外,使用模块也可以避免名称冲突,相同名字的函数或变量可以分别存在与不同的模块中。12.2 创建模块模块名区分大小写,且不能与Python自带的标准模块重名。原创 2025-04-02 18:38:36 · 445 阅读 · 0 评论 -
AI大模型从0到1记录学习 day11
第 11 章 错误和异常11.1 异常介绍Python是一门解释型语言,只有在程序运行后才会执行语法检查。所以,只有在运行或测试程序时,才会真正知道该程序能不能正常运行。Python有两种错误很容易辨认:语法错误和异常。11.1.1 语法错误程序解析时遇到的错误。例如以下程序,因缺少 : 而出现语法错误。原创 2025-04-01 16:47:08 · 584 阅读 · 0 评论 -
大模型面试题 ---大模型基础概念 01 (待续)(超全更新)
3.缺乏多样性的训练数据:虽然大型语言模型能够处理大规模的数据,但如果训练数据中缺乏多样性的语言表达和语境,模型可能无法学习到足够的多样性和创造性,导致复读机问题的出现。很多垂领模型,都是在预训练型的基础上,通过针对性的指令微调,可以更好地适应最终任务和对齐用户偏好。减少内存占用:通过按需重新计算中间层,存储激活值所需的内存量显著减少,从而能够在内存有限的硬件上训练更大的模型,启用更深的模型:梯度检查点允许在不超过内存限制的情况下训练更深的模型,使其成为优化大规模 LLM 训练的有价值工具。原创 2025-03-26 17:46:04 · 1339 阅读 · 0 评论 -
AI大模型从0到1记录学习 day07
3 "原创 2025-03-26 16:52:42 · 468 阅读 · 0 评论 -
AI大模型从0到1记录学习 day06
list(x) 将序列转换为列表5.3 字符串String 字符串是不可变的、有序的。 字符串中元素不可修改。 字符串使用单引号、双引号或三重引号定义。 字符串中每个值都有对应的位置值,称为索引或下标,索引从起始从0开始向后逐个递增,并且从末尾从-1开始逐个向前递减。5.3.1 创建字符串5.3.2 访问字符串5.3.3 字符串相加5.3.4 字符串乘法5.3.5 检查成员是否为字符串中元素5.3.6 原始字符串。原创 2025-03-25 16:01:18 · 769 阅读 · 0 评论 -
TensorFlow
它的核心概念是张量(tensors),这是多维数组的一种通用形式,可以表示各种数据类型。:TensorFlow 提供了丰富的 API 来构建各种深度学习模型,包括神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等。总的来说,TensorFlow 提供了强大的工具和库,使得构建和训练复杂的机器学习模型变得更加简单和高效。张量可以是标量(0 维张量)、向量(1 维张量)、矩阵(2 维张量)以及更高维度的数组。:在 TensorFlow 中,变量是一种特殊的张量,用来存储模型参数,如权重和偏置。原创 2025-03-24 20:59:11 · 213 阅读 · 0 评论