自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 聚类算法 ap 聚类 谱聚类

AP聚类是一种强大的聚类算法,特别适合中小规模数据集和不需要预先指定聚类数量的场景。然而,它的计算复杂度较高,不适合处理大规模数据。在实际应用中,可以根据数据特点选择合适的聚类算法。我来给你简单介绍一下 AP 聚类,也叫 Affinity Propagation 聚类(亲和传播聚类)。什么是 AP 聚类?AP 聚类是一种不需要提前指定簇数量的聚类算法。和 KMeans 这种算法不同,它通过让数据点互相“发送消息”,自动决定哪些点是簇的中心(即“代表点”或“样本代表”),最后形成不同的簇。

2025-04-08 18:56:32 389

原创 Attention Is All You Need 论文中英对照

注意力就是你所需要的Abstract摘要目前主流的序列转换模型都基于复杂的循环神经网络或卷积神经网络,这些模型包括编码器和解码器。表现最好的模型还通过注意力机制将编码器和解码器连接起来。我们提出了一个全新的简单网络架构——Transformer,它完全基于注意力机制,完全摒弃了循环和卷积。在两项机器翻译任务的实验中,这些模型在质量上表现更优,同时更具并行性,并且训练时间显著减少。

2025-04-08 18:30:56 488

原创 AI大模型从0到1记录学习 day15

try:# 请求参数,指定返回中文内容,这里使用默认的所有类型params = {‘c’: ‘a’, # 可以根据需要修改类型,a 代表动画,b 代表漫画等from_who = data[‘from_who’] if data[‘from_who’] else ‘未知’else:return {‘error’: f’请求一言网 API 失败,状态码: {status_code}‘}

2025-04-08 18:28:38 452

原创 AI大模型从0到1记录学习 day14

第 14 章 进程与线程14.1 并发与并行14.1.1 并发单个 CPU 处理多个任务。各个任务交替执行一段时间。14.1.2 并行多个 CPU 同时执行多个任务。14.2 多进程14.2.1 什么是进程进程是操作系统进行资源分配的基本单位。操作系统中一个正在运行的程序或软件就是一个进程。每个进程都有自己独立的一块内存空间。一个进程崩溃后,在保护模式下不会对其他进程产生影响。多进程是指在操作系统中同时运行多个程序。

2025-04-07 19:20:46 497

原创 AI大模型从0到1记录学习 day13

第 13 章 Python高级语法13.1 浅拷贝与深拷贝 直接赋值:对象的引用(别名),不产生拷贝。 浅拷贝:拷贝父对象,不会拷贝对象的内部的子对象。拷贝后只有第一层是独立的。 深拷贝:完全拷贝了父对象及其子对象。拷贝后所有层都是独立的。13.1.1 如何浅拷贝 切片操作(如 [:])。 使用工厂函数(如 list() / set())。 使用 copy 模块的 copy() 函数。13.1.2 案例。

2025-04-03 17:11:17 940

原创 AI大模型从0到1记录学习 day12

第 12 章 模块与包12.1 模块概述Python中一个以.py结尾的源文件即为一个模块(Module)。其中可以包含变量、函数和类等。通常情况下,我们把能够实现某一特定功能的代码放置在一个文件中作为一个模块。使用模块提高了代码的可维护性,也提高了代码的复用性。即编写好一个模块后,只要是实现该功能的程序,都可以导入这个模块实现。另外,使用模块也可以避免名称冲突,相同名字的函数或变量可以分别存在与不同的模块中。12.2 创建模块模块名区分大小写,且不能与Python自带的标准模块重名。

2025-04-02 18:38:36 434

原创 ML 聚类算法 dbscan|| OPTICS|mean-shift

是一种基于密度的聚类算法,类似于,但它可以处理不同密度的数据集,并且不需要预先指定聚类半径(epsOPTICS 通过生成一个(Reachability Plot)来描述数据点的聚类结构。

2025-04-01 21:05:12 371

原创 AI大模型从0到1记录学习 day11

第 11 章 错误和异常11.1 异常介绍Python是一门解释型语言,只有在程序运行后才会执行语法检查。所以,只有在运行或测试程序时,才会真正知道该程序能不能正常运行。Python有两种错误很容易辨认:语法错误和异常。11.1.1 语法错误程序解析时遇到的错误。例如以下程序,因缺少 : 而出现语法错误。

2025-04-01 16:47:08 575

原创 AI大模型从0到1记录学习 day10

第 10 章 面相对象案例:愤怒的小鸟10.1 游戏背景在这个模拟的愤怒的小鸟游戏世界里,绿色的小猪偷走了小鸟们的蛋,这引发了小鸟们的愤怒,它们决定展开反击。每只小鸟都具有独特的颜色,并且各自拥有不同的技能,玩家需要操控这些小鸟,利用它们的技能去攻击小猪们建造的各种障碍物,从而达成击败小猪、夺回鸟蛋的目标。10.2 类的设计思路10.2.1 Birds 基类1)设计目的作为所有小鸟类的基类,它定义了小鸟的通用属性和行为,为后续具体小鸟类的扩展提供基础框架,体现了面向对象编程中的抽象和封装思想。

2025-03-31 16:06:43 361

原创 AI大模型从0到1记录学习 day09

class C:f = f18.8.5 特殊方法方法名中有两个前缀下划线和两个后缀下划线的方法为特殊方法,也叫魔法方法。上文提到的init() 就是一个特殊方法。这些方法会在进行特定的操作时自动被调用。几个常见的特殊方法:1)new()对象实例化时第一个调用的方法。2)init()类的初始化方法。3)del()对象的销毁器,定义了当对象被垃圾回收时的行为。使用 del xxx 时不会主动调用del() ,除非此时引用计数==0。4)str()

2025-03-29 17:04:30 860

原创 ML算法数学概念

交叉熵损失是衡量模型预测分布与真实分布之间差异的有效工具,尤其在分类问题中应用广泛。它的核心思想是通过惩罚低概率的预测来优化模型,使其输出的概率分布尽可能接近真实标签的分布。

2025-03-29 11:12:43 741

原创 AI大模型从0到1记录学习 day08

3 "def dog(name:str, age:(1, 99), species:‘狗狗的品种’) -> tuple:print(dog.如上,可以使用:对参数逐个进行注释,注释内容可以是任何形式,比如参数的类型、作用、取值范围等等,返回值使用->标注,所有的注释都会保存至函数的属性。查看这些注释可以通过自定义函数的特殊属性__annotations__获取,结果会以字典的形式返回,另外,使用函数注释并不影响默认参数的使用。

2025-03-28 20:38:51 890

原创 机器学习算法

1KMeans聚类什么是聚类任务1无监督机器学习的一种2目标将已有数据根据相似度划分到不同的簇3簇内样本彼此之间越相似,不同簇的样本之间越不相似,就越好为什么叫KMeans聚类1也可以叫K均值聚类2K是最终簇数量,它是超参数,需要预先设定3在算法计算中会涉及到求均值无监督机器学习也是机器学习是机器学习就涉及到模型求解KMeans流程举例随机选择K个簇中心点12样本被分配到离其最近的中心点34。

2025-03-27 17:12:02 406

原创 机器学习算法-------->001KMeans聚类<--------(图片版在链接)

例如,统计两部剧的用户观看行为,用户A的观看向量为(0, 1),用户B为(1,0);事实上,我们随机初始化选择了不同的初始中心点,我们或许会获得不同的结果,就是所谓的收敛到不同的局部最优;改变聚类数K,然后进行聚类,计算损失函数,拐点处即为推荐的聚类数 (即通过此点后,聚类数的增大也不会对损失函数的下降带来很大的影响,所以会选择拐点)如果向量的模长是经过归一化的,可以理解为此时向量被投影到了一个长度为1的球面上,这时欧氏距离和余弦距离有着单调的关系,其中 表示欧氏距离, 表示余弦相似度, 表示余弦距离;

2025-03-27 16:58:24 346

原创 机器学习算

1KMeans聚类什么是聚类任务1无监督机器学习的一种2目标将已有数据根据相似度划分到不同的簇3簇内样本彼此之间越相似,不同簇的样本之间越不相似,就越好为什么叫KMeans聚类1也可以叫K均值聚类2K是最终簇数量,它是超参数,需要预先设定3在算法计算中会涉及到求均值无监督机器学习也是机器学习是机器学习就涉及到模型求解KMeans流程举例随机选择K个簇中心点12样本被分配到离其最近的中心点34。

2025-03-27 16:52:14 491

原创 北京地区非全日制研究生的学费

建议通过院校官网或教育部研招网获取最新招生简章,确保信息准确性。

2025-03-26 20:55:06 334

原创 工作后考研

工作后考研需要平衡工作、生活和备考,是一项充满挑战但可行的计划。(如Excel表格跟踪进度),保持每周复盘调整计划,必要时可报辅导班(如专业课一对一)针对性补短板。工作后考研是一场对毅力与方法的双重考验,

2025-03-26 20:47:57 1212

原创 深度学习 机器学习和强化学习算法的关系

深度学习、机器学习和强化学习之间的关系可以理解为一种层次结构,其中机器学习是最广泛的领域,深度学习是机器学习的一个子集,而强化学习是另一种类型的机器学习方法。理解这些关系有助于在不同应用场景中选择合适的算法和技术。

2025-03-26 19:42:24 681

原创 机器学习和深度学习的关系

深度学习是机器学习的一个重要子领域,它通过深层神经网络提供了一种强大的工具来处理复杂的数据和任务。虽然深度学习在许多领域取得了显著的成功,但在某些情况下,传统的机器学习方法仍然是更好的选择。具体来说,深度学习是机器学习的一个子领域,专注于使用深层神经网络来解决复杂的问题。,深度学习是机器学习的一个子领域,两者共同致力于通过数据驱动的方式让计算机自动学习规律,但在方法、应用场景和技术特点上有显著差异。:深度学习是机器学习的一个子领域,它使用多层神经网络(深层神经网络)来学习数据的复杂表示,并自动提取特征。

2025-03-26 19:39:06 684

原创 机器学习算法分类

机器学习的分类体系是动态发展的,深度学习和传统方法在不同场景下互补。

2025-03-26 19:28:56 970

原创 大模型面试题 ---大模型基础概念 01 (待续)(超全更新)

3.缺乏多样性的训练数据:虽然大型语言模型能够处理大规模的数据,但如果训练数据中缺乏多样性的语言表达和语境,模型可能无法学习到足够的多样性和创造性,导致复读机问题的出现。很多垂领模型,都是在预训练型的基础上,通过针对性的指令微调,可以更好地适应最终任务和对齐用户偏好。减少内存占用:通过按需重新计算中间层,存储激活值所需的内存量显著减少,从而能够在内存有限的硬件上训练更大的模型,启用更深的模型:梯度检查点允许在不超过内存限制的情况下训练更深的模型,使其成为优化大规模 LLM 训练的有价值工具。

2025-03-26 17:46:04 1320

原创 AI大模型从0到1记录学习 day07

3 "

2025-03-26 16:52:42 463

原创 AI大模型从0到1记录学习 day06

list(x) 将序列转换为列表5.3 字符串String 字符串是不可变的、有序的。 字符串中元素不可修改。 字符串使用单引号、双引号或三重引号定义。 字符串中每个值都有对应的位置值,称为索引或下标,索引从起始从0开始向后逐个递增,并且从末尾从-1开始逐个向前递减。5.3.1 创建字符串5.3.2 访问字符串5.3.3 字符串相加5.3.4 字符串乘法5.3.5 检查成员是否为字符串中元素5.3.6 原始字符串。

2025-03-25 16:01:18 764

原创 TensorFlow

它的核心概念是张量(tensors),这是多维数组的一种通用形式,可以表示各种数据类型。:TensorFlow 提供了丰富的 API 来构建各种深度学习模型,包括神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等。总的来说,TensorFlow 提供了强大的工具和库,使得构建和训练复杂的机器学习模型变得更加简单和高效。张量可以是标量(0 维张量)、向量(1 维张量)、矩阵(2 维张量)以及更高维度的数组。:在 TensorFlow 中,变量是一种特殊的张量,用来存储模型参数,如权重和偏置。

2025-03-24 20:59:11 210

原创 人工智能考研方向和专业

✅ **优势:**自动驾驶、AI+自动化结合领域强势,部分专业应用导向明显。✅ **优势:**AI在交通系统、城市规划的应用研究较多,适合系统开发方向。⚠️ **难度:**竞争激烈,录取难度大,适合学术背景强、基础扎实的考生。✅ **优势:**AI+5G、边缘计算、通信技术融合,适合工程应用方向。✅ **优势:**航空、无人机、智能控制领域强势,AI+工程融合前景好。✅ **优势:**前沿AI算法研究、大厂资源丰富,就业竞争力极高。⚠️ **难度:**录取难度较大,部分方向需考数学、编程功底强。

2025-03-24 19:29:57 214

原创 精确率(Precision)、准确率(Accuracy)和召回率(Recall)详解

Accuracy = (90 + 180) / (90 + 180 + 10 + 20) = 270 / 300 = 0.9 或 90%FN (False Negative):假负例,即实际为正类但被模型错误预测为负类的样本数。FN (False Negative):假负例,即实际为正类但被模型错误预测为负类的样本数。TP (True Positive):真正例,即实际为正类且被模型正确预测为正类的样本数。TP (True Positive):真正例,即实际为正类且被模型正确预测为正类的样本数。

2025-03-24 18:38:10 711

原创 AI大模型从0到1记录学习 day05

然后再判断条件是否成立,如果成立,继续执行循环体,直到循环条件不成立的时候,才会结束循环,执行循环下面的其他语句。列表推导式是 Python 中一种简洁创建列表的方式,它将一个可迭代对象(如列表、元组、集合、字符串等)的元素通过某种运算或条件筛选后生成一个新的列表。 列表中每个元素都有对应的位置值,称为索引或下标,索引从起始从0开始向后逐个递增,并且从末尾从-1开始逐个向前递减。指定生成数列的范围,从start到stop(不包含stop),可设定步长,默认步长为1,步长可正可负。

2025-03-24 17:23:12 697

原创 AI大模型从0到1记录学习 day04

3.6 运算符3.6.1 算数运算符运算符 说明 实例3.6.2 赋值运算符运算符 说明 实例= 赋值 a = 1+= 加法赋值 a += 2,等同于a = a + 2-= 减法赋值 a -= 2,等同于a = a - 2*= 乘法赋值 a *= 2,等同于a = a * 2/= 除法赋值 a /= 2,等同于a = a / 2//= 整除赋值 a //= 2,等同于a = a // 2%= 模赋值 a %= 2,等同于a = a % 2**= 幂赋值 a = 2,等同于a = a *

2025-03-23 08:23:39 855

原创 AI大模型从0到1记录学习 day03 (记录心得体会及代码库上传github)

其中包括但不限于Coursera上的《机器学习》课程、吴恩达老师的《深度学习专项课程》以及一些经典的教科书如《Deep Learning》by Ian Goodfellow et al.。在当今这个数据驱动的时代,人工智能(AI)已经渗透到了我们生活的方方面面。作为这一领域的初学者,我决定踏上一段旅程——从零开始学习构建AI大模型。这不仅是一次技术上的挑战,也是一场自我成长的探索。本文将记录下我在学习过程中所经历的点点滴滴,以及从中获得的一些宝贵心得。从零到一:我的AI大模型学习之旅。

2025-03-22 16:30:14 105

原创 AI大模型从0到1记录学习 day02

3.2 变量3.2.1 什么是变量变量是指在程序执行过程中,其值可以改变的量。在内存的数据区中,会为变量分配存储空间来存放变量的值,这个内存空间的地址对应着变量名称,所以在程序中可以通过变量名称来区分和使用这些内存空间。它的唯一目的是在内存中标记和存储数据,这些数据可以在整个程序中使用。可以将变量理解为一个可以赋给值的标签,也可以说变量指向特定的值。3.2.2 变量的创建变量创建方式:变量名 = 变量值Python中的变量不需要声明。

2025-03-22 09:13:40 801

原创 AI大模型从0到1记录学习 day01

交互式命令行 在命令提示符中—python—进入交互环境。必须是字母、数字、下划线组成,数字不能作为开头。定义:在程序运行的过程中,其值可以改变的量。定义:在程序运行的过程中,其值不会改变的量。运算器、存储器、控制器、输入、输出。超级计算机—微型计算机—人形机器人。建议:简短 、描述性强(望文生义)给程序员看的,对程序进行解释说明。以3个引号开始,以3个引号结束。不能是python中的关键字。6.安装python环境。第一代语言:机器语言。第二代语言:汇编语言。第三代语言:高级语言。

2025-03-21 18:35:44 254

原创 Hadoop运行官方Grep本地案例时 显示权限不够 图片如下

#HHadoop运行官方Grep本地案例时 显示权限不够 图片如下这是执行bin/hadoop jarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output ‘dfs[a-z.]+’命令后的结果 用sudo执行此条命令后相同显示 求解答其中/*.xml文件已经拷贝到了input文件目录...

2019-12-09 20:36:53 1260 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除