自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 收藏
  • 关注

原创 DeepSeek的出现对全球GPT产业产生的冲击

近年来,人工智能技术的迅猛发展推动了自然语言处理(NLP)领域的革命性进步。特别是以GPT(Generative Pre-trained Transformer)系列模型为代表的大规模预训练语言模型,已经在全球范围内引发了广泛关注和应用。然而,随着技术的不断演进,新兴的GPT模型如DeepSeek的出现,正在对全球GPT产业产生深远的影响。本文将从技术、市场、应用场景和产业生态等多个维度,深入探讨DeepSeek的出现对全球GPT产业带来的冲击。

2025-02-02 14:25:52 1661

原创 DeepSeek与其他GPT模型的比较分析

自适应注意力机制:DeepSeek引入了自适应注意力机制,使其在处理复杂语言任务时具有更高的灵活性和准确性。多任务学习框架:DeepSeek采用了多任务学习框架,能够在不同层次上捕捉语言的细微差别。多语言数据处理:DeepSeek引入了多语言数据,使其在多语言处理任务中表现更为出色。高质量训练数据:DeepSeek的训练数据经过了严格的清洗和筛选,确保了数据的高质量。

2025-02-02 14:21:11 2917

原创 路由技术在网络中的作用及特点

未来的道路需要技术的不断创新和发展,加强道路安全机制的研究和应用,开发更加高效和扩展的协议和算法的道路,提高支持QoS和移动性的能力,以应对这些问题。同时,路由技术也将与这些新技术深度融合,为构建更加灵活、高效、安全的计算机网络提供强有力的支撑,如软件定义网络、网络功能虚拟化等新技术的出现。:实现不同网络间的互联互通,使不同子网之间、不同类型的网络互通,实现资源共享,在不同的网络之间可以实现互联互通,在不同的网络之间可以实现资源的互联互通。常见的道路是有内部闸机协议的,也有对外闸机协议的。

2025-01-02 21:59:27 1232

原创 自然语言处理的不同流派

随着语料库的建设和计算能力的提升,基于统计的方法开始兴起。这些方法在处理歧义和语言变化方面比基于规则的方法更为有效,但仍然需要大量的标注数据来训练模型。深度学习的出现,尤其是神经网络的应用,极大地推动了NLP的进步。近年来,多模态学习成为NLP研究的热点,它尝试结合文本、图像和声音等多种数据类型,以实现更为丰富和自然的交互。基于机器学习和深度学习的方法:优点是能够自动学习复杂的语言特征,处理能力更强,适应性更广。基于统计的方法:优点是能够处理语言的多样性和歧义,不需要人工编写规则。

2024-12-18 00:25:19 485

原创 什么是评价搭配

例如,如果 “美味” 和 “餐厅菜品” 的支持度(同时出现的频率)和置信度(在 “美味” 出现的情况下,“餐厅菜品” 出现的概率)都达到设定的阈值,就将它们作为评价搭配。例如,规定形容词 + 名词的模式为一种可能的评价搭配。评价词:是表达主观评价的词汇,包括形容词(如 “美味的”“难看的”)、副词(如 “非常好” 中的 “非常” 可以加强评价程度)、动词(如 “喜欢”“讨厌”)等。如在 “这个课程的实用性很强” 中,“课程” 是被评价对象,“实用性” 是课程的一个属性,也被包含在被评价对象的范畴内。

2024-12-17 17:52:51 475

原创 文本情感分类

在篇章级情感分类中,将篇章文本输入 BERT 模型,它可以根据上下文信息为每个单词生成丰富的语义表示,然后通过在这些表示上添加分类层来进行情感分类。对于篇章级文本,从根节点开始,根据文本的特征(如某些词汇的出现与否、文本长度等)进行分支,直到叶节点确定文本的情感类别。比如,在重大政策发布后,分析民众在社交媒体上的评论情感,以评估政策的接受程度。优点:在许多自然语言处理任务包括篇章级情感分类中取得了很好的效果,能够很好地处理长文本和复杂的语义关系,预训练模型可以通过微调适应不同的情感分类任务。

2024-12-17 17:52:01 785

原创 计算机视觉技术前瞻

这些创新成果从不同维度攻克既有难题、拓展应用边界,正持续重塑计算机视觉技术格局,随着进一步优化整合,有望深度融入日常生活诸多方面,解锁更多智能化、便捷化服务可能。

2024-11-25 02:03:37 696

原创 什么是脑机接口

脑机接口(Brain-Computer Interface,简称 BCI),又称脑机交互,俗称 “脑控” ,是指在生物(人或动物)大脑与外部设备或环境之间建立起一种新型的实时通讯与控制系统,从而实现脑与外部设备直接交互的技术。简单来说,就是让我们可以用大脑的思维直接控制外部的机器设备,或者让外部设备的信息反馈到大脑中。

2024-11-25 01:52:06 2229

原创 模态融合技术在多模态大模型中的应用研究

随着人工智能技术的快速发展,多模态大模型成为了研究的热点。模态融合技术作为多模态大模型的核心,它允许模型处理和理解来自不同模态(如文本、图像、音频)的数据。本文旨在探讨模态融合技术的原理、方法、挑战及其在多模态大模型中的应用,以期为未来的研究提供参考和启发。在多模态学习领域,模态融合技术是指将来自不同模态的数据进行有效整合,以提升模型的性能。这种技术的发展前期,主要以提升深度学习模型的分类与回归性能为出发点,重点分析了多模态融合架构、融合方法和对齐技术。

2024-11-16 00:00:37 781

原创 多模态大模型简介

多模态大模型是机器学习领域的一个新兴趋势,它结合了文本、图像、音频等多种数据模态,以实现更全面和深入的信息理解和处理。这种模型能够处理跨模态任务,如图像标注、视觉问答、文本到图像的生成等,是人工智能领域的重要进展。

2024-11-15 23:33:44 496

原创 CLIP模型的全面介绍与说明

CLIP(Contrastive Language-Image Pre-training)模型是由OpenAI在2021年提出的一种多模态预训练神经网络。该模型通过对比学习的方式,将图像和文本映射到同一个嵌入空间中,使得相关联的图像和文本在向量空间中彼此接近。CLIP模型因其出色的零样本学习能力和跨模态检索能力,在多个领域展现出了巨大的潜力和应用价值。

2024-11-14 01:24:24 662

原创 Tensor和NumPy相互转换

和NumPy中的数组共享相同的内存(所以他们之间的转换很快),改变其中一个时另一个也会改变!, 需要注意的是,此方法总是会进行数据拷贝(就会消耗更多的时间和空间),所以返回的。和NumPy中的数组相互转换。# 用torch.tensor()转换时不会共享内存。还有一个常用的将NumPy中的array转换成。,需要注意的是该方法总是会进行数据拷贝,返回的。此外上面提到还有一个常用的方法就是直接用。# 直接创建一个在GPU上的Tensor。和原来的数据不再共享内存。和原来的数据不再共享内存。

2024-09-23 17:47:08 520

原创 Tensor的各种操作

另外,PyTorch还支持一些线性函数,这里提一下,免得用起来的时候自己造轮子,具体用法参考官方文档。支持超过一百种操作,包括转置、索引、切片、数学运算、线性代数、随机数等等,可参考。可以改变形状,但是此函数并不能保证返回的是其拷贝,所以不推荐使用。根据index,在dim维度上选取数据,输出的size与index一样。在PyTorch中,同一种操作可能有很多种形式,下面用加法作为例子。例子如上,a[a>0],使用ByteTensor进行选取。矩阵的上三角/下三角,可指定偏移量。对角线元素之和(矩阵的迹)

2024-09-23 17:45:45 828

原创 knn图像分类

K近邻算法(K-NN),即给定一个已训练的数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,则判定该输入实例同属此类。KNN可以用做相似图像匹配算法来识别两个图像之间相似的内容。desc 检测到的特征的局部图的列表。knn匹配可以返回k个最佳的匹配项。keypoint 是关键点的列表。"当前随机可以判断的类型:""距离最近的5个邻居是:""5个邻居的距离是:"# 获取特征提取器对象。bf返回所有的匹配项。

2024-08-11 09:32:36 632

原创 图像的特征提取

我们可以用二进制数字来表示LBP图中的每个像素的LBP编码,比如下图中的中心像素,它的LBP编码为:00010011,其十进制值为19。特征提取的方法主要是通过属性间的关系,如组合不同的属性得到新的属性,这样就改变了原来的特征空间。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征的好坏对泛化性能有至关重要的影响。#在特征X上计算PCA,指定一个空的np.array([])数组用作蒙版参数,告诉opencv使用特征矩阵上的所有数据点。

2024-08-11 09:31:10 823

原创 边缘的检测

Sobel边缘检测算法比较简单,实际应用中效率比canny边缘检测效率要高,但是边缘不如Canny检测的准确,Sobel算子是高斯平滑与微分操作的结合体,所以其抗噪声能力很强,用途较多。Canny边缘检测器是一种被广泛使用的算法,并被认为是边缘检测最优的算法,该方法使用了比高斯差分算法更复杂的技巧,如多向灰度梯度和滞后阈值化。:利用上一步计算出来的梯度方向,检测某一像素在梯度的正方向和负方向上是否是局部最大值,如果是,则该像素点保留为边缘点,否则该像素点将被抑制。dx表示x方向上的差分阶数,取值1或 0。

2024-08-05 23:16:14 701

原创 图像的锐化

Sobel算子在Prewitt算子的基础上增加了权重的概念,认为相邻点的距离远近对当前像素点的影响是不同的,距离越近的像素点对应当前像素的影响越大,从而实现图像锐化并突出边缘轮廓。由于收集图像数据的器件或传输数图像的通道的存在一些质量缺陷,文物图像时间久远,或者受一些其他外界因素、动态不稳定抓取图像的影响,使得图像存在模糊和有噪声的情况,从而影响到图像识别工作的开展。这时需要开展图像锐化和边缘检测处理,加强原图像的高频部分,锐化突出图像的边缘细节,改善图像的对比度,使模糊的图像变得更清晰。

2024-08-05 23:14:48 569

原创 图像平滑处理

这种高斯滤波器只考虑像素之间的空间关系,而不会考虑像素值之间的关系(像素的相似度)。低通滤波可以去除图像中的噪音,模糊图像(噪音是图像中变化比较大的区域,也就是高频信息)。即假设某一位置的像素和其邻域像素符合高斯分布.具体的说的话,就是每一位置的像素的权重符合高斯分布.这样的话,给定一个高斯分布,及高斯核的大小,则可以计算出周边n个像素的权重值。简单滴说就是,在生成周边像素的权重矩阵时,如果发现旁边的像素值和当前的像素值差异很大,就只给差异很大的那个元素分配很小的权重,这样"大的突变差异就被保留了"。

2024-07-10 22:52:42 810

原创 图像的线性变换

以上线性变换是对整个灰度级范围使用了相同的参数,有的时候也需要针对不同灰度级范围进行不同的线性变换,这就是常用的分段线性变换,经常用于降低较亮或较暗区域的对比度来增强灰度级处于中间范围的对比度,或者压低中间灰度级处的对比度来增强较亮或者较暗区域的对比度。线性变换的参数需要根据不同的应用及图像自身的信息进行合理的选择,可能需要进行多次测试。之间,可以通过一下分段线性变换将主要的灰度级拉伸到。,对比度拉伸之后应该能比原图看到更多的细节。可以看到,图像的灰度主要集中在。

2024-07-10 22:47:22 778

原创 图像的灰度直方图

图像的对比度是通过灰度级范围来度量的,而灰度级范围可通过观察灰度直方图得到,灰度级范围越大代表对比度越高;反之对比度越低,低对比度的图像在视觉上给人的感觉是看起来不够清晰,所以通过算法调整图像的灰度值,从而调整图像的对比度是有必要的。最简单的一种对比度增强的方法是通过灰度值的线性变换实现的。先来认识一下灰度直方图,灰度直方图是图像灰度级的函数,用来描述每个灰度级在图像矩阵中的像素个数或者占有率。

2024-07-05 22:59:44 560

原创 图像的对数变换

图像的傅里叶频谱其动态范围可能宽达0~10^6。直接显示频谱的话显示设备的动态范围往往不能满足要求,这个时候就需要使用对数变换,使得傅里叶频谱的动态范围被合理地非线性压缩。因为对数曲线在像素值较低的区域斜率较大,像素值较高的区域斜率比较低,所以图像经过对数变换之后,在较暗的区域对比度将得到提升,因而能增强图像暗部的细节。可以观察到,对数变换效果非常明显,且对于整体对比度偏低并且灰度值偏低的图像增强效果较好。

2024-07-05 22:57:51 536

原创 图像的反转

灰度图像每个像素点只有一个像素值来表示,色彩范围在0-255之间,反转方法255-当前像素值。彩色图像的每个像素点由RGB三个元素组成,所以反转的时候需要用255分别减去b,g,r三个值。图像颜色的反转一般分为两种:一种是灰度图片的颜色反转,另一种是彩色图像的颜色反转。# 彩色图像颜色反转 NewR = 255-R。

2024-07-04 21:17:40 572

原创 实现第一个神经网络

在本节实验中,将创建一个简单的神经网络,其中一个隐藏层开发一个输出单元。关于上图,任何深度学习算法都涉及获取输入数据,构建各自的架构,其中包括嵌入其中的一堆层。由于神经网络包含输入数据的组合以获取相应的输出数据,将遵循以下相同的程序。训练特定的深度学习算法是将神经网络转换为功能块的确切要求,如下所示。借助内置函数创建顺序模型。使用下面的代码行,创建一个顺序模型。观察上图,使用损失函数对神经网络权重的优化进行评估。在梯度下降优化器的帮助下构造损失函数,如下所示。使用给定的代码行使用迭代循环实现梯度下降模型。

2024-07-04 21:15:34 800

原创 PyTorch - 神经网络基础

输入和输出之间的层称为隐藏层,层之间连接的密度和类型是配置。例如,一个完全连接的配置将 L 层的所有神经元都连接到 L+1 层的神经元。对于更明显的定位,只能将一个局部邻域(比如 9 个神经元)连接到下一层。在这种类型的神经网络中,数据的移动是通过现有的隐藏层从输入层到输出层。一层的输出作为输入层,对网络架构中的任何类型的循环都有限制。在 RNN 中,相同的层被应用于在指定的神经网络中接受输入参数并显示输出参数。产生的输出可以被认为是具有激活电位或偏差的加权和。更新网络的权重,通常使用如下所示的简单更新。

2024-07-04 21:13:46 347

原创 MySQL 的存储过程

使用如下命令 CALL 存储过程名字,对刚才建立的第一个存储过程进行调用,使用如下命令 CALL 存储过程名字,对刚才建立的第二个存储过程进行调用。使用 Use db5536;使用 DELIMITER //语句设置//为新的分割符。刷新后,新建立的 db5536 出现在数据库列表中,输入如下语句,创建带输出参数的第三个存储过程。输入如下语句,创建带输入参数的第四个存储过程。输入如下语句,调用第三个带传出参数的存储过程。输入如下语句,调用第四个带传入参数的存储过程。,以后的操作都在 db5536 上进行。

2024-05-27 02:57:02 585

原创 如何使用KNN

加载数据集、拆分数据集。

2024-05-27 02:49:30 382

原创 Home Credit - Credit Risk Model Stability

代码开始部分导入了多个Python库,包括用于数据处理的NumPy、Pandas、Polars,以及用于可视化的Seaborn、Matplotlib等。代码通过分析缺失值的模式,决定哪些列是有用的,并据此过滤列。:类似地,读取测试数据文件,应用特征工程,并进行内存优化。函数用于将Polars DataFrame转换为Pandas DataFrame,并优化内存使用。函数用于减少DataFrame的内存占用,通过将数据类型转换为更小的类型。:这个类包含多个静态方法,用于聚合数据,如计算最大值等。

2024-05-25 14:19:38 855

原创 朴素贝叶斯+SMSSpamCollections

函数的代码并且编译运行,该函数用于接收一个大字符串并将其解析为字符串。函数的代码,该函数用于对数据集进行预处理,编写完成后 编译。按钮,在弹出的界面中选择要导入的数据集。,箭头处代码自己添加,提示:字符串转化为字符。后,在工作目录中,新建一个文件夹命名为。,编写创建数据集、加载数据的函数。模型的接口,如果是垃圾邮件则返回。文件目录中,此时点击文件后的。,并且在文件夹中导入数据。函数将单词转化为词向量。按钮即可将数据集导入。导入所需的库文件并运行。模型,完成后编译并运行。,编写完成后编译并运行。

2024-05-24 22:56:56 613

原创 机器学习云环境测试

运行,运行完后就点击 New Cell创建新的。填写下一步的代码,后续不再赘述)中输入如下代码,并点击。等待创建完成后,点击。打开,创建一个全新的。代码填写完成后就点击。

2024-05-24 22:53:58 360

原创 机器学习云环境搭建

软件,如图,红框内的为安装文件,蓝色框内的为对应安装文件的校验文件(无需下载)跳转至华为云用户登录界面后,登录华为账号(如果没有,请先注册)在对象存储界面,点击创建桶,区域可自选,存储类别选标准存储 ,桶。》【新增访问密钥】,创建一个新的访问密钥,并及时下载密钥信息。】字段分别填入到登陆界面并点击登录。创建桶后,点击并进入桶,选择上传。管理控制台界面,点击【开发环境】点击后便可以在【管理控制台】软件,点击【教您登录】跳转后,点击【访问密钥】完成后,点击打开(登录与。位机为例,下载完成后。

2024-05-24 22:50:09 663

原创 kaggle无法注册怎么办

在浏览kaggle网站,或者是参加kaggle竞赛时,常常会遇到需要登陆kaggle账号的情况。而在注册时,却发现无论如何也无法弹出人机识别的验证码,导致无法注册成功。本文会手把手的讲解一种注册kaggle的方法(edge浏览器)。二、点击右上角的扩展,启动Header Editor。一、在浏览器中搜索Header Editor。最后点击保存即可,再次注册就有验证码了。从以上三个链接中选择一个复制上去。再点击扩展选项,出现下图界面。点击上面的导出与导入。点击第一个,并下载。

2024-04-29 00:12:37 2313 1

原创 华为昇腾AI云服务:让每个人轻松实现个人专属大模型

首先,昇腾AI云服务采用了先进的昇腾芯片和深度学习框架,提供了强大的计算性能和丰富的模型库。昇腾AI云服务为用户提供了丰富的计算资源选择,用户可以根据自己的需求和预算选择不同规模的计算资源,无需关心硬件的购买和维护。其次,昇腾AI云服务还提供了灵活的模型定制和调优功能,用户可以根据自己的需求和数据特点,调整模型的结构和参数,进一步提升模型的性能。总的来说,昇腾AI云服务的出现为每个人提供了实现个人专属大模型的便捷途径,不仅降低了人工智能的门槛,也推动了智能化应用的普及和发展。

2024-04-28 14:25:26 528

原创 机器学习本地环境测试

函数的代码,该函数用于对数据集进行预处理,编写完成后编译并。所示的词汇中,任意挑选若干词汇并组成新的句子,按照。模型从加载数据集、数据处理、训练以及测试编写为。7. 编写训练函数,训练Naive Bayes。,在网页中,点击进入本地环境搭建中创。,编写创建数据集、加载数据的函数。模型的接口,如果是垃圾邮件则返回。建的工作目录,点击右上角的。中出现数字后,即可视为这个。3. 导入所需的库文件。模型,完成后编译并运行。Bayes模型进行预测。中,每个输入框为一个。的代码后,点击红圈的。

2024-04-22 02:43:32 302

原创 机器学习本地环境搭建

点击新建,分别将下列四个目录(安装路径及其他三个,参考下图,根据自己安装路径做修改)添。点击后,列表会出现一个Untitled Folder的文件夹,完成后点击进入该文件夹,以后,该文件夹即为工作目录。完成创建后,在Navigator界面左侧选择。加到环境变量中,点击确定并退出。出现版本信息则说明安装成功。根据自己的情况选择安装路径,左侧的小方框,再点击右下角。右键点击Anaconda。,点击创建一个新的文件夹。整个安装过程大约费时。

2024-04-21 07:15:28 475

原创 SQL 语言数据操纵语言 DML

Insert Into [([,]„)] Select [(

2024-04-21 07:08:29 1001

原创 Navicat for MySQL 使用基础与 SQL 语言的DDL

引、视图的操作,掌握在 Navicat for MySQL 中用 DDL 语言进行对表、索引、本次实验还了解 SQL 语言中 DDL 语言的 CREATE、DROP、ALTER 对表、索。数据库对象、运行 SQL 语句和 SQL 脚本,以及如何编辑和运行 SQL 语句。部份 MySQL 最新版本的功能,包括触发器、存储过程、函数、事件、视图、视图的增加、删除和改动。列定义、主键定义、键定义、索引定义 、完整性约束、外键定义、表达式。索引是种数据库对象。连接数据库的参数配置,包括用户名、密码、主机名、端口。

2024-04-16 01:08:37 2521

原创 MySQL8.0.20 下载与安装

一、下载MySQL服务器下载安装:官网社区版地址: https://downloads.mysql.com/archives/installer/二、安装安装注意事项---成功秘诀

2024-04-16 00:45:21 630

原创 Spring Boot安装与配置

(2)选择项目类型(Maven或Gradle)、语言(Java、Kotlin或Groovy)、Spring Boot版本以及项目元数据(Group、Artifact、Name、Description等)。虽然Spring Boot CLI(命令行界面)不是必须的,但它提供了一个快速创建和运行Spring Boot应用的途径。(3)选择项目所需的依赖。(3)填写项目元数据(Group、Artifact、Name、Location等),选择Spring Boot版本和依赖,然后点击“Next”。

2024-04-10 00:45:30 2310

原创 Spring Boot深度解析:是什么、为何使用及其优势所在

Spring Boot遵循“约定优于配置”的原则,通过大量的默认配置,减少了开发者在构建Spring应用时所需的手动配置工作。同时,Spring Boot还集成了众多常用的开发库和工具,如Spring MVC、JPA、Thymeleaf等,使得开发者可以快速地创建出生产就绪的应用程序。在Java企业级应用开发的漫长历史中,Spring框架以其卓越的依赖注入和面向切面编程的能力,赢得了广大开发者的青睐。:Spring Boot通过大量的默认配置和自动配置功能,极大地简化了Spring应用的搭建和配置过程。

2024-04-10 00:36:20 1908

原创 数据库关系数据结构

关系数据结构是关系数据库的基础,它采用二维表格形式来表示数据,每一个表格称为一个关系。关系数据库中的数据组织是以关系为单位的,每个关系都有固定的列数和列名,但行数可以变化。用户定义的完整性是针对具体应用而设定的约束条件,它可以根据实际需求来定义。这些约束条件可以是属性值的取值范围、格式等。本笔记详细阐述了关系数据库的数据结构及其相关概念,包括关系模式、元组、属性、码、域等。同时介绍了关系操作、关系的完整性和关系代数等基本概念和原理。

2024-04-06 00:15:16 1098

c语言基础(2).pdf

c语言基础(2).pdf

2023-06-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除