- 博客(113)
- 收藏
- 关注

原创 国产之光DeepSeek架构理解与应用分析
在机械电子工程产业中,人工智能的加持可用于故障诊断、生产流程优化、产品设计辅助等方面,比如通过分析设备数据预测故障,或优化生产线调度提高效率,提高生成效率、降低人员作业的安全风险。对于人工智能大模型当下的发展阶段,如何落地,并在横向领域发挥出作用成为越来越被关注的话题,笔者的朋友提出了几个问题:DeepSeek的用处除了在信息库里提取提问者需要的有效信息外还有别的功能吗?在车身焊接环节,基于深度学习的视觉系统(如YOLOv5)检测焊点质量,误检率低于0.5%,较传统光学检测效率提升5倍。
2025-01-31 21:11:30
22182
60
原创 操作系统、虚拟化技术与云原生及云原生AI简述
操作系统作为基础,直接管理计算机硬件与软件资源。虚拟化技术的出现,打破了物理设备的限制,通过资源抽象实现了多租户共享,为云计算的发展奠定了基础。云原生则借助容器、Kubernetes 等技术,构建起动态、弹性的分布式系统,加速了应用的开发与部署。而云原生 AI 将云原生技术与人工智能深度融合,既发挥了云原生在资源管理、部署等方面的优势,又借助 AI 提升了云原生系统的智能化水平,在互联网、金融、医疗等多个领域展现出广阔的应用前景。
2025-04-04 12:38:52
532
原创 爬虫学习-爬取古诗
唐诗作为中国古典文学的巅峰之作,现存五万余首诗歌蕴含着丰富的历史文化信息。传统的人工整理方式效率低下,难以应对大规模文本分析需求。本项目通过构建自动化爬虫系统,实现对古诗数据的高效采集与多维度分析,为文学研究、文化传播提供数据支持。
2025-03-28 10:44:41
1103
原创 大模型微调-lora微调
在传统的模型微调中,尤其是大型预训练模型,对所有参数进行更新需要巨大的计算资源和时间成本。而 LoRA 的思路是冻结预训练模型的原始权重,不直接对其进行更新,而是在模型的某些层(常见于 Transformer 模型的自注意力层和前馈网络层 )中引入低秩矩阵来实现微调。
2025-03-26 16:37:57
925
原创 强化学习与神经网络结合(以 DQN 展开)
强化学习(Reinforcement Learning, RL)是机器学习的一个分支,旨在让智能体(Agent)通过与环境的交互学习最优策略,以最大化长期累积奖励。其核心思想是 “试错 - 反馈”,智能体在环境中通过不断尝试动作,根据环境反馈的奖励调整行为,最终学会在不同状态下选择最优动作。
2025-03-26 16:15:45
1057
原创 将云上的开发代码上传到gitee
现在,您的本地仓库已经更新,包含了 test 文件夹及其内容。接下来,您需要将这些更改推送到 Gitee 上的远程仓库,以便其他人也能看到这些更新。假设我的远程仓库在云实例上的文件夹叫zhonyiyaoclassify,cd到这个文件下,执行git add .可以将所有改动进行同步。#3.上传代码到Gitee 将代码文件复制或移动到克隆下来的Gitee仓库文件夹中。#2.克隆仓库到本地 用Git命令将Gitee上的仓库克隆到本地机器上。已经成功推送到了 Gitee 上的远程仓库。#1.创建Gitee仓库。
2025-03-23 21:23:14
597
原创 强化学习的常用策略浅析
强化学习是ai agent开发的主要原理,智能体通过于环境的交互学习一些策略,作为指导工作的依据,本篇浅析常用的算法:DDPG、DPPO、simply_PPO、discrete_DPPO
2025-03-23 21:15:56
948
原创 爬虫入门re+bs4
在信息爆炸的时代,互联网已成为数据获取的核心渠道。从学术研究到商业分析,从新闻监控到用户行为洞察,数据的价值日益凸显。而网络爬虫(Web Crawler)作为自动化获取网络数据的核心技术,正扮演着越来越重要的角色。本案例将通过一个完整的 Python 爬虫案例,构建高效、可靠的爬虫系统,实现对中文日报网站内容的自动化抓取与结构化存储。
2025-03-19 17:35:01
1531
原创 强化学习的一些概念
强化学习(Reinforcement Learning, RL)是机器学习的一个分支,旨在让智能体(Agent)通过与环境的交互学习最优策略,以最大化长期累积奖励。其核心思想是 “试错 - 反馈”,智能体在环境中通过不断尝试动作,根据环境反馈的奖励调整行为,最终学会在不同状态下选择最优动作。
2025-03-16 23:44:43
1284
1
原创 实践-给图片右下角加opencv-logo
mask1与roi进行按位与,fg1 = cv2.bitwise_and()mask2与logo进行按位与,fg2 = cv2.bitwise_and。使用OTSU二值化方法进行二值化ret, mask1 =通过按位与获得只有大图背景而logo前景挖空的局部图。只对lena脸部应用密钥进行解密(逻辑异或操作)使用掩码对lena图像的脸部进行打码、解码。通过二值化获取抛弃logo前景的掩码图。通过二值化获取保留logo前景的掩码图。获得只有logo前景而背景挖空的局部图。进行二值化ret, mask2 =
2025-03-16 19:36:25
417
1
原创 MindSpore使用分享-基础篇
mindspore:核心模块,包含多个子模块。:定义神经网络的层和优化器。:定义各种数学运算和张量操作。:加载和处理数据集。:定义和训练模型。:训练相关的函数和回调。:常用的工具和函数。
2025-03-06 10:55:11
915
原创 综合使用pandas、numpy、matplotlib、seaborn库做数据分析、挖掘、可视化项目
使用 pandas 拷贝一份数据集,命名为 df,取 'price (USD)' 为标签 y, 其他为特征集合 X,删除 X 中无关特征,只保留:'inches', 'battery', 'ram (GB)', 'weight (g)', 'storage (GB) 等特征,统计 name 特征中包含 'pro' 或 'max' 的样本,新建布尔特征 'has_pro_or_max'。并且在该函数中,调用接口进行划分 80% 数据为训练集,20% 数据为测试集,函数的返回值为训练集和测试集的特征和标签。
2025-03-06 10:35:01
1242
原创 项目8:信用违约预测-集成学习
本实验主要使用Python进行数据预处理、数据分析,使用Matplotlib做可视化分析,使用过采样方法平衡正反例数据,使用随机森林建模,使用网格搜索来寻找最优参数组合。违约预测问题面临着所需数据维度多、正负样本严重不均衡等问题,在实际应用上,可以多搜集各类维度的特征,多尝试过采样、欠采样,也可以尝试使用无监督学习、深度神经网络等。针对二分类问题,可使用的算法有逻辑回归、朴素贝叶斯、支持向量机、树模型等。将数据集作3:1的划分,按照标签比例做分层抽样,分出训练集和测试集,观察每个数据集中正负样本数量。
2025-02-23 15:11:47
335
原创 词向量与词嵌入
训练方式有 DBOW(类似于 Skip-gram 模型,直接用文档向量预测上下文单词)和 DM(类似于 CBOW 模型,预测中心词,文档向量参与捕捉全局语义信息)。它通过学习词的上下文信息来生成词向量,主要基于两种训练模式:连续词袋模型(Continuous Bag-of-Words,CBOW)和跳字模型(Skip-Gram)。假设给定一个长度为C的上下文窗口,模型会使用上下文窗口内的所有词(不包括中心词)作为输入,经过神经网络的计算,预测出中心词。中的模型训练,实现对新闻类别的自动划分。
2025-02-22 20:46:49
555
原创 NLP-RNN-LSTM浅析
双向LSTM;LSTM 应用到双向RNN 中;双向 LSTM-CRF;双向 LSTM-CNNs;双向 LSTM-CNNS-CRF;
2025-02-20 23:31:54
965
原创 循环神经网络RNN原理与优化
绕循环神经网络(RNN)、注意力机制(Attention)以及相关模型(如 LSTM、Transformer、BERT、GPT 等)在深度学习中的应用展开,介绍了其原理、结构、算法流程和实际应用场景。本篇重点放在RNN和LSTM
2025-02-20 22:22:08
1162
原创 Transformer 的核心技术Encoder、Decoder、注意力模块解析
Attention机制是Transformer的核心创新之一,其主要作用是通过计算序列中各个token之间的关联性(权重),捕捉输入序列的全局依赖关系,从而在建模时能够更有效地理解数据的上下文信息。:在计算注意力得分时,点积的结果可能随着向量维度d_k的增加而变大,导致Softmax函数的梯度变小,影响模型的训练效率。:对于每个输入token的嵌入表示(embedding),通过与可训练的权重矩阵相乘,生成对应的查询向量(Query,记作Q)、键向量(Key,记作K)和值向量(Value,记作V)。
2025-02-19 19:22:20
1725
原创 机器翻译中的编码器、自注意和解码器
例如,将 query 的形状从 (batch_size, hidden_size) 扩展为 (batch_size, 1, hidden_size),使其能够与 values 的时间维度对齐。GRU 的输出 output 的形状为 (batch_size, 1, dec_units),需要通过 tf.reshape 重塑为 (batch_size, dec_units),以便输入全连接层。注意力权重的形状为 (batch_size, max_length, 1),表示每个时间步的注意力权重。
2025-02-19 18:26:53
990
原创 TexTCNN
TextCNN 是一种经典的文本分类模型,其核心思想是将卷积神经网络应用于文本数据,通过提取局部特征实现高效的文本分类任务。TextCNN 在情感分析、推荐系统、语义匹配等领域有广泛的应用,具有高效性、局部特征提取能力和灵活性等优势。
2025-02-18 12:24:37
1172
1
原创 cv2库的使用及图像预处理02
这段代码展示了如何使用 OpenCV 的 cv2.equalizeHist 函数对灰度图像进行直方图均衡化处理,并通过 Matplotlib 显示原始图像、均衡化后的图像以及它们的直方图。直方图均衡化是一种增强图像对比度的技术,通过调整图像的灰度分布,使其直方图接近均匀分布。直方图均衡化是一种增强图像对比度的方法,通过调整图像的灰度分布,使输出图像的直方图接近均匀分布。图像以灰度模式读取(cv2.imread(r'lenna.png', 0)),返回的是单通道的灰度图像。
2025-02-18 11:01:49
972
原创 cv2库的使用及图像预处理01
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和图像处理库,广泛用于图像和视频处理、特征检测、目标识别等领域。HSV 是一种常用的色彩空间,它将颜色表示为三个分量:色调(Hue)、饱和度(Saturation) 和 明度(Value)。作为图像处理领域的标准测试图像,Lena图像为研究者提供了一个共同的参考点,便于在相同的条件下比较不同算法的性能。Lena图像具有丰富的频率信息,既有低频的平滑区域,也有高频的纹理和细节。
2025-02-18 08:59:11
1205
1
原创 反向传播推导
W一般都是参数矩阵,参数矩阵中就可能会有w1、w2...,损失函数之所以是复杂的非凸函数一个重要的原因就是参数很多,拟合后非线性因素很复杂,对于这么多个维度的参数,拿出其中的某几个参数w来说,对于w1假设损失函数图像为蓝色图(w2就是红色的),调同样的幅度w1对于损失函数下降的贡献大于w2,那么就更应该调w1(这里是把复杂的损失函数抽象出来看,不同的w其实定义的是同一个损失函数)走,因为梯度指向的是山最陡的方向(上升最快的方向),而你要下山(减小损失)。交叉熵源自信息论,用于衡量两个概率分布之间的差异。
2025-02-16 21:58:58
670
原创 模型GPU->NPU(Ascend)迁移训练简述
GPU默认可能使用FP16混合精度训练,而Ascend可能以FP32执行,不同精度下计算的舍入误差累积后差异放大。某些算子(如矩阵乘法、激活函数)在PyTorch(GPU)和昇腾(Ascend)中的底层实现不同。即使模型结构和输入数据完全相同,GPU和Ascend的训练结果仍存在随机性差异(如损失函数波动)。GPU和Ascend在多卡训练时的并行策略不同(如数据分片方式)。工具,收集训练过程中各层的中间计算结果(如权重、梯度、激活值),生成。模型输入张量的动态形状(如可变尺寸)在Ascend上未适配。
2025-02-16 20:41:49
1137
原创 vscode环境搭建
在VSCode中,打开设置,搜索“Python: Auto Activate Environments”,确保该选项已勾选。键,输入并选择“Python: Select Interpreter”,然后选择你刚刚创建的虚拟环境。:运行安装包,确保勾选“Add Python to PATH”选项,然后按照提示完成安装。打开VSCode,点击左侧的扩展图标,搜索并安装“Python”扩展。:运行安装包,按照提示完成安装。:运行安装包,按照提示完成安装。:如果尚未安装,可以使用命令。找到正确的安装命令。
2025-02-13 23:36:48
1216
原创 一个AI应用的开发、上线流程解析
例如,在使用TensorFlow训练的模型需要在PyTorch框架下进行推理时,可以将模型转换为.onnx文件,然后在PyTorch中加载.onnx文件进行推理。例如,在图像分类任务中,训练好的ResNet模型可以保存为.mindir文件,方便在MindSpore框架下进行高效的模型推理。例如,训练好的模型可以保存为.onnx文件,然后在NVIDIA GPU上进行高效的模型推理,也可以在国产硬件上进行推理。例如,在自然语言处理任务中,训练好的情感分析模型可以保存为.pth文件,方便在不同的设备上进行推理。
2025-02-12 21:01:11
997
原创 DeepSeek 使用小技巧
国产之光DeepSeek架构理解与应用分析-优快云博客AI工具使用技巧-优快云博客本系列将主要围绕deepseek展开杭州深度求索人工智能基础技术研究有限公司(DeepSeek)是一家专注于通用人工智能(AGI)的中国科技公司,致力于研发和应用大模型技术。其核心产品 DeepSeek-R1 是一款开源的推理模型,擅长处理复杂任务,并且可以免费商用。深度求索公司以其强大的推理和生成能力,在人工智能领域占据了一席之地。
2025-02-11 20:26:38
2100
1
原创 集成学习算法简述
返回的可视化结果比较了两种决策边界,左图是单个决策树,右图是500个决策树组成的bagging集成,均在make_moon数据集上训练完成。每个学习器可以使用这部分数据来进行评估(原始的是对每个训练子集提取部分作为测试集,或者使用交叉验证),这样可以用来训练每个学习器的训练数据就变多了。max_features=1.0, #构建每个基学习器时从原始特征集中抽取的特征比例(如果为浮点数)、数量(如果为整数)或根据某些策略(如 'auto'、'sqrt'、'log2')选择。如果为 1.0,则使用全部特征。
2025-02-10 18:13:52
860
原创 学习笔记:在华为云ModelArts上运行MindSpore扩散模型教程
同时,我也意识到扩散模型在生成效果和训练效率方面还存在一些挑战,如生成图像的多样性不足、训练时间较长等。未来,我计划进一步探索扩散模型的改进方法,如引入更复杂的网络结构、优化训练策略等,以提高生成图像的质量和多样性。同时,我也会关注扩散模型的最新研究进展,学习和借鉴新的技术和方法,不断提升自己的技术水平。:在上采样过程中,将当前特征与之前保存的特征进行拼接,保留更多的细节信息,有助于生成更高质量的图像。这个 U-Net 网络是扩散模型中的核心部分,通过学习逆向去噪过程,能够从纯噪声逐步生成实际图像。
2025-02-09 23:29:26
1655
原创 MySQL下载过程
MySQL 的 ProgramData 路径通常是在安装过程中由安装程序自动配置的,用于存储 MySQL 的数据文件和配置文件。这个路径通常位于 C:\ProgramData\MySQL\MySQL Server 5.7\Data,即使你将 MySQL 的安装目录设置在其他盘符,这个路径通常也不会改变。mysql的programdata下那个路径是不是无法更改,即使我软件的安装目录在其它盘?,这是为了确保数据文件的存储位置是系统默认的、安全的路径。下面的示例是5.7的包,过程是一样的。
2025-02-09 21:57:23
727
原创 深度学习中的梯度相关问题
在机器学习中,尤其是训练神经网络时,我们通过求偏导数来确定如何调整模型参数以最小化损失函数。5.对于MSE和交叉熵损失函数,求导(偏导)后得到的结果一样,是否意味着对于回归和分类两大类问题,除了输入的数据X的类型不一样(回归--连续型;分类--离散型),在做反向传播时的计算结构大体相近?对于均方误差(MSE),损失函数的导数相对于预测值,实际上是每条样本残差(预测值与真实值之差)的平均值。只能说梯度的公式一样,但是数据的类型和计算图中的网络结构、超参数什么的不太近似,如果很接近就没有对问题的区分度了。
2025-02-08 20:50:38
423
原创 语义分割简述
strides为步幅;使用TensorFlow的conv2d_transpose,输入一张28x28的图像,卷积核尺寸4x4,输出通道数5,输入通道数3,设置步幅为2,padding为"SAME",输出形状为1x56x56x5。:网络越深效果越好,FPN效果好,sigmoid优于softmax,RoI Align提升效果,特别是AP75,Mask分支采用CNN效果好,每个类预测mask更好。:使用DarkNet-53作为骨干网络,并添加特征金字塔,增强小目标检测能力,使用3个尺度的特征图进行多尺度检测。
2025-02-06 13:17:53
506
原创 AI工具使用技巧
因为模型每次对话中都是调用训练好的网络结构和参数,以deepseek的网页版为例,每轮对话我们输入的东西作为数据传入训练好的模型(r1-671B),模型去拟合数据生成内容,每轮对话有长度上限,这个上限差不多是10万字。对于向这种生成篇幅比较大的,看不清楚的图,可以用kimi,目前kimi支持mermaid导图的生成(建议在deepseek上通过深度思考给出代码,把代码直接给kimi生成图片,当个编译器用,因为deepseek生成的东西质量更佳)将生成的代码复制,粘贴到mermaid网页版编译器里。
2025-02-06 10:51:17
1931
关于西雅图(King County)房价数据的分析项目
2024-12-24
美国加州房价预测与分析的机器学习项目
2024-12-24
relation-GDP-life - GDP与幸福感指数关系 数据分析项目
2024-12-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人