- 博客(73)
- 收藏
- 关注
原创 计算机视觉(三):特征检测与光流法
彩色视觉技术摘要 本文系统介绍了彩色成像技术及其应用。首先阐述了四种彩色成像方式:场时序、多芯片、色彩滤镜阵列(如Bayer模式)和Foveon X3传感器,重点对比了Bayer模式与Foveon X3在RGB捕捉方式上的差异。其次,解析了颜色基础理论,包括可见光谱范围(400-700nm)、加性混合(RGB)与减性混合(CMY)的原理差异。然后详细说明了颜色匹配实验及标准颜色空间分类(线性RGB/CIE XYZ和非线性CIE LAB/HSV)
2025-11-08 00:01:15
1292
原创 计算机视觉(一):相机标定
本课程系统讲解计算机视觉(CV)理论与应用。核心涵盖: 理论框架:基于“三R”(识别/重建/重组)和Marr三阶视觉模型(低/中/高阶处理); 关键技术:相机模型(针孔成像/透镜参数/坐标转换)、图像处理(滤波/边缘检测/分割)及三维视觉(立体匹配/运动恢复结构); 应用领域:自动驾驶、工业检测、3D重建等10+场景;核心挑战:多对一映射、计算密集及视角/光照变化等8大问题。
2025-11-07 23:57:00
1053
原创 具身智能实战(一):物体的抓取1(sdk)
该项目实现了一个基于视觉的机械臂抓取系统,主要流程包括:1)通过RGB-D相机获取场景信息;2)使用YOLOv11和SAM算法检测目标物体并定位;3)利用PCA分析获取物体轴向信息;4)通过手眼标定和坐标转换计算物体在基坐标系下的位置;5)控制机械臂完成抓取和放置动作。系统采用松灵Piper机械臂和奥比中光RGB-D相机,实现了双臂协同工作:右臂负责目标抓取,左臂负责物体放置。项目展示了从视觉感知到运动控制的完整闭环流程,验证了算法在实际硬件平台上的可行性。
2025-11-02 18:11:08
178
原创 深度学习(十一):YOLOv9之最新的目标检测器解读
在追求最佳实时物体检测的过程中,YOLOv9 以其创新的方法克服了深度神经网络固有的信息丢失难题,脱颖而出。通过整合 PGI 和多功能 GELAN 架构,YOLOv9 不仅增强了模型的学习能力,还确保了在整个检测过程中保留关键信息,从而实现了卓越的准确性和性能。
2024-03-12 23:50:17
2799
1
原创 爬虫之牛刀小试(八):爬取微博评论
可以发现其特点是下一页评论的max_id在上一页中。最近新开了公众号,请大家关注一下。今天爬取的是微博评论。
2024-01-19 23:39:53
1701
原创 爬虫之牛刀小试(七):爬取某二手车网站
关键在于clue_id怎么获取,发现在其上一个网页中有clue_id,于是就解决了。最近新开了公众号,请大家关注一下。今天爬取的是某二手车网站。
2024-01-17 11:24:56
664
原创 Github Copilot最全的安装与使用教程:一款非常好用的AI编程工具
在你安装完Github Copilot后,你会发现VSCODE左边多了Github Copilot的聊天窗口,你可以像Chatgpt一样和Github Copilot聊天,Github Copilot不仅根据你的要求生成代码,而且还会对代码进行说明,最重要的是Github Copilot会提示你联想的代码问题,增加你的代码水平。**到这一步了,你的VSCODE就拥有了Github Copilot!,等待官方发给你邮件,提示你可以用的时候,你就可以免费地使用了。你需要提供你的学生证照片,
2024-01-14 19:27:51
8101
原创 爬虫之牛刀小试(六):爬取BOSS网站招聘的内容
想要找到我们感兴趣的职位,随便举个例子吧,比如家教啥的。接着找到对应的位置让selenium自己干就行了。最近新开了公众号,请大家关注一下。今天决定再次尝试一下。找到我们感兴趣的内容。
2024-01-14 18:01:47
656
原创 爬虫之牛刀小试(五):爬取B站的用户评论
接着我们的目标要获取多个网址(类似于https://api.bilibili.com/x/v2/reply/wbi/main?使用selenium来模仿人的动作,获取多个网址,关键是B站需要登陆就很难受,不知道为什么Cookie用不了,只好手动操作一下了。此次共读取了20X10共计200条评论,每一个网址有20条评论,需要花费大约30s左右,共计爬十个。小小地出手一下,这次使用selenium来自动化进行爬取,虽然速度很慢,但是还可以接受。找到你想要的值,对了,时间记得要转化一下,不然会出错!
2024-01-13 23:26:44
4368
原创 爬虫之牛刀小试(四):爬取B站番剧的简介
每个作品对应一个链接: https://www.bilibili.com/bangumi/play/ss…于是肯定了对应的api接口:api.bilibili.com /pgc/review/user?获取每部番剧的title和url就行,接着只要匹配获取简介的内容就行了。User-Agent和cookie用自己的,具体可以自行搜索如何操作。我们只要选出我们感兴趣的内容,比如配音演员,硬币等内容。首先我们来到番剧索引中,随便点开一部动漫,检查代码。这样子就解决了如何爬取每部番剧的网址了。
2024-01-13 16:56:47
1284
原创 爬虫之牛刀小试(三):爬取中国天气网全国天气
paser_url(url) 函数用于解析每个区域页面的 HTML,提取出城市名、最高温度、最低温度、风向、风级和天气数据,并将这些数据以字典的形式添加到 ALL_DATA 列表中。使用了 requests 库来发送 HTTP 请求,使用 BeautifulSoup 库来解析 HTML,使用 time 库来暂停执行。spider() 函数遍历所有区域的 URL,对每个 URL 调用 paser_url(url) 函数,并在每次调用后暂停 1 秒。最近新开了公众号,请大家关注一下。
2024-01-11 16:33:33
671
原创 爬虫之牛刀小试(二):爬古诗文网的数据
spider_page(url): 这个函数从给定的 URL 获取古诗。它首先发送一个 GET 请求到 URL,然后解析返回的 HTML 文档,提取出诗词的标题、朝代、作者、内容和图片 URL。spider(): 这是主函数,它遍历诗词列表页的 URL,对每个诗词列表页调用 spider_page(url) 函数获取诗词信息,然后将所有诗词的信息打印出来。这次利用的是re,上一篇用的是xpath和bs4。最近新开了公众号,请大家关注一下。
2024-01-11 15:43:43
1354
原创 爬虫之牛刀小试(一):爬取电影天堂最新的电影数据
spider(): 这是主函数,它遍历电影列表页的 URL,对每个电影列表页调用 get_detail_urls(url) 函数获取电影详情页的 URL,然后对每个电影详情页的 URL 调用 parse_detail_urls(detail_url) 函数解析电影信息,最后将所有电影的信息打印出来。它首先发送一个 GET 请求到电影详情页 URL,然后解析返回的 HTML 文档,提取出电影的标题、封面图片 URL、年份、国家、类别、豆瓣评分、片长、导演、主演、简介、截图和下载链接。
2024-01-11 14:50:16
1919
原创 2023下半年的总结
为了提高算法的性能和准确性,可以采用特征选择(包裹式,过滤式,嵌入式)、特征降维(PCA,t_sne)和模型集成(boost,stacking,bagging)等技术。同时,我也学习了Simulink的使用方法,通过建立数学模型进行系统仿真和分析。对于人脸识别,可以采用了基于深度学习的特征提取方法,通过训练卷积神经网络(CNN)来提取人脸特征,并使用余弦相似度进行特征匹配,实现人脸的快速识别。对于问答系统,采用了基于知识图谱的方法,通过构建知识图谱来存储问题和答案的对应关系,并使用搜索算法进行答案的检索。
2023-12-31 19:18:08
1221
原创 matalb实践(十二):减肥
1.体重增加正比于吸收的热量,平均每8000kcal增加体重1kg2.身体正常代谢引起的体重减少正比于体重,每周每千克体重消耗热量一般在200kcal至320kcal之间,且因人而异,这相当于体重70kg的人每天消耗2000kcal至3200kcal3.运动引起的体重减少正比于体重,且与运动形式和运动时间有关4.为了安全与健康,每周吸收热量最好不要小于10000kcal,且每周减少量不要超过1000kcal,每周体重减少不要超过1.5kg。
2023-12-31 19:13:50
2027
原创 深度学习(十):MFTN多模态融合
多模态情感分析(Moglobal et al.,2011;Zadeh等人,2016 b;Jiang et al.,2015)是情感计算研究的一个越来越受欢迎的领域(Escherichet al.,2017年),专注于将基于文本的情感分析推广到固执己见的视频,其中存在三种沟通方式:语言(口语),视觉(手势)和声学(语音)。如图所示,“这部电影很恶心”的话语本身可能是模糊的(积极或消极的),但如果说话者同时也在微笑,那么它将被视为积极的。另一方面,同样的话语与皱眉将被视为负面的。
2023-12-27 20:53:01
2021
原创 模式识别与机器学习(十三):Stacking
在本次实验中以决策树、svm和随机森林为基学习器,以决策树为元学习器。Stacking的做法是首先构建多个不同类型的一级学习器,并使用他们来得到一级预测结果,然后基于这些一级预测结果,构建一个二级学习器,来得到最终的预测结果。Stacking的动机可以描述为:如果某个一级学习器错误地学习了特征空间的某个区域,那么二级学习器通过结合其他一级学习器的学习行为,可以适当纠正这种错误。具体步骤如下图所示:过程1-3 是训练出来个体学习器,也就是初级学习器。
2023-12-27 20:32:08
677
原创 模式识别与机器学习(十二):随机森林
随机森林(Random Forest, RF)是Bagging的一个扩展变体。RF在以决策树为基学习器构建Bagging集成的基础上,在决策树的训练过程中引入随机属性选择。训练每颗决策树时随机选出部分特征作为输入,所以该算法被称为随机森林算法。在RF中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集(假定有d个属性),然后再从这个子集中选择一个最优属性用于划分。参数k控制了随机性的引入程度,一般情况下推荐klog2d。
2023-12-26 13:30:51
1072
2
原创 深度学习(九):bert之代码实现
处理的过程包括:将标签移动到指定的设备,将数据传递给模型得到预测结果,将预测结果的最大值的索引作为预测的类别,然后将预测结果和标签转换为列表,最后添加到总的预测结果和真实标签中。这些参数包括训练、验证和测试数据的文件路径,BERT预训练模型的路径,分类的数量,最大文本长度,批次大小,训练周期数,学习率,BERT模型的过滤器数量,以及最佳模型和最后模型的保存路径。处理的过程包括:将标签移动到指定的设备,将数据传递给模型得到预测结果,计算损失,清空优化器的梯度,反向传播,更新参数,累加损失。
2023-12-26 13:26:02
2123
1
原创 模式识别与机器学习(十一):Bagging
Bagging [Breiman, 1996a] 是井行式集成学习方法最著名的代表.从名字即可看出,它直接基于自助采样法(bootstrap sampling)。给定包含m 个样本的数据集,我们先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使得下次采样时该样本仍有可能被选中,这样,经过m次随机采样操作,我们得到含m 个样本的采样集,初始训练集中有的样本在采样集里多次出现,有的则从未出现,初始训练集中约有63.2%的样本出现在来样集中。
2023-12-23 22:29:11
853
原创 模式识别与机器学习(十):梯度提升树
提升方法实际采用加法模型(即基函数的线性组合)与前向分步算法。以决策树为基函数的提升方法称为提升树(boosting tree)。对分类问题决策树是二叉分类树,对回归问题决策树是二叉回归树。θm其中,Tx;θm表示决策树,θm为决策树参数,M为树的个数。而梯度提升树的具体步骤如下:1.初始化f0x0,并选取损失函数Lyfx));2.对于m01⋯M−gmxi−∂f。
2023-12-23 22:23:42
1630
原创 模式识别与机器学习(九):Adaboost
AdaBoost是Adaptive Boosting(自适应增强)的缩写,它的自适应在于:被前一个基本分类器误分类的样本的权值会增大,而正确分类的样本的权值会减小,并再次用来训练下一个基本分类器。同时,在每一轮迭代中,加入一个新的弱分类器,直到达到某个预定的足够小的错误率或预先指定的最大迭代次数再确定最后的强分类器。各个弱分类器的训练过程结束后,加大分类误差率小的弱分类器的权重,使其在最终的分类函数中起着较大的决定作用,而降低分类误差率大的弱分类器的权重,使其在最终的分类函数中起着较小的决定作用。
2023-12-23 22:15:31
1466
原创 matlab实践(十一):导弹追踪
试探法得到t=0.3125,dy=0.9910,由公式一得到dx。对于第二题做法是求出中间时刻t,dx,dy再列方程求解。红色是加速前的轨迹,蓝色是加速后的轨迹。更改函数中的v0可以得到不同的轨迹。接着利用ode45求解。
2023-12-23 21:58:36
2390
3
原创 模式识别与机器学习(八):决策树
决策树(Decision Tree),它是一种以树形数据结构来展示决策规则和分类结果的模型,作为一种归纳学习算法,其重点是将看似无序、杂乱的已知数据,通过某种技术手段将它们转化成可以预测未知数据的树状模型,每一条从根结点(对最终分类结果贡献最大的属性)到叶子结点(最终分类结果)的路径都代表一条决策的规则。一般,一棵决策树包含一个根节点,若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。
2023-12-23 21:38:46
2287
原创 深度学习(八):bert理解之transformer
transformer 是一种深度学习模型,主要用于处理序列数据,如自然语言处理任务。它在 2017 年由 Vaswani 等人在论文 “Attention is All You Need” 中提出。Transformer 的主要特点是它完全放弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),而是完全依赖于注意力机制(Attention Mechanism)来捕捉输入序列中的模式。
2023-12-23 21:27:04
2066
原创 深度学习(七):bert理解之输入形式
因此,预训练的BERT模型只需添加一个额外的输出层,就可以用于各种任务,如问答和语言推理,而无需进行大量的任务特定架构修改。为了使得BERT模型适应下游的任务(比如说分类任务,以及句子关系QA的任务),输入将被改造成[CLS]+句子A(+[SEP]+句子B+[SEP]) 其中。在BERT中,输入的向量是由三种不同的embedding求和而成,在以下所举的例子中,每个单词都表示为一个768维的向量。1.[CLS]: 代表的是分类任务的特殊token,它的输出就是模型的pooler output。
2023-12-23 20:43:08
3562
原创 深度学习(六):paddleOCR理解及识别手写体,手写公式,表格
光学字符识别(Optical Character Recognition, OCR),ORC是指对包含文本资料的图像文件进行分析识别处理,获取文字及版面信息的技术,检测图像中的文本资料,并且识别出文本的内容。那么有哪些应用场景呢?其实我们日常生活中处处都有ocr的影子,比如在疫情期间身份证识别录入信息、车辆车牌号识别、自动驾驶等。我们的生活中,机器学习已经越来越多的扮演着重要角色,也不再是神秘的东西。OCR的技术路线是什么呢?ocr的运行方式:输入->图像预处理->文字检测->文本识别->输出。
2023-12-06 23:48:59
10184
11
原创 matlab实践(十):贝塞尔曲线
贝塞尔曲线的原理是基于贝塞尔曲线的数学表达式和插值算法。贝塞尔曲线的数学表达式可以通过控制点来定义。对于二次贝塞尔曲线,它由三个控制点P0、P1和P2组成,其中P0和P2是曲线的起点和终点,P1是曲线上的一个中间点。曲线上的每个点可以通过参数t在0到1之间的取值来计算,公式如下:其中,B(t)表示曲线上的点,t表示参数值,(1-t)表示参数值的补数。对于三次贝塞尔曲线,它由四个控制点P0、P1、P2和P3组成,其中P0和P3是曲线的起点和终点,P1和P2是曲线上的两个中间点。
2023-12-06 21:06:00
3853
1
原创 深度学习(五):pytorch迁移学习之resnet50
迁移学习是一种机器学习方法,它通过将已经在一个任务上学习到的知识应用到另一个相关任务上,来改善模型的性能。迁移学习可以解决数据不足或标注困难的问题,同时可以加快模型的训练速度。迁移学习的核心思想是将源领域的知识迁移到目标领域中。源领域是已经有大量标注数据的领域,而目标领域是需要解决的新问题。通过迁移学习,源领域的知识可以帮助目标领域的学习过程,提高模型的泛化能力和性能。迁移学习可以通过多种方式实现,包括特征提取、模型微调和领域自适应等方法。
2023-12-04 21:10:09
13695
2
原创 matlab实践(九):分段线性插值与三次样条插值
用matlab对572所在区间分别进行分段线性插值、三次样条插值,计算出151,159,984,995的对数值,画出图形并在图形上用红色圆圈标记151,159,984,995所在的点,同时在图形中显示这些点的坐标。说明:假设125,528,765;则插值区间为【120,770】
2023-12-04 19:40:39
7046
原创 模式识别与机器学习(七):集成学习
例如,如果有5个个体学习器,它们的权重分别为[0.2, 0.3, 0.1, 0.2, 0.2],则最终的预测结果是将个体学习器的预测结果乘以对应的权重后相加得到的。每个个体学习器对样本进行预测后,最终的预测结果是通过对个体学习器的预测结果进行平均得到的。然后,我们将数据集拆分为训练集和测试集。在集成学习中,个体学习器可以是同质的(使用相同的学习算法,但在不同的训练集上训练)或异质的(使用不同的学习算法)。每个基本学习器都是在不同的训练集上独立训练得到的,最后通过集成基本学习器的预测结果来进行最终的预测。
2023-12-02 22:59:47
1551
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅