- 博客(18)
- 收藏
- 关注
原创 python代码实现离散haar小波变换和db4小波变换
手搓小波变换代码,python实现,haar小波和db4小波。为什么选择小波变换以及实现原理,对信号处理过程和效果。
2025-03-31 18:41:00
821
原创 【论文阅读】Looking to Listen at the Cocktail Party:一种与说话人无关的语音分离视听模型
Looking to Listen at the Cocktail Party:A Speaker-Independent Audio-Visual Model for Speech Separation原文链接:Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech SeparationFig. 1.我们提出了一个分离和增强视频中期望发言者语音的模型。(a)输入是一个或多个人讲
2025-03-14 10:04:03
1441
1
原创 【论文阅读】LightTS:少即是多:基于轻采样的MLP结构的快速多元时间序列预测
多元时间序列预测在金融、交通、能源、医疗等领域有着广泛的应用。为了捕捉复杂的时间模式,大量的研究设计了基于RNN、GNN和Transformer的复杂神经网络结构。然而,复杂模型的计算量往往很大,因此在应用于大规模真实数据集时,其训练和推理效率面临严峻挑战。本文首先介绍了一个轻量级的深度学习体系结构LightTS,该体系结构仅基于简单的基于MLP的结构。
2025-03-12 10:46:53
1175
1
原创 【论文阅读】TSMixer:An All-MLP Architecture for Time Series Fore-casting用于时间序列预测的全mlp架构
现实世界的时间序列数据集通常是具有复杂动态的多元数据集。为了捕捉这种复杂性,高容量架构,如循环或基于注意力的顺序深度学习模型已经变得流行起来。然而,最近的研究表明,简单的单变量线性模型可以在几个常用的学术基准上优于这种深度学习模型。在本文中,我们扩展了线性模型用于时间序列预测的能力,并提出了时间序列混频器(TSMixer),这是一种通过堆叠多层感知器(mlp)设计的新架构。TSMixer基于沿时间和特征维度的混合操作来有效地提取信息。
2025-02-28 09:28:06
1082
2
原创 Yolov5训练路况分类模型(公路,土路)
目录1.数据集制作2.开始训练3.测试4.代码附录(1)爬虫代码(2)划分数据集 split_data.py。
2024-03-29 16:10:36
610
1
原创 YOLO和MobileNetV3实现四种天气分类(雨,雪,雾,晴)
修改其中路径和第四行的尺寸,将其改成自己希望裁剪的大小即可。查看爬取的图片,发现大小不一,而且其中还有可能格式受损,这对后续处理非常不利,于是需要预处理,将其转换为统一大小,并且筛选出不合格图片。输入自己需要查询的内容即可,下载完成后会在image文件夹中生成以查询内容为名的文件夹,里面保存着爬取的图像。需要修改的是里边的这一行,将其改成自己的存储地址,此处我建立了一个image文件夹,用来存储爬下来的图片。修改其中内容,将model后面改为自己存放分类模型的路径,没有的话就去先下载分类模型;
2024-03-27 14:25:50
1267
翻译 BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation(论文原文阅读)
多传感器融合对于精确可靠的自动驾驶系统至关重要。最近的方法是基于点级融合:用相机特征增强激光雷达点云。然而,相机到激光雷达的投影丢弃了相机特征的语义信息,阻碍了这些方法的有效性,特别是对于面向语义的任务(如3D场景分割)。在本文中,我们用BEVFusion打破了这种根深蒂固的惯例,BEVFusion是一种高效且通用的多任务多传感器融合框架。它将多模态特征统一到共享鸟瞰图(BEV)表示空间中,很好地保留了几何信息和语义信息。
2024-03-19 16:42:12
284
1
原创 分类模型评判指标以及混淆矩阵实现
混淆矩阵(Confusion Matrix)是一个二维表格,常用于评价分类模型的性能。在混淆矩阵中,每一列代表了预测值,每一行代表了真实值。因此,混淆矩阵中的每一个元素表示了一个样本被预测为某一类别的次数。混淆矩阵预测值1预测值0真实值1TPFN真实值0FPTN一句话解释版本:混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来。这个表就是混淆矩阵。
2024-03-05 11:49:13
897
1
原创 训练猫狗分类模型
数据集:采用kaggle官方Cats VS. Dogs比赛数据集。该数据集是由 Microsoft Research Asia 发布的猫狗大战数据集。该数据集包括 25000 张猫和狗的图片,其中 12500 张是猫的图片,另外 12500 张是狗的图片。每张图片的大小不一,颜色、角度、光线等也有所不同。
2024-03-05 11:46:41
674
1
原创 自动驾驶采集多视角图像处理(python实现不同文件夹下同名图片批量拼接并生成视频)
cv2.videowriter_fourcc是OpenCV中的一个函数,用于创建一个视频编码器对象。它接受四个字符作为参数,用于指定视频编码器的类型。这些字符通常是四个大写字母,例如MJPG、XVID、DIVX等。使用cv2.videowriter_fourcc可以将视频数据编码为指定类型的视频文件,以便在其他设备上播放或编辑。参数列表MPEG-4编码 .mp4 可指定结果视频的大小MPEG-4编码 .mp4 可指定结果视频的大小。
2023-12-27 11:39:30
1827
1
原创 基于目标检测评判采集行车片段质量
若干个文件夹中存放着采集到的行车图片,这些图片由行车视频按时间逐帧抽出,相当于一个行车场景。每个场景都有六个摄像头和激光雷达采集到的图片,现以对主视角的评判代表整个片段。这些场景中存在停车或是某些路段目标较少的情况,不利于后续处理,打分标准则是目标多,停车少的分数高。满分为100,低于60分的为不合格片段。将输出及格片段的文件夹名称与相应得分,以此挑选质量更好的数据。1.采用相似度对比算法来检测前后帧的相似性以判别停车或缓行片段2. 相似度对比+目标检测,根据目标数量以及重复帧数选出优秀片段。
2023-12-20 16:56:49
881
原创 BEVFusion(mit)复现Ubuntu20.04终端配置
参考文章大致上参考这篇文章,但还是遇到了很多问题首先查看cuda版本,原文要求11.3,这里使用的是11.1也没有问题nvcc -V因为服务器上有多个版本的cuda,参考此处切换创建switch-cuda.sh文件之后可以按以下指令切换创建虚拟环境并安装torch因为本人使用的是cuda11.1,所以将cu113改为cu111安装下列,记得先配置好镜像源再安装,不然会很慢。配置镜像源参考的这篇。
2023-12-12 16:04:54
3435
6
原创 感知哈希算法对大量视频抽帧,并存放到同名文件夹中
读取视频所在文件夹位置,对其中每个视频进行抽帧。遍历视频每一帧,通过对比前后帧图片之间的相似性,保存差异较大的图片,舍去相似图片。从而达到自动删除冗余帧数,得到有效帧数,并保存在与视频同名文件夹下。
2023-12-01 11:37:03
1691
1
论文阅读LightTS:少即是多:基于轻采样的MLP结构的快速多元时间序列预测
2025-03-12
面部情绪识别数据集(包含七种情绪的人脸图像)
2025-02-20
百度爬虫python程序
2024-04-28
bevfusion可视化结果
2024-04-28
视频抽帧处理,包括相似度对比,大量视频抽帧的分段处理
2024-04-28
bevfusion结果可视化拼接展示
2024-04-28
YOLO实现自动驾驶光照模型(白天,夜晚-有光照,夜晚-无光照)
2024-04-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人