- 博客(37)
- 收藏
- 关注
原创 【数据挖掘】二、基于BERTopic的主题建模:基于BERTopic的用户兴趣标签生成(史诗级详细教程)
数据准备从 CSV 文件中读取数据,并移除不必要的列。对文本数据进行清洗和预处理,包括句子分割、去除停用词、分词等。文本嵌入使用库中的预训练模型将文本数据转换为高维向量表示(嵌入)。将生成的嵌入向量保存到本地,以便后续重复使用。降维使用UMAP算法将高维嵌入向量降维至 10 维,以便进行聚类分析。聚类使用HDBSCAN算法对降维后的嵌入向量进行聚类,生成多个主题。可视化聚类结果,使用二维散点图展示不同主题的分布情况。主题分析。
2025-01-09 16:18:16
1614
1
原创 【YOLO系列复现】二、基于YOLOv6的目标检测:YOLOv6训练自己的数据集(史诗级详细教程)
基于YOLOv6模型的目标检测,基于YOLOv6模型的牛马检测,YOLOv6模型训练自己的数据集YOLOv6模型训练自己的数据集的详细教程
2024-11-28 10:34:25
1515
11
原创 【数据挖掘】一、基于LDA的用户兴趣建模(兴趣标签生成模型)--用户兴趣挖掘模型
本文的数据集来源于英雄联盟评论数据集,旨在挖掘 英雄联盟评论数据中的主题兴趣标签。本次实验是基于LDA模型实现用户的兴趣建模,即从英雄联盟评论数据中生成用户感兴趣的标签。本文 是基于英雄联盟的评论数据集,采用基于LDA主题生成模型,研发一种高效的兴趣标签生成模型。通过LDA主题模型,实现更准确、可靠的标签生成。同时,结合数据处理结束,对对英雄联盟等进行标签生成,并进行进一步的标签分类、聚类和热度分析,以揭示英雄联盟玩家用户兴趣和需求的深层信息。
2024-11-25 16:55:41
1360
24
原创 【数据分析】一、pandas数据处理指南:100个基于pandas数据预处理方法
本文介绍了Pandas库的基本用法,包括读取和保存CSV文件、查看数据基本信息、选择和操作数据列与行、处理缺失值、数据类型转换、排序、去重、设置索引、合并数据框、分组和聚合操作、字符串和时间序列处理、布尔索引、自定义函数应用、数据标准化和归一化、计算相关系数和协方差矩阵、数据框切片和条件筛选、数据透视和重塑、数据分块读写、数据压缩与解压缩、导出数据到多种格式等。这些技巧覆盖了数据处理的各个方面,适用于各种数据分析任务。
2024-11-25 14:43:13
1199
5
原创 【Docker容器】一、一文了解docker
Docker是一种容器化平台,通过使用容器技术,Docker允许开发人员将应用程序和其依赖项打包到一个独立的、可移植的容器中。微服务架构:采用微服务架构的应用程序可以将不同的服务打包为独立的容器,并通过Docker来部署和管理这些容器。这样可以确保在不同的阶段和环境中部署相同的应用程序,提高部署的速度和一致性。同时,可以通过增加或缩减容器的数量来扩展应用程序的规模,使其能够应对不同的流量需求。总之,Docker提供了一种轻量级、可移植和灵活的容器化解决方案,可以在应用程序开发中提供一系列的优势和实际应用。
2024-11-15 11:57:50
1124
28
原创 基于python的dlib库的人脸识别实现
下载下载下来的源代码模型解压后目录结构如下:具体目录结构如下:├─collect_face_data.py #离线图像采集├─config.py #配置文件├─face_recognition.py #离线人脸识别├─get_128_features.py #提取128纬特征向量├─LICENSE├─realtime_collect_face_data.py #实时图像采集├─realtime_face_recognition.py #实时人脸识别├─data #数据。
2024-11-15 09:09:52
1575
13
原创 【机器学习】一、机器学习中的最小二乘法--这一篇就能看懂最小二乘法的原理
设y和x之间的关系可以用一个公式在表示,但其系数为待定系数。然后,将各个点的实测数据与计算求得的数据相减,得到“误差”或者不符值(有正有负,但其平方都是正的),将这些不符值的平方相加,得到总的“误差”。通过调整公式中的各个系数,使得误差平方和最小,那么就确定了y和x之间的方程的最好结果。
2024-11-08 16:53:15
1838
4
原创 【目标追踪1】基于YOLOv8+DeepSort的目标追踪-YOLOv8-DeepSORT-Object-Tracking模型训练自己的数据集的史诗级详细教程
主要讲解的是:基于YOLOv8-DeepSORT-Object-Tracking的目标跟踪训练自己的数据集,从数据标注、数据处理、环境部署、配置文件配置、模型训练、模型评估到模型预测的史诗级详细步骤,适合零基础入门的小白。
2024-11-06 09:47:19
6175
70
原创 【数据集制作】一、基于YOLOv8的YOLO格式数据集制作详细教程-数据集标注(YOLOv8-DeepSORT-Object-Tracking目标跟踪训练自己的数据集之数据集标注)
本文主要是介绍了基于YOLOv8-DeepSORT-Object-Tracking模型的目标跟踪训练自己的数据集的数据集标注与处理,主要步骤有:1、视频抽帧:将图片从视频中抽帧出来;2、然后是基于labelimg工具的yolo格式的数据集标注3、最终是数据集拆分处理。
2024-11-06 09:44:16
3847
5
原创 【数据结构和算法】四、回溯算法的原理讲解和实战演练
回溯算法(backtracking algorithm)是一种通过穷举来解决问题的方法,它的核心思想是从一个初始状态出发,暴力搜索所有可能的解决方案,当遇到正确的解则将其记录,直到找到解或者尝试了所有可能的选择都无法找到解为止。回溯算法通常采用“深度优先搜索”来遍历解空间。在“二叉树”章节中,我们提到前序、中序和后序遍历都属于深度优先搜索。回溯算法可以理解为是一个试错算法。也就是在尝试在分步解决问题的时候,当发现某些不能满足问题答案的步骤时,可以取消之前的计算,再次尝试其它的步骤来寻找问题的答案。
2024-10-25 16:24:13
1121
3
原创 【数据结构和算法】二、python中的常用数据结构(数组、链表、堆栈、递归、二叉树、哈夫曼树等数据结构的基本原理讲解与实战演练)
本文主要讲解了基于python的常见的数据结构:1、讲解了链表和数组的基本原理和应用2、堆栈的基本原理和应用3、递归的基本原理和应用4、二叉树的基本原理和应用5、霍夫曼树的基本原理和应用
2024-10-25 11:58:11
1029
3
原创 【数据结构和算法】一、算法复杂度:时间复杂度和空间复杂度)
本文主要讲解了算法的复杂度,具体包括算法的时间复杂度和空间复杂度,是对算法的时间复杂度和空间复杂度的基本知识点的讲解
2024-10-25 11:03:37
1325
2
原创 【人工智能入门篇】机器学习之随机森林(RandomForest):随机森林知识讲解和基本入门
随机森林(random froest)算法被广泛应用于数据科学竞赛和实际问题的解决过程中。这个模型通常在兼顾准确的同时,还不需要对数据样本进行特征缩放、分类特征编码等操作,并且需要调整的参数也很少。更重要的是:随机森林模型也比神经网络等其它复杂模型更容易解释。1995年IBM研究院科学家何天琴首次提出了随机子空间方法(),也叫属性装袋(**attribute bagging)或特征装袋(feature bagging)。
2024-10-24 17:42:23
2021
4
原创 git安装与使用的史诗级教程【git推送文件到远程仓库(GitHub)教程】
本文主要讲解了:1、git的基本介绍和基本的工作流程。2、git的注册、下载以及安装的教程。3、git的零基础入门超级详细的使用方法。4、git远程仓库 创建项目以及密钥的生成教程5、git推送文件到远程仓库的教程。
2024-10-22 14:30:38
918
1
原创 编程语言选择指南:大学新生入门编程的最佳路径
对于大学新生而言,选择一门适合自己的编程语言是迈向编程世界的第一步。Python、Java、C 和 C++ 等语言各有特色,适用于不同的应用场景。希望每一位新生都能够找到属于自己的编程语言,开启精彩的编程旅程。不论选择了哪种语言,持续的学习和实践才是通往成功的必经之路。
2024-10-14 13:55:27
1038
1
原创 展望机器学习和神经网络的未来
近日,2024年诺贝尔物理学奖颁发给了机器学习与神经网络领域的研究者,这是历史上首次出现这样的情况。这项奖项原本只授予对自然现象和物质的物理学研究作出重大贡献的科学家,如今却将全球范围内对机器学习和神经网络的研究和开发作为了一种能够深刻影响我们生活和未来的突出成果。机器学习和神经网络凭借其高效、准确和实用的特点,已经广泛应用于生产制造、金融、医疗等众多领域。此次诺贝尔物理学奖的颁发,也引起了全球学术和科研圈的广泛关注和热议。 对于这一评奖结果,你又有何不同的看法?
2024-10-14 13:41:27
1042
3
原创 Flask接口通过WSGI服务器部署到后台
1、flask接口直接部署会出现下列警告:WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.2、将flask接口部署道WSGI生产服务器中。3、WSGI服务器的Gunicorn进行部署4、通过nohub将flask接口部署到WGSI服务器后台
2024-10-10 15:58:45
859
1
原创 MySQL可视化工具使用详细教程
1、Navicat工具下载和安装详细教程2、Navicat永久试用详细教程3、Navicat与数据库(Mysql、Oracle)等工具进行连接的详细教程4、Mysql数据库的可视化桌面安装
2024-09-25 11:32:52
901
3
原创 PG SQl安装教程(最详细的安装教程)
1、PG数据库(PostGreSQL)安装详细教程。2、PG数据库(PostGreSQL)与navicat的连接教程。3、PG数据库(PostGreSQl)下载教程
2024-09-23 16:16:09
4963
4
原创 Linux上通过nohub部署flask接口到后台(即通过nohup使得Python Flask项目在服务器上后台运行)
场景假设:在部署Python Flask项目到线上的时候,在Linux系统的虚拟环境中,运行项目可以正常访问到api,但是在Xshell中,一旦Ctrl+C或者关闭ssh,api接口停止了,api再也请求不到了。说明:例如输出的进程pid为144907,如果后期不想让该项目运行在后台了,就可以通过kill -9 <pid>来结束运行,即此处应是kill -9 144907。但是请注意,如果你的脚本不在当前目录下,或者当前目录不在 PATH 环境变量中,你需要使用。: 这行告诉系统这是一个 bash 脚本。
2024-09-23 16:05:07
1163
1
原创 针对安装fairseq时omegaconf版本报错问题:
针对安装fairseq时omegaconf版本报错问题:The conflict is caused by: fairseq 0.12.2 depends on omegaconf
2024-09-20 16:20:59
2767
8
原创 PASCAL VOC数据集制作,基于Mask-RCNN实例分割数据集制作
此次实验数据集制作是PASCAL VOC数据集制作,针对基于pytorch框架下的mask-RCNN实例分割制作PASCAL VOC数据集,以pycharm环境进行演示。
2023-08-16 17:38:53
1783
1
原创 【图像识别】基于VGG16模型的熊猫识别
此次实验环境:python==3.10,pytorch环境:conda install pytorch torchvision torchaudio cpuonly -c pytorch本次实验案例是pytorch环境下基于VGG16模型的大熊猫和中华小熊猫识别数据集结构如下:bear数据集部分展示如下:pandas数据集部分展示如下:(2)设置全局参数运行截图此次案例我使用的是CPU进行训练,没有使用GPU。(3)数据预处理(4)读取数据集运行截图(2)定义模型训
2023-05-09 14:07:59
810
1
原创 【数据集制作】VOC2007格式数据集制作和处理教程(Faster-RCNN模型标准输入)
此数据集可用于目标检测和图像分割,此次实验案例是讲解Faster-RCNN、YOLOv3等模型的进行目标检测的标准数据集输入,没讲分割,所有用不到上述所有数据集,只讲其中目标检测部分数据集的制作。此次案例是制作VOC2007数据集的制作教程,用于目标检测,此次数据集处理可用于Faster-RCNN、YOLOv3等网络进行目标检测模型的标准输入。至此,VOC2007格式数据集制作完成。
2023-04-25 10:48:48
5210
4
原创 AttributeError: module ‘labelme.utils‘ has no attribute ‘draw_label‘,labelme_json_to_dataset批量处理json
错误类型:AttributeError: module 'labelme.utils' has no attribute 'draw_label'
2023-03-31 18:14:31
1481
原创 【数据集处理】制作自己的tusimple数据集(图森数据集)(LaneNet模型数据集)
数据制作图森数据集(tusimple),tusimple数据集LaneNet模型的标准数据集,便于后期实现基于LaneNet模型的车道线检测。
2023-03-31 18:01:17
5528
15
原创 【目标检测】YOLOv5模型训练自己的数据集—YOLOv5实现动物检测(基于pytorch框架的动物牛马检测识别)
yolov5模型训练自己的数据集
2023-03-17 18:45:33
6610
9
原创 labelme制作yolov5模型的数据集
labelme安装和使用教程python实现json文件转txt文件格式python实现对指定格式文件进行提取
2023-03-17 17:10:15
6666
10
原创 ANACONDA安装教程-Windows环境安装
win键+R:输入cmd,进入cmd,输入:python。则环境变量配置成功,至此anaconda环境安装完成。去anaconda下载安装包。
2023-03-14 18:14:23
321
原创 【NLP基础入门】基于Pytorch的神经网络实现
从PyTorch中经典的quickstart示例开始,从中学习神经网络构建和训练的过程,数据集是数据集。下面我们就一步步分解这个过程,其中也会学习认识到一些Pytorch为我们提供的框架内置对象和函数。该模块是Pytorch框架的入门,如果初次接触Pytorch框架,可能还不是很适应,所以以先完成完整的模型训练流程为重。后续再根据任务需求,一步步的扩展Pytorch的认知版图。
2023-03-12 00:58:30
776
原创 【图像分类】猫狗分类实战—基于pytorch框架的迁移学习(ResNet50模型实现分类实战)
ResNet50分类实战,猫狗分类实战,图像分类、迁移学习
2023-03-09 14:11:56
7544
6
数据挖掘+BERTopic的用户兴趣建模+主题挖掘+主题生成
2024-12-02
英雄联盟评论数据集和停用词表
2024-11-25
基于python的dlib库的人脸识别实现
2024-11-15
基于YOLOv8+DeepSort的目标跟踪的数据集
2024-11-12
ckpt.t7 文件(deep-sort-pytorch重识别权重文件)
2024-11-12
Deep-Sort-Pytorch-python\deep-sort-pytorch
2024-11-12
基于YOLOv8+DeepSort的目标追踪-YOLOv8-DeepSORT-Object-Tracking模型
2024-11-12
基于python的dlib库的人脸识别实现
2024-11-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人