自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

带鱼工作室的博客

AI算法工程师一枚,欢迎大家一起讨论!

  • 博客(102)
  • 资源 (7)
  • 收藏
  • 关注

原创 知识图谱可视化之Echarts-静态图谱与Django构建动态图谱

1 本文介绍本文主要介绍知识图谱可视化的构建方法,使用Echarts工具进行构建,在之前的文章:知识图谱可视化之cytoscape.js构建知识图谱(django框架将数据由后台传到前台进行图谱构建)中介绍过使用Cytoscape.js工具进行静态图谱与Django动态图谱的构建方法,感兴趣的小伙伴可以自行查看。本文主要使用Echarts库进行构建,想要了解不同构建知识图谱可视化的同学可以参看本文与上面提到的文章。2 EchartsEcharts工具库是使用js代码进行各种工具图的构建,图形样式

2020-10-15 16:47:13 11033 17

原创 知识图谱可视化之cytoscape.js构建知识图谱(django框架将数据由后台传到前台进行图谱构建)

1、cytoscape.js是什么cytoscape.js是常用的构建知识图谱的工具,是一个网络图的可视化工具。通常有两种使用方式:第一种是桌面版的Cytoscape Desktop,集成好的app供我们使用。第二种是前端js库,通过在前端代码中引用cytoscape.js进行使用,通常cytoscape.js需要结合jquery.js进行使用。在此使用cytoscape.js进行...

2020-04-05 13:00:17 10978 19

原创 vllm安装注意事项[nccl、cuda、python相关]

本文总结了安装vLLM时的关键注意事项:1)Python版本要求,建议使用3.10;2)NCCL版本与vLLM的兼容性问题,指出NCCL 2.20.5对应vLLM 0.6.0可用,而NCCL 2.21.5与vLLM 0.8.5不兼容;3)提供了两种解决方案:更新NCCL版本或使用vLLM的Docker镜像。特别强调不同vLLM版本对模型部署的影响,如Qwen3需要vLLM 0.8.5以上版本支持分布式部署。

2025-06-05 17:03:35 287

原创 conda更换清华源

本文介绍了如何在Linux环境下为Anaconda配置更快速、更稳定的清华源。首先,通过查看~/.condarc文件确认当前conda源,并建议删除默认的官方源defaults以提高下载效率。接着,使用conda config --remove-key channels命令清除原有源,并通过一系列conda config --add channels命令添加清华源。配置完成后,通过创建虚拟环境测试新源的有效性,确保所有包均能正确下载。文章最后提供了详细的命令和步骤,帮助用户顺利完成源更换,并鼓励用户在遇到问

2025-05-15 17:01:40 1364

原创 基于Qwen-14b的基础RAG实现及反思

本文主要介绍RAG的基础实现过程,给初学者提供一些帮助,RAG即检索增强生成,主要是两个步骤:检索、生成

2025-05-09 16:54:52 703

原创 ImportError: cannot import name ‘Optional‘ from ‘pydantic‘

ImportError: cannot import name 'Optional' from 'pydantic'

2025-05-08 19:49:32 192

原创 ffmpeg多媒体(音视频)处理常用命令

总结一些音视频常用的ffmpeg处理命令

2025-05-08 13:58:59 645

原创 通义读光系列文字检测+识别模型端到端OCR应用

通义读光系列文字检测+识别模型端到端OCR应用

2025-05-07 15:07:46 1233

原创 基于Python的Socket UDP协议RTP数据包通信传输示例

本文主要基于Python语言实现了基于Socket UDP协议的RTP数据包通信与传输,其中,示例RTP数据包为PCMA编码的音频包,其他类型RTP同理,通过socket长连接将示例用户A与B连通并通信

2025-05-07 09:31:20 1120 1

原创 cuda12.4安装tensorflow-gpu 2.18.0

cuda12.4支持tensorflow-gpu

2025-03-17 19:07:48 944 1

原创 1024程序员节

又是一年1024,同样又是心疼程序员的一年!

2024-10-24 14:42:33 135

原创 Something wrong with the VAD algorithm

Something wrong with the VAD algorithm

2024-08-29 17:08:21 882 2

原创 ImportError: /usr/lib64/libm.so.6: version `GLIBC_2.23‘ not found (required by /opt/conda/lib/ ...

ImportError: /usr/lib64/libm.so.6: version `GLIBC_2.23'

2023-11-29 14:05:40 1793

原创 pydantic.errors.PydanticUserError: If you use `@root_validator`....

pydantic.errors.PydanticUserError: If you use `@root_validator`....

2023-11-24 09:35:55 9168

原创 ValueError:The following settings are not supported :{‘username‘: ‘neo4j“}

不同版本的py2neo,连接neo4j数据库的方式如上,拿走不谢!py2neo版本不同所导致的问题,下面我通过一段代码说明该问题。

2023-08-07 16:56:07 2488 1

原创 深度学习强制设置GPU_id

深度学习强制修改gpu id

2022-10-17 15:24:15 3422

原创 pyinstaller 打包可执行程序过程中的常见错误解析

pyinstaller 打包可执行程序过程中的常见错误解析

2022-07-17 10:07:18 2287

原创 使用xftp上传文件到linux服务器报错“550 Permission denied”

问题描述:使用xftp由windows上传文件到linux服务器时发现上传错误,右键查看错误状态时发现提示550 Permission denied。解决方法1:修改上传的文件夹权限,可以在xftp中的linux窗口中右键并修改权限为777,也可使用“chmod 777 文件夹名字”进行修改。解决方法2:若上述方法不解决问题,依然上传失败,则打开服务器(我的linux是Ubuntu16.04),终端输入:进入如下页面并按照图中指示完成操作 上述操作表示在服务器的ftp配置中打开了系统的上传权限。修改后

2022-06-22 09:58:23 4129

原创 Django后端引用深度学习模型报错“No Model Named xxx”

在实际生产中,我们往往会将训练好的深度学习模型作为Web系统的后端用于构建系统,在这个过程中可能会出现一个问题,例如我们的模型名称为“BiLSTM”,则会提示“No Model Named BiLSTM”但此时你已经将训练好的模型及模型代码放置在指定路径中,为了django的views或者你的predict函数调用,那么这是为什么呢?在这个过程中大家一定要注意,训练时不要保存模型结构及参数,即不要通过torch.save(model, 'BiLSTM.pth'),这样就会有上面的问题,即使你已经

2022-05-31 14:48:28 1189 4

原创 获取Neo4j中的知识图谱并可视化到前端(Django+py2neo+Echarts等)

最新技术开发获取Neo4j中的知识图谱并可视化到前端(Django+py2neo+Echarts)

2022-05-07 16:43:07 6873

原创 ubuntu16.04删除用户及用户目录(高效方法)

1 普通方法(不推荐)userdel -r username使用上述方法删除用户及其目录时会出现问题,若服务器在使用中,会出现想要删除的用户进程存在且进程无法kill,可重启后登陆管理员用户执行上述命令删除。2 高效方法(推荐)推荐删除用户及目录方法:sudo deluser --remove-home username仅删除用户方法:sudo deluser username删除后可使用命令查看用户是否被...

2022-03-29 21:13:03 7569

原创 ubuntu16.04创建新用户后没有cuda环境

ubuntu16.04创建新用户后没有cuda环境

2022-03-29 21:05:56 1594

原创 Mac与远程服务器数据交互软件Cyberduck

当使用远程服务器时,避免不了数据传输,mac传输数据至服务器端,服务器端下载数据到mac中,这就使用到了Cyberduck软件,提供下载链接:链接: https://pan.baidu.com/s/1TN0Cvv2kIoXWEBPP87g5mg?pwd=kw3f提取码: kw3f解压后即可看到软件图标,为:打开软件后点击左上角的新建连接出现如下图的页面,首先在最上方选择文件传输协议,例如是ftp还是sftp等,然后在服务...

2022-02-22 15:17:18 1478

原创 Mac访问远程服务器软件TurboVNC

今天介绍一款mac电脑访问远程服务器的可视化软件:TurboVNC for mac,并提供免费下载链接: https://pan.baidu.com/s/1JkXVnx02sx_4KNWEJUNJug?pwd=u856 提取码: u856软件镜像较小,下载镜像后安装如下图标:打开软件并点击connection,位于mac电脑最上面的菜单栏中,然后在options中输入远程服务器的具体ip与端口,点击connect,然后输入用户名与密码即可完成...

2022-02-22 15:06:14 1501

原创 Mac访问NTFS文件系统的移动硬盘

在实际工作中,经常会使用mac电脑与移动硬盘进行数据交互,而在使用中发现我们的硬盘在mac上是只读模式,无法进行数据交互,是由于mac的文件系统与硬盘的文件系统不同,这就需要工具软件来帮助我们。mac系统版本:10.15.6硬盘:希捷硬盘实际上在希捷硬盘官网提供了工具软件,首先进入希捷官网https://www.seagate.com/cn/zh/ 然后点击支持-软件下载,进入到如下页面:然后根据自己的mac系统版本下...

2022-02-22 12:12:43 1027 1

原创 FastText词向量训练、使用及可视化操作【保姆级教程(包含藏文处理方法)】

目录一、前言二、FastText词向量训练2.1 数据输入格式2.2词向量训练三、词向量使用一、前言本文是word2vec词向量篇的姊妹篇。fasttext是静态词向量构建方法的一种,本文将介绍fasttext词向量是如何训练的,以及我们训练好的fasttext词向量如何使用,最后介绍了可视化fasttext词向量,即通过可视化图来查看训练的fasttext质量,本文为保姆级教程,会将数据输入格式等细节一并讲清楚。在开始本文前,首先说下本文使用的gensim版...

2022-02-14 12:32:11 6855 7

原创 Word2Vec词向量训练、使用及可视化操作【保姆级教程(包含藏文处理方法)】

一、前言word2vec是静态词向量构建方法的一种,本文将介绍word2vec词向量是如何训练的,以及我们训练好的word2vec词向量如何使用,最后介绍了可视化word2vec词向量,即通过可视化图来查看训练的word2vec质量,本文为保姆级教程,会将数据输入格式等细节一并讲清楚。在开始本文前,首先说下本文使用的gensim版本为3.8.3(使用gensim的word2vec方法训练词向量),为确保进行本文所有流程,请与本文gensim版本一致,避免发生版本问题!本文也将会介绍藏文w...

2022-02-10 13:32:16 34528 42

原创 2080Ti与3080Ti单机多卡安装与并行训练

1 本人环境机器:dell T640服务器系统:Ubuntu16.04 LTS已安装显卡:2080Ti已安装驱动版本:NVIDIA-Linux-x86_64-470.57.02.run已安装cuda版本:cuda_10.0.130_410.48_linux.run已安装cudnn版本:cudnn-10.0-linux-x64-v7.4.2.24.tgz需求:与服务器无关,大家只要是Ubuntu16.04系统即可参考。由于目前需求,需要扩充一张3080Ti显卡,但全网关于2080T

2021-11-23 21:18:08 4347 3

原创 终于没有忘记1024

1024快乐!愿所有程序员都不被脱发所困扰!

2021-10-24 12:27:05 121

原创 RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED该错误是在cuda:10.0 pytorch:1.2 GPU服务器环境下训练模型出的问题,错误提示CUDNN状态执行失败该错误的问题在于cuda的版本与pytorch的版本不对应,导致cuda不能加速模型的训练同时执行失败。在下载pytorch时,我们需要在官网正确下载 pytorch与cuda的版本对应关系,在本机训练模型时,我的环境为cuda 10.0 ,pytorch 1...

2021-10-05 20:58:46 353

原创 RuntimeError: Expected hidden[0] size (x, x, x), got(x, x, x)

先上图:上图是在训练BILSTM网络时出现的问题。问题描述:通过定义BILSTM网络的初始权重h0,c0,并将其作为BILSTM的初始权重输入至网络,通过如下代码实现output, (hn, cn) = self.bilstm(input, (h0, c0))网络结构如下所示:self.bilstm = nn.LSTM( input_size=self.input_size, hidden_size=self.hidden_siz.

2021-10-05 14:37:56 6112 1

原创 windows安装CPU版本 torch_geometric教程

由于最近需要搞图神经网络(GNN),因此需要安装torch_genmetric:Graph Neural Network Library for PyTorch,torch_genmetric 封装了图神经网络常用的算法,例如 GCN(图卷积网络)、GAT(图注意力网络)等等,因此安装其是十分必要的。本人环境配置:系统:windows10,python版本:3.6.1,pytorch版本:1.5.0+cpu在尝试官网方法安装失败后,通过下载安装文件到本地后成功安装torch_genmetric,现.

2021-10-01 21:56:54 4187 2

原创 RuntimeError: cuda runtime error (59) : device-side assert triggered at XXX

如上图所示为使用Ubuntu GPU服务器训练文本分类模型时发生的错误,单纯看最后的错误很难看出错误来源,但我们注意到错误中提示了loss.backward()发生了问题,也就是loss计算的错误。 这种问题大部分是标签定义的问题,可以看到在程序中第七行我定义了一个class_dict的一个字典,用于存储类别对应的id,刚刚说到了这种问题大部分是标签定义的问题,观察一下我定义的标签,是由 1 ~ 7,起初认为这种定义没有问题,但大家需要注意的是 模型输出后是根据arg...

2021-07-27 12:15:56 507

原创 RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

如上图所示为在 Ubuntu 服务器上训练深度学习网络出现的问题, Pytorch版本1.2, cuda版本10,在训练关系抽取的分类任务时出现的错误。 根据错误 RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED的字面理解是CUDNN的状态没有初始化,但我通过该环境是可以训练其他深度学习模型的,所以这和cuda、pytorch的版本是没有任何关系的,其他博客都在说是Pytorch的版本与cuda版本不对应导...

2021-07-27 11:55:39 43957 24

原创 Web 端使用Python生成的图片重叠、覆盖

问题描述:通过Django框架搭建Web项目,在项目中点击不同功能模块生成不同的图片,图片通过matplotlib库生成,项目中需要生成两个图片,当首次使用时,点击功能按钮生成第一个图片时是正常的,点击die...

2021-06-09 14:21:48 954

原创 Django 后端向前端传输html代码

在实际Django项目开发中,我们常会在Django后端views.py中调用其他算法,然后将算法返回的结果传输至前端展示,但有时可能会在后端返回一些html代码,例如对某些文字加粗、b

2021-06-09 14:14:49 1517

原创 div 去除滚动条显示效果

如上图可以看到当为某一区域添加可滚动属性 overflow:auto 后页面显示了滚动条,十分影响页面效果,下面介绍一下去除页面滚动条显示,但页面依然可滚动方法。首先使用pycharm打开项目,然后打开需要去除滚动条的html文件,进入html页面后使用组合键 ctrl+f 打开检索框,在检索框中输入overflow:auto 后 即可在页面中看到高亮的部分,如下图所示然后记录属性值为overflow:auto 的 css样式,例如上图中的为 #iframeshow然后在下方添加...

2021-06-01 17:58:29 1567 2

原创 AssertError:r.status code == 200

错误描述:使用py2neo连接neo4j数据库需要执行query查询某些信息时出现问题,py2neo版本4.3.0,同时使用Graph成功连接neo4j数据库,只有执行query时出现问题

2021-06-01 17:04:46 3731 6

原创 ValueError:The following settings are not supported :{‘username‘: ‘neo4j“}

先来看一张图片使用python连接neo4j数据库时出现了这个问题, 明明已经通过pip install 安装过py2neo了,并且程序中也写过了import py2neo,但还是提示设置的用户名无效,这是为什么呢?究其根本是py2neo的版本不同,出现上述问题时是由于你的py2neo版本太高,新版本的写法不是这种解决办法:安装低版本的py2neo 例如4.3.0命令:pip install py2neo==4.3.0 -i https://pypi.douban.com/sim.

2021-05-11 21:21:59 14997 13

原创 ul去掉项目编号及所占空间

ul去掉项目编号与编号所占空间ul{list-style-type: none; /* 去掉编号 */margin:0;padding:0; /* 去掉编号所占空间 */}div去掉上下左右距离body{margin:0;padding:0; }

2021-01-14 14:50:31 728

【Socket RTP通信】基于Python的Socket UDP协议RTP数据包通信传输示例

本资源主要基于Python语言实现了基于Socket UDP协议的RTP数据包通信与传输,通过socket长连接将示例用户A与B连通并通信,在传输过程中,用户A或用户B的socket连接即作为服务端接受RTP数据包,也作为客户端发送RTP数据包,值得重点说明的是:RTP交互过程接收端和发送端的ip及port必须是一个socket连接才能做到交互及正确解码,需正确处理 资源中已经封装了循环监听并处理的相关逻辑,可直接使用,注:结合博文理解效果更佳:https://blog.youkuaiyun.com/liaoningxinmin/article/details/147745811?spm=1001.2014.3001.5501 若下载资源,请认真阅读上述博文,如有问题,请及时沟通。

2025-05-07

【Python构建Neo4j知识图谱应用类】中药三元组提取及知识图谱构建(Python+Re+Py2neo+Neo4j)

【Python构建Neo4j知识图谱应用类】中药三元组提取及知识图谱构建(Python+Re+Py2neo+Neo4j) 本资源的主要逻辑是提取中药描述数据中的三元组信息,然后使用py2neo等相关工具将三元组信息构建到Neo4j图数据库中。 应用扩展:构建好的图谱作为基础可用于构建基于知识图谱问答的系统、图谱管理系统等与知识图谱密切相关的图谱设计应用,均可以本项目为基础进行搭建。 注:中药三元组信息可通过deal_txt.py读取中药.txt,进而生成triple.txt的中药三元组信息,最后运行graph_build.py构建图谱,请按照程序注释中的教程安装相关依赖库,确保准确执行,如有问题 可及时沟通

2025-05-02

【Python构建知识图谱应用类】地震信息相关数据知识图谱构建(Python+Py2neo+Neo4j)

【Python构建知识图谱应用类】地震信息相关数据知识图谱构建(Python+Py2neo+Neo4j) 本资源的主要逻辑是处理地震数据三元组信息,然后使用py2neo等相关工具将三元组信息构建到Neo4j图数据库中。 应用扩展:构建好的图谱作为基础可用于构建基于知识图谱问答的系统、图谱管理系统、基于图谱的知识检索系统等与知识图谱密切相关的图谱设计应用,均可以本项目为基础进行搭建。 注:提前启动Neo4j数据库,运行KGBuild.py构建图谱,注意修改代码中Neo4j的账号密码,如有问题 可及时沟通

2025-05-02

【基于python的图像字符画实现】

图像字符画是一种由字母、标点、汉字或其他字符组成的图画。简单的图像字符画是利用字符的形状代替图画的线条来构成简单的人物、事物等形象;复杂的图像字符画通常利用占用不同数量像素的字符代替图画上不同明暗的点。 本项目主要使用python语言的相关程序库生成图像字符画,主要内容如下: 工具函数: fun1 图片预处理 fun2 灰度转换、字符与灰度映射 fun3 获取当前目录下的所有图片名称 功能函数: function1.通过对同一张图像根据不同的灰度值设置不同的字符,对比后找出效果较好的对应关系。 function2.通过为多种类型的图像设置相同的字符,对比呈现出的结果,找出适合字符画转换的一类型图像。 项目代码逻辑清晰、注释详实,如有问题请及时沟通

2025-05-02

【协同过滤python实现逻辑】-基于物品/用户的协同过滤算法

【协同过滤python实现】-基于物品/用户的协同过滤算法 算法实现,可用作工具函数用在各类设计系统中,完成推荐算法的实现 资源中UserCF及ItemCF分别为基于用户/物品的协同过滤工具算法,compare为两算法的调用主函数

2025-05-01

【基于python的文本信息处理】-包括中文文本分词、去停用词、词频统计等内容

原始数据、停用词列表均提供,运行txt_deal.py即可

2025-05-02

ffmpeg for mac 音视频处理神器

ffmpeg for mac 音视频处理神器 常用命令如ffmpeg -i 等等,灵活处理音视频格式转换、编码转换、切割分段等操作

2025-04-30

机器学习乐曲韵律分析系统(Python+Django+Librosa+GaussianNB+Html)-机器学习在音频上的最佳实践

【机器学习】乐曲韵律分析系统(Python+Django+Librosa+GaussianNB+Html)-机器学习在音频上的最佳实践 基于机器学习的乐曲韵律分析系统: 1、首先使用Librosa提取音乐的韵律特征(RhythmC/MusicDeal/DataPro.py 注:修改音频及模型保存路径) 2、然后利用GaussianNB机器学习算法构建乐曲韵律分类器,学习音频特征(RhythmC/MusicDeal/DataPro.py) 3、利用训练好模型GaussianNB结合django web框架搭建可视化系统,实现对上传系统的不同音频的韵律分析 依赖库版本: django==2.0.4 librosa==0.7.2 sklearn==0.19.2 执行步骤: 1、pycharm打开本项目,并在terminal中执行 python manage.py runserver 2、项目启动后,复制本地地址 http://127.0.0.1:8000/ 到浏览器中,进入web页面(见系统首页图片) 3、然后可以点击上传按钮,上传待分析的音频,并点击分类按钮 4、稍等片刻,即可看到分析结果(见执行结果图片) 注:注意修改django项目中的路径 本项目逻辑清晰,说明详尽,适用于机器学习、设计等 下载后有问题可私信沟通解决

2025-05-01

知识图谱可视化之cytoscape.js构建知识图谱项目源码

项目主要介绍cytoscape.js的使用方法: 1)构建静态html文件进行图谱展示 2) 使用Python的django框架进行开发,并将后台业务逻辑生成的数据传送到前端js中进行展示,实现动态图谱构建,满足工程实际需要。 动态与静态图谱均整合至项目源码中,使用不同路由即可访问。 注:结合博客(https://blog.youkuaiyun.com/liaoningxinmin/article/details/105323281?spm=1001.2014.3001.5502)理解本项目更佳,运行项目前请看readme文件!

2025-05-01

知识图谱可视化之Echarts-静态图谱与Django构建动态图谱项目源码

本项目主要介绍使用Echarts进行图谱可视化的方法: 1) 知识图谱的静态展示(静态html文件) 2) 使用Python的django框架进行开发,并将后台业务逻辑生成的数据传送到前端js中进行展示,实现动态图谱构建,满足工程实际需要。 动态与静态图谐均整合至项目源码中,使用不同路由即可访问。 注:结合博客(https://blog.youkuaiyun.com/liaoningxinmin/article/details/109096087?spm=1001.2014.3001.5502)理解本项目更佳,运行项目前请看readme文件!

2025-04-30

【藏文信息处理】藏文停用词列表:自然语言处理中藏文文本分析与预处理资源

内容概要:该文档名为《藏文停用词.txt》,主要收录了大量藏文字符和词汇,这些词汇在藏语文本处理中通常被视为停用词。停用词是指在文本分析或信息检索过程中需要过滤掉的常见词汇,它们虽然频繁出现但对语义贡献较小。文档中的内容包括数字、标点符号、助词、语气词、连词等多种类型的藏文符号和词汇,旨在为藏语文本处理提供基础数据支持。; 适合人群:从事藏语文本处理、自然语言处理研究的相关人员,以及对藏文语言学感兴趣的学者。; 使用场景及目标:①作为藏文文本分类、情感分析、信息检索等任务的数据预处理阶段的参考依据;②帮助研究人员更好地理解和处理藏文文本,提高文本处理的准确性和效率。; 其他说明:此文档以纯文本形式呈现,方便直接读取和使用。在实际应用中,可以根据具体需求对停用词表进行调整和优化。

2025-04-30

【自然语言处理】中文停用词表stopwords-baidu.txt:文本处理与信息检索中的噪声过滤工具

内容概要:stopwords_baidu.txt 是一份包含大量停用词的文本文件,旨在为自然语言处理(NLP)任务提供过滤常见词汇的支持。文件中列举了多种类型的停用词,包括但不限于标点符号(如逗号、句号、问号等)、数字(如0-9)、英文单词(如able, about, above等)、中文词汇(如一些、一定、一方面等),以及其他符号(如括号、引号等)。这些停用词在文本分析中通常被忽略,以减少噪音并提高模型效率。; 适合人群:从事自然语言处理、数据挖掘、文本分析等相关领域的研究人员和技术人员。; 使用场景及目标:①用于预处理阶段,清理和标准化文本数据;②提高机器学习模型训练效率,去除对分析无益的高频词汇;③优化搜索算法,增强检索相关性和准确性。; 其他说明:此文件适用于多种语言环境,不仅涵盖英文和中文,还包括一些通用符号。在实际应用中,可根据具体需求调整停用词列表,确保其适应特定领域或任务的要求。

2025-04-30

transformer逻辑搭建demo

transformer逻辑搭建demo

2025-04-30

c4.5决策树算法实现逻辑

c4.5决策树算法实现

2025-04-30

id3决策树算法实现逻辑

id3决策树算法实现

2025-04-30

【自然语言处理】fasttext藏文词向量构建及plot可视化效果展示

【自然语言处理】fasttext藏文词向量构建及plot可视化效果展示 注:结合本人博客理解效果更佳

2025-04-30

【自然语言处理】word2vec藏文词向量构建及plot可视化效果展示

【自然语言处理】word2vec藏文词向量构建及plot可视化效果展示 注:结合本人博客理解效果更佳

2025-04-30

【自然语言处理】汉语词性对照表:可用于nlp任务中的各种词性处理

内容概要:本文档为《汉语词性对照表》,详细列出了汉语中各类词性的分类及其标签。主要包括名词、时间词、处所词、方位词、动词、形容词、区别词、状态词、代词、数词、量词、副词、介词、连词、助词、叹词、语气词、拟声词、前缀、后缀、字符串和标点符号等。每个大类下又细分多个子类,如名词分为普通名词、人名、地名等;助词细分为“着”、“了”、“过”等多种形式,几乎涵盖了所有汉语词性,并赋予了每个类别相应的标记符号,便于计算机处理和自然语言理解。; 适合人群:从事汉语语言学研究、自然语言处理技术开发以及对汉语语法有兴趣的学习者。; 使用场景及目标:①帮助研究人员快速查找并理解汉语词性的分类与标记规则;②为自然语言处理系统的开发提供标准参照,确保词性标注的一致性和准确性。; 其他说明:文档以纯文本格式保存,便于阅读和程序解析,是汉语信息处理领域的重要参考资料。

2025-04-30

【多媒体处理】FFmpeg常用命令总结:音频视频转换裁剪及特效处理实用技巧

内容概要:本文档汇总了FFmpeg工具的多个实用命令示例,涵盖音频和视频处理的各个方面。包括但不限于:音频采样率转换、音频格式转为raw、查询音频文件时长与音量检测、调整音频音量大小、改变音频播放速度、视频逆序播放(针对无音频视频)、精准视频片段截取、音频片段截取、视频与音频合并处理、调整视频宽高比等。每个命令都提供了具体的参数设置方法; 适合人群:音视频编辑爱好者、多媒体处理领域的初学者或有一定经验的技术人员; 使用场景及目标:①在音频处理方面,可以完成从格式转换到音质调整的任务;②在视频处理上,能够实现基本的剪辑操作如切割、翻转、合并等;③为用户提供了一站式的解决方案,帮助用户快速掌握FFmpeg命令行工具的基本用法,提高工作效率; 阅读建议:本指南以命令实例为主,建议读者结合实际需求选择相应的命令进行尝试,在实践中理解各个参数的作用并灵活运用。

2025-04-30

python文字识别 基于阿里读光系列模型 整合检测+识别 端到端处理

python文字识别 基于阿里读光系列模型 整合检测+识别 端到端处理 检测识别串联处理 demo中随机使用了行检测及行识别模型,探索更多模型详见:https://www.modelscope.cn,搜索读光 原理:检测到图片行、然后对图片行识别

2025-04-30

老版本mac社区版pycharm 2022,喜欢老版本用户的福音

老版本mac社区版pycharm 2022,喜欢老版本用户的福音

2025-04-30

mac思维导图客户端 xmind-24

mac思维导图客户端 xmind-24

2025-04-30

sip 虚拟电话for mac,接入sip服务即可实现基于sip的通话

sip 虚拟电话for mac,接入sip服务即可实现基于sip的通话

2025-04-30

filezilla 3.66.5 mac 客户端ftp工具

filezilla 3.66.5 mac 客户端ftp工具,与堡垒机交互,可直接上传或下载文件

2025-04-30

堡垒机teleport 3.6.3客户端for mac

mac teleport远程堡垒机客户端 镜像安装后打不开时,终端执行sudo xattr -d com.apple.quarantine /Applications/TP-Assist.app 即可正常使用

2025-04-30

TF-IDF算法常用停用词表

在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!

2019-03-18

网易云《有一种悲伤》评论.xlsx

通过爬虫爬取网易云音乐中的歌曲《有一种悲伤》,我们可以使用此评论做舆论分析的基础数据处理,分析人们对于这首歌曲的评论,是中性评论还是积极评论还是消极评论。如果需要舆论分析代码请联系我,可以在博客中给我留言!

2019-06-15

基于UCI中Car Evaluation数据集的分类、回归与聚类

通过在UCI开源网站上下载Car Evaluation数据集,对其使用机器学习算法进行分析,分别使用了分类算法,回归算法,聚类算法,文件中附数据集以及代码,代码使用jupyter运行即可,代码中介绍比较详细,通熟易懂,从头至尾皆可跑通!

2019-06-15

mnist_dataset_csv.zip

神经网络研究员Yann LeCun提供的手写数字MNIST数据集,提供了数据集与测试集,数据整合了原始数据,组合为csv文件,可作为神经网络训练数据。训练集60000条数据,测试集10000条数据。

2020-07-02

dynamic-data2.html

Echarts官方的例子为以天为单位进行刷新,本资源修改刷新最小单位为秒级,更贴近实际应用,具有一定的指导意义

2020-06-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除