- 博客(141)
- 资源 (19)
- 问答 (1)
- 收藏
- 关注
原创 交叉熵的理解:理解交叉熵的时候勿引入熵的概念来理解
交叉熵的理解:理解交叉熵的时候勿引入熵的概念来理解结论理解交叉熵的时候勿引入熵的概念来理解原因每当我试图交叉熵的时候,网上找的科普文章都会引入熵的概念,说要从熵的概念入手,然后感觉自己更加迷茫了。然后一堆名词就过来了,如信息量、熵、概率、相对熵、交叉熵等等理解但是其实完全不用管它,不用管熵这个概念,直接损失函数的目的出发。损失函数是寻找预测的标签与真实标签的差异,均方误差(MSE)、均方根误差(RMSE)、MAE(平均绝对误差)都是为了这一个目的。而交叉熵的log,也能实现这一
2021-10-27 13:11:42
480
原创 RTX3060适配的tensorflow
RTX3060适配的tensorflowRTX3060及以上适配的tensorflow适宜人群原因魔改版tensorflowRTX3060及以上适配的tensorflow适宜人群不适用tensorflow2.0以上,只使用tensorflow1.0版本原因RTX3060以上版本最高支持cuda11.4然而实际上只支持cuda11以上;cuda11以上不支持tensorflow<2.0所以,用不了魔改版tensorflow大佬范沅魔改了编译的是nvidia魔改版的tensorflo
2021-10-15 22:42:56
2347
1
原创 深度学习的特征与标签的维度(keras)
@TOC)一、结论Dense层维度要与标签维度一致,根据需要的一致;[1,2,3]对应0与[1,2,3]对应[5,6,8]即可。如文本分类,则标签不需要one-hot,dense层不需要TimeDistributed因为文本分类 train_x(16656, 22) ,使得22个字的评论与标签0或者1,进行匹配,所以标签不需要one-hot,dense层不需要TimeDistributed如中文分词,需要字与标签一一对应,标签one-hot,使得标签升维;TimeDistributed使得x与y维
2021-07-22 16:45:40
5743
原创 appium安装使用问题(二)
appium安装使用问题(二)一、问题Appium安装问题第二步:问题一:第三步:问题二:二、解决方法第一个问题解决方法第二个问题的解决方法三、环境变量配置完整图一、问题Appium安装问题appium绝对不能直接安装,原因下载太慢使用node.js下载要用appium就必须node.js,下载node.js一路next的时候会有一个需要打勾的地方,注意不要打勾,因为这会安装python;当然对于还没有python的可以打勾勾上,如果有的就不要打勾其次,对于不想将npm包安装到系统盘的,需要
2021-07-19 14:50:37
1491
原创 python运行加速的几种方式
python运行加速的几种方式一、总结二、全面加速(pypy)二、减少文件的打开即with的调用三、if判断靠前一、总结1、使用pypy2、减少函数化调用3、减少文件的打开即with的调用,将这一调用放在for循环前面,然后传递至后面需要用到的地方4、if函数判断条件多的尽量在前面全面加速(pypy)二、全面加速(pypy)将python换为pypy,在纯python代码下,pypy的兼容性就不影响使用了,因为一些纯python的代码常常会用pypy进行一下加速测试代码,for循环1000
2021-07-11 22:58:12
3407
3
原创 Keras.Backend的一些理解
Keras.Backend的一些理解(备份)一、理解二、重要的一些backend函数(方法)一、理解我理解的深度学习层级由大到小为:Model>layer>函数,方法形成layer层,layer层形成model,keras.backend即后端,其实就是将深度学习向比layer更小的方法即函数下沉,更能实现灵活性;这里的方法即函数层,其实就是一些基本的数值处理方法,例如求均值的mean、求最大值的max,求点积的dot等,这些方法组合就可以形成一个layer,loss等基本的层。二、重要的
2021-07-10 15:08:14
8981
3
原创 Seq2Seq(keras)的理解:关于encoder_model和decoder_model
Seq2Seq_keras:关于encoder_model和decoder_model一、三个model(一)Seq2Seq之前的keras model:1、创建模型2、模型预测(二)Seq2Seq的keras model二、再次遇见seq2seq难点一:lstm难点二:return_sequences和return_state难点三:三个模型三、seq2seq全部代码一、三个model(一)Seq2Seq之前的keras model:1、创建模型# 多层感知机(MLP)模型from keras.
2021-07-03 09:40:28
2038
2
原创 RNN、self-attention、transform的浅显或许错误的理解
RNN、self-attention、transform的浅显或许错误的理解一、RNN的理解二、self-attention的理解三、Transform的理解四、结语所有的理解都是基于我匮乏的数学知识,当成y = kx+b来理解一、RNN的理解刚开始学的时候看了很多文章,但是感觉都是云里雾里,要么是数学要么是各种没有说明白的图,但是看的多了以后看到《难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)》 《难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)》.之后,有了自己简单但可能错误
2021-06-12 22:32:24
458
3
原创 法律领域中文分词
法律领域中文分词一、结果对比1、jieba的分词效果2、训练模型的分词效果3、自训练模型原因二、自训练模型难点1、专业名词2、姓名隐去3、模糊词语4、解决办法三、自训练模型核心代码一、结果对比1、jieba的分词效果2、训练模型的分词效果3、自训练模型原因如上所述,jieba分词在一般分词中效果还可以,但是在法律领域则不是那么准确,比如下面展示一些 内联代码片。中级 人民法院将中级人民法院拆开了,但是这不进行拆开应该会更好,法言法语中常常并不会“中级–停顿–人民法院,而是中级人民法院
2021-06-12 09:40:28
1434
3
原创 帮师妹写的裁判文书内容提取程序:可做进一步提取模板
帮师妹写的裁判文书内容提取:可做进一步提取模板一、提取结果二、提取内容三、代码一、提取结果二、提取内容 需求内容为:被告、裁判文书案号、时间、地域、刑事强制措施、罪名、刑罚 整体运用的技术:主要采取的是正则匹配,因为裁判文书的这些表述是存在一定的模式的,法言法语的要求是的语言表述一般比较固定;当然在被告名字处正则匹配可能会遗漏,于是通过pyhanlp实体识别进行了进一步的精确化 遇到的一些问题:多主体不同罪名 这一问题主要通过被告名称进行定位,如果名字在该段文字中且存在这一罪名,
2021-02-27 22:10:52
4260
20
原创 Keras 生成器报错:Tensor object has no attrbute ‘assign‘
Tensor has no attrbute assign一、keras生成器重心二、keras生成器三、报错一、keras生成器重心我是在使用keras生成器时出现了这个报错并引发后续一系列报错keras生成器使用的是studyer_domi:《2020-12-11 keras通过model.fit_generator训练模型(节省内存)》链接: [l2020-12-11 keras通过model.fit_generator训练模型(节省内存)(https://blog.youkuaiyun.com/qingf
2021-02-02 13:47:24
1405
原创 python+keras汉字单字语音识别
python+keras单字语音识别一、两种思路二、代码更新三、汉字语音识别一、两种思路就当前学习所知,有两种语音识别的思路1、将语音文件提取mfcc,即转为二维张量形式,然后进行dense全连接层叠层训练,当然这个也可以使用传统机器学习方法。转为二维张量格式为:2、将语音文件提取mfcc转为三维张量形式即频谱图,然后进行cnn卷积神经网络训练,看了几个资料,这个似乎准确率更高,但是比较麻烦所以下文采取第一种方式进行尝试频谱图形式为:二、代码更新采取第一种思路的代码为大佬南方朗郎:《p
2021-01-29 22:13:58
1848
4
原创 Keras实现NNLM神经网络语言模型
Keras实现NNLM神经网络语言模型一、NNML的效果二、一些问题三、实现代码及解释四、最终效果一、NNML的效果较为权威的说法为:输入词序列,求出输出值的概率值,表示根据输入预测出下一个词概率。简单的说:预测下一个词实现效果:感觉与索引差不多,唯一不同可能是词向量的存在即索引该词的概率二、一些问题参照的文章为金多:《神经网络语言模型 NNLM (Keras实现)》链接: 神经网络语言模型 NNLM (Keras实现).总裁余(余登武):《NNLM语言模型python实现(例子:基于中文语
2021-01-27 13:57:09
805
原创 关于可视化神经网络中间层的详细说明
关于可视化神经网络中间层的详细说明一、对一些处理的意义的说明二、代码一、对一些处理的意义的说明activation_model = models.Model(inputs=model.input, outputs=layer_outputs)#此处的inputs是之前导入的模型,model = load_model('...(解释:自己的模型)') # 特征图的形状(1,宽,高,n_features)size = layer_activation.shape[1]# n_cols定义一个
2021-01-10 15:04:08
1345
原创 python《深度学习》keras基本理解
python《深度学习》keras初步理解一、Sequential()二、层与神经元一、Sequential()from keras import models#构架模型from keras import layers#神经网络层from keras.datasets import imdb#其中imdb是电影评论数据集,但是被处理过, 已被编码过了,所以只有index,而没有实际内容,需要进行转化model = models.Sequential()#网络结构决定了假设空间,这是线性堆叠方式
2021-01-06 18:17:10
1028
原创 python机器学习基础教程第七章Traceback (most recent call last):OSError: [E050] Can‘t find model ‘en‘.
OSError: [E050] Can't find model 'en'.一、问题二、方法三、下载成功一、问题初次导入spacy的英语模型时报错:Traceback (most recent call last):File "... ...", line 12, in <module>en_nlp = spacy.load('en') File "D:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\si
2021-01-03 16:03:28
1732
1
原创 特征工程:交互特征与多项式特征理解
特征工程:交互特征与多项式特征理解一、理解二、测试代码比较一、理解交互特征与多项式特征与数据预处理中的MinMaxScaler是相似的,都是对数据进行缩放处理缩放处理、交互特征与多项式特征都是对原始数据进行缩放,缩放意义在于使得权重与偏置更具有敏感性,更易对数据预测二、测试代码比较from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.pre
2020-12-29 22:53:59
915
原创 python获取2020年国家统计局省市县三级数据
python获取2020年国家统计局省市县三级数据一、数据来源二、获取思路三、完整代码四、成果四、获取地址一、数据来源国家统计局2020年最新的数据二、获取思路寻找url的规律所有省份页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html城市页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/11.html失去页面:http://www.s
2020-12-28 12:27:42
2729
原创 人脸识别与天网系统
人脸识别与天网系统一、结果二、识别库三、实现代码一、结果识别对象第一个是名字,第二个是百度上的内容二、识别库face_recognition三、实现代码class Face_recognition():def __init__(self,pic,pics): self.pic = pic self.pics = pics self.name = ""def face_know(self,file): known_image = face_recogni
2020-10-31 21:43:10
2282
原创 裁判文书上诉理由分类统计
裁判文书上诉理由分类统计一、统计结果二、实现方法(一)裁判文书上诉理由提取1、分类标准2、裁判文书内容提取方式3、实现代码4、标签贴好后三、文本分类(一)文本分类源码来源(二)数据结构和修改的地方(三)预测过程四、结语一、统计结果对这12927份裁判文书进行清洗后,有效文书数量约为10858份,有效率约为84%。二、实现方法(一)裁判文书上诉理由提取1、分类标准不认罪、罪名异议、量刑过重,量刑异议、程序瑕疵、其它。这一上诉理由分类的依据为罪名、量刑、程序。即犯罪嫌疑人被告人的上诉理由为一审事
2020-10-31 21:32:04
1144
原创 with open() 出现FileNotFoundError: [Errno 2] No such file or directory
@[TOC](with open() 出现FileNotFoundError: [Errno 2] No such file or directory)一、报错with open(output + "doc_to_docx_succuse.txt", "r", encoding="utf-8")as f1:FileNotFoundError: [Errno 2] No such file or directory: 'E:\\Firefox\\docxdoc_to_docx_succuse.txt'
2020-10-24 17:57:20
22796
2
原创 多线程、进程下载视频
多线程、进程下载视频一、结果展示二、使用的工具三、线程进程方法化多进程视频下载一、结果展示二、使用的工具视频下载使用you-get,多线程使用threading、多进程multiprocessing以下为三个库的简介you-get:threading:multiprocessing三、线程进程方法化from concurrent.futures import ThreadPoolExecutor as eimport time,sysfrom multiprocessin
2020-10-22 16:06:13
917
原创 庭审录播爬虫
庭审录播爬虫一、庭审直播网二、爬取对象三、爬取分析(一)视频地址获取(二)视频文件四、 视频下载五、成果六、问题一、庭审直播网二、爬取对象庭审公开网的内容包括直播与录播直播没有办法爬,只能看的时候进行录制所有选定的目标为录播三、爬取分析(一)视频地址获取首先录播视频的加载方式为点击查看更多后进行动态进行新内容的加载加载中url并不变化其中case_list中的就是视频的地址不点击see more不会加载后续内容因而此处使用selenium进行模拟点击(二)视频文件首先通
2020-09-22 15:51:26
4064
原创 爬虫修正:裁判文书网20200901更新增加登录系统
爬虫修正:裁判文书网20200901更新增加登录系统一、登录系统的增加二、增加登录函数三、一个比较纠结的地方一、登录系统的增加导致需要登录,直接是无法进入了。以往可以直接进入具体的类别如现在无法进入,点击该网址,后跳转到登录界面需要通过手机号进行注册后才可以进入二、增加登录函数 def login(self): """登录""" # 切换框架 wait = self.wait self.browser.refresh() frame
2020-09-04 15:31:35
4743
42
原创 text-cnn裁判文书分类
text-cnn裁判文书分类一、数据集二、训练过程三、成果一、数据集使用爬虫获取的26万份裁判文书,可以在链接: 裁判文书.训练模型源自链接: Text Classification with CNN and RNN.二、训练过程一共训练5轮数据格式为目录:标签名,文本为内容写入方法def wenshu_cut(): with open(r"J:\PyCharm项目\github项目\文本分类\罪名分类\罪名分类.json", "r")as f: train_text = {
2020-08-29 22:08:49
3787
19
原创 自动化之追踪热点
自动化之追踪热点一、成果二、主要思路:调api一、成果每天定时,主要是早上8点和晚上10点自动检测桌面的待办任务然后使用图片展示,如:1、桌面待做事项2、微博实时热点3、学术热点追踪二、主要思路:调api方法:这里的微博热点爬虫、以及cnki爬虫都是已经写好的程序,在此只是做了一些改写来符合调用的方式其中微博热点爬虫来自链接: Writeup001.而中国知网主要采取selenium通过手机知网的网址进行爬取用处:就是图片化强制关注,之前一直都在爬取微博热点但是从来没有看过;学
2020-08-25 22:22:31
2607
原创 twine上传的坑:pkg_resources.DistributionNotFound: The ‘docutils>=0.13.1‘ distribution was not found
twine上传的坑:pkg_resources.DistributionNotFound: The 'docutils>=0.13.1' distribution was not found一、制作pypi模块(一)注册pypi账号(二)设置setup.py(三)打包命令二、上传一、制作pypi模块(一)注册pypi账号(二)设置setup.pyfrom setuptools import setup, find_packagessetup(# pip install nnnname
2020-08-23 16:02:23
2638
原创 格式转化工具集之pdfkit错误
格式转化工具集之pdfkit错误: raise IOError("wkhtmltopdf exited with non-zero code {0}. error:\n{1}"一、报错三、解决过程(一)url(二)pdfkit版本(三)契机一、报错代码:OSError: wkhtmltopdf exited with non-zero code 1. error:这是一个不明原因的报错二、解决方法最终发现这源于转换的pdf文件名中不能有特殊字符转换代码:inport pdfkitpdf
2020-08-22 14:55:49
7394
原创 论文自动写作之自动添加参考文献
论文自动写作之自动添加参考文献一、成果展示二、简介三、实现过程(一)mammoth包将docx转为html(二)使用xpath提取(三)python-docx将脚注写入参考文献(四)完整的代码一、成果展示二、简介这是我试图将论文写作进行自动化处理的一个记录,这是开始的第一篇,根据已经写好的脚注进行参考文献的添加,使得自己不用一个一个的复制脚注到参考文献中去。在设想中不仅进行论文格式处理,如参考文献的自动添加、标题与正文字号的批量处理、脚注自动添加等形式上的问题,可能更进一步涉及实质内容例如提供词向量
2020-08-17 17:00:58
3262
原创 python打包apk闪退问题以及美化
python打包apk闪退问题以及美化一、闪退问题(一)闪退原因(二)解决方法(三)修改的地方二、美化问题(一)打包后的图标(二)运行界面三、完整的buildozer.spec文件一、闪退问题(一)闪退原因运行出现错误,可以尝试使用源文件在python环境中运行就会发现其错误(二)解决方法我此处的错误在于缺失了某些包,类似于Plaggable的这篇博客《Buildozer生成的APP闪退+PermissionError故障排除记录》,链接: Buildozer生成的APP闪退+Permiss
2020-08-14 17:13:02
7026
原创 wiki百科词向量训练资料及其模型
wiki百科词向量训练模型一、结果预览二、作用训练过程(一)下载问题解决下载方式一:下载方式二:下载方式三:(二)训练过程的问题一、结果预览目标为求取python相关的内容为:从结果上看,与python相关的内容为java、perl等编程语言二、作用个人简单理解:就是寻找相关的词,如上面的oython是一种编程语言,而perl、java等也是如此,但是又不是近义词,比如bash,bash是linux的命令处理器。扩展用途:通过相关联的词进行分类、推荐(如广告推荐)、比较相似度等等;(个人觉得
2020-08-08 14:24:57
2826
原创 python程序打包资源合集:.py打包.apk
python程序打包:.py打包.apk一、说明二,打包过程一、说明程序打包:python程序打包与kivy关系不大,python程序打包就是类似于利用pyinstaller将python程序打包为windows可执行的程序,即.py转变为.exe.程序制作:.py打包为.apk就是与上述内容一样,而kivy是制作app即.apk的模块,类似于pyqt、tkinter这样的kivy:然而这两者是有关的,即kivy制作的python程序才能够使用上述程序打包为.apk,即一般说的kivy=tki
2020-08-04 15:05:13
8380
3
原创 Django项目部署
Django项目部署一、成果结果二、部署过程(一)项目来源(二)项目修改(三)项目部署路径三、部署成功一、成果结果PC端手机上:二、部署过程(一)项目来源个人博客使用django制作的,原本我是在学习《python编程:从入门到实践》中完整的写完了,准备部署的,但是由于heroku注册的验证码需要搭个梯子,由于找合适的梯子(主要是免费的原因)而放弃了。由于各种原因导致原来写的django被删除了,所以本次的django项目是直接拿的别人的,这个项目来源于Github上的mazixiang,
2020-07-31 09:51:23
2072
原创 texthero的初次使用
texthero的初次使用一、下载一、下载最简单的就是直接pip下载pip install texthero但是有许多依赖库同时在初次使用时还会对一些数据进行下载,注意:对于这些数据的下载是需要挂上vpn的,否者下载不下来二、初次使用基本就是照搬texthero的示例,只是我用中文测试了一下中文测试内容来源:《对话|“我是讽刺那些假大师”,当武术表演遭遇网红行为艺术》澎湃新闻记者 蒲垚磊2020-07-27 15:39 来源:澎湃新闻选中的内容就是测试的内容 """简单的文本清
2020-07-28 14:08:26
2741
1
原创 语音交互程序:语音识别、语音输出、录音计算
语音交互程序预览一、简介二、构成说明(一)语音识别与语音输出(二)命令读取模块三、功能说明四、模块下载五、示例完整版本六、补充:实现交互等待即唤醒预览测试预览,这是完整版本的4倍速度(加速是一件比较麻烦的事,因为moviepy加速时只对视频加速,不对音频加速,因此需要提取无音频的视频进行加速、然后进行音频加速、最后合成) 语音控制程序示例(4倍快速剪辑版) 一、简介语音命令控制即通
2020-07-28 13:51:32
4499
原创 redis:creating server tcp listening socket 127.0.0.1:6379: bind No error
redis:creating server tcp listening socket 127.0.0.1:6379: bind No error一、解决方法二、成功一、解决方法解决链接:链接: ‘redis-server’ 不是内部或外部命令,也不是可运行的程序或批处理文件.按照步骤来一遍redis-clishutdownexitredis-server.exe J:\python_software\redis\redis.windows.conf ps这个redis.windows.co
2020-07-23 14:10:54
2904
原创 moviepy使用教程
moviepy使用教程一、剪辑成果二、遇到问题三、moviepy方法分享一、音频剪辑方法二、视频剪辑方法一、剪辑成果 未来 二、遇到问题尝试使用ffmpeg、moviepy、pydub,其中pydub主要是对音频的处理,moviepy对视频音频处理,ffmpeg视频、音频均可以,只是ffmpeg是命令行,在pycharm用起来不习惯,moviepy和pydub都是基于ffmpeg的p
2020-07-22 17:19:21
8881
1
原创 pandas依据多列数据生成某一列数据-兼pandas数据修改汇总
pandas依据多列数据生成某一列数据一、数据修改二、依据多列数据修改某一列一、数据修改网上pandas的数据修改大多是依据某一列数据进行修改或者生成了,几乎没有找到依据多列数据生成或者修改某一列的依据某一列数据修改某一列数据的方法:方法一:df.loc[df.a>=2,'b'] = 'new_data'来自chenpe32cp:《python pandas如何基于某一列修改某一列的值》,链接: python pandas如何基于某一列修改某一列的值.方法二:df["a"]=df["
2020-07-22 16:44:19
3654
原创 tushare报错之解决(亲测有效):websocket._exceptions,ValueError: No ‘:‘ found when decoding object value
tushare报错:websocket._exceptions,ValueError: No ':' found when decoding object value一、修改后结果二、报错三、成功获取一、修改后结果二、报错第一个报错:websocket._exceptions具体含义是websocket中缺失_exceptions,github上:pip uninstall websockerpip install websocket-client无效准确解决方法:换成1.2.5
2020-07-22 09:25:28
5494
4
原创 庭审各方情绪识别
庭审各方情绪识别caow 法学数据分析 今天一、引言在《有点玄乎!用Python分析《隐秘的角落》里微表情》这篇公众号文章中对《隐秘的角落》里进行了微表情分析。就是这个电视剧: 我一想不是可以用到庭审直播中去吗?于是去找大佬要源码!大佬没有理我,二、源码修改没关系,自己动手丰衣足食(那是不可能滴!!!!!!!!!!!) 在csdn中找到了一个进行了开源的大神的分享《表情识别与性别识别 实时识别模型附源代码 基于python的tensorflow与keras》愉快的下载下来
2020-07-19 14:19:48
2148
tensorflow1.15-whl-and-cpp-api-for-win-and-rtx3090-main.7z
2021-10-15
自然语言处理,深度学习 代码
2020-11-14
speak_command-0.1.0-py3-none-any.whl
2020-08-02
speak_command-0.1.0.tar.gz
2020-08-02
selenium中国裁判文书网爬虫.zip
2020-06-29
固态硬盘管理工具.exe
2020-05-11
DirectX_Repair_win8_win10(c++).exe
2020-05-11
Win64OpenSSL-1_0_2u(win10可用).exe
2020-05-11
LaoMaoTao(+系统).exe
2020-05-09
feiniaokc_v2.4_from1.apk
2020-04-29
CSVEditorPro(精简).zip
2020-04-29
深度学习下的序列标注
2021-07-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人