- 博客(31)
- 收藏
- 关注
原创 语义相似度的计算
语义相似度就是计算两个句子之间的相似度,可以将两个句子向量化之后,计算余弦距离。# -*- coding: utf-8 -*-"""Created on Thu Feb 21 20:18:38 2019@author: lcl"""from sklearn.feature_extraction.text import CountVectorizerimport mathimpor...
2020-06-29 11:53:52
2598
原创 python接口调用 get/post
调用Python接口一般有两种方式,get和post1.get方式调用Python接口(1)给定具体的参数,进行一次调用import jsonimport requestsr = requests.get("http://47.92.225.212:8001/OutCall/recognition?nodeId=6212aea7&query=嗯方便的你说&flowId=...
2020-06-29 11:53:35
1929
原创 自动提取摘要
目录1.TF-IDF提取关键词2.摘要提取2.1 基于关键词匹配的摘要提取2.2基于关键词评分的摘要提取1.TF-IDF提取关键词TF-IDF是Term Frequency - Inverse Document Frequency的缩写,即“词频-逆文本频率”。它由两部分组成,TF和IDF。TF为词频,即某个词在文章中出现的次数。IDF为逆文档频率:TF-IDF的计算为:TF...
2020-06-29 11:52:53
1889
1
原创 openpyxl写入读取数据
1.openpyxl写入数据例子1:import openpyxlf = openpyxl.Workbook()table = f.activetable['A2'] = 4table['A1'] = 5table.cell(row = 3,column = 1,value = 10)table.cell(row = 4,column = 1, value = 11)# 添...
2019-12-02 17:05:34
3178
原创 SQL连接查询
1.SQL入门推荐廖雪峰SQL教程https://www.liaoxuefeng.com/wiki/1177760294764384/11796108887964482.SQ连接查询表rules表cates待解决问题:查询表rules中cate_id 对应的path,path_c,pid等信息,这些信息在表cates中,所有要用到连接查询。由两个表可知表rules中cate_id,与...
2019-07-19 10:56:34
287
原创 python 全局变量global
1.使用实例x = 10def foo(): x+=1 print(x)foo()报错,x在应用之前未声明在函数内部添加global x,声明x为全局变量x = 10def foo(): global x x+=1 print(x)foo()正常输出结果:11...
2019-07-19 10:56:10
287
原创 TortoiseGit使用教程
https://blog.51cto.com/blackstorm/1604113https://www.jianshu.com/p/44dc68dba8fahttps://yq.aliyun.com/articles/357080Git懒人教程 http://www.chengfeilong.com/tips-for-Git-users
2019-07-19 10:55:54
11229
原创 mysql连接不上
这两天遇到一个问题,自己做的程序模块,之前运行的好好的,突然报错,运行不了了。pymysql.err.OperationalError: (2003, "Can't connect to MySQL server on '127.0.0.1' ([Errno -8] Servname not supported for ai_socktype)")上面是返回来的错误最开始以为是mysql的...
2019-07-19 10:55:33
427
原创 python 去除特殊符号
1.replace()text = "我的车牌号是粤B-34567。"text = text.replace("-","")text = text.replace("。","")print(text)输出:我的车牌号是粤B345672.split()text = "我的车牌号是粤B-34567。"text = ''.join(text.split('-'))text = ''....
2019-07-19 10:55:08
5086
原创 python try...except...总结
1.参考文献https://docs.python.org/zh-cn/3/tutorial/errors.html#exceptionshttps://www.liaoxuefeng.com/wiki/1016959663602400/1017598873256736《python编程从入门到实践》10.3异常2.try…except…应用场景编写得很好且经过详尽测试的代码不容易出现内...
2019-07-19 10:54:08
806
原创 python 日志
1.日志重复打印import logginglogger = logging.getLogger('simple_example')logger.setLevel(logging.DEBUG)ch = logging.StreamHandler()ch = logging.handlers.RotatingFileHandler('date_extract.log.', maxBytes...
2019-06-26 10:48:06
258
原创 python tonador get/post 方法实现以及使用Postman测试接口
1.python tonador服务https://www.tornadoweb.org/en/stable/guide/structure.htmlhttps://www.tornadoweb.org/en/stable/web.htmlhttps://stackoverflow.com/questions/4476373/simple-url-get-post-function-in-p...
2019-06-25 15:26:43
814
原创 Python JSON编解码
1.JSON 函数JSON(JavaScript Object Notation)是一种轻量级的数据格式。使用JSON函数需要导入json库:import jsonjson.dumps 将Python 对象编码成JSON字符串json.loads 将已编码的JSON字符串解码为Python对象实例1import jsona = [1,"a","b"]print("a:",a)...
2019-06-25 11:30:52
3255
原创 文本分类算法TextCNN,TextRNN
1.TextCNN1.1相关代码下载https://github.com/dennybritz/cnn-text-classification-tfhttps://github.com/gaussic/text-classification-cnn-rnn1.2 讲解https://hunto.github.io/nlp/2018/03/29/TextCNN文本分类详解.htmlhtt...
2019-05-31 14:35:31
2081
原创 深度学习入门实战
1.DNN1.1.DNN结构和数据说明1.2 DNN代码实现# -*- coding: utf-8 -*-"""Created on Tue May 28 19:22:44 2019@author: lcl"""from __future__ import print_function# Import MNIST datafrom tensorflow.example...
2019-05-30 17:45:54
1246
原创 python matplotlib.pyplot 画图
1.matplotlib.pyplot柱状图import matplotlib.pyplot as plt labels_count = [41,32,28,22,22,21,21,21,20,19]labels_name = ["上海理赔管理小组","上海嘉定区外冈五金城营业部","上海浦东保税区营业部","上海闵行区银都路营业部",\ "上海徐汇区凯旋路营业...
2019-05-16 14:24:44
2273
原创 python 封装API接口
1.对一天中通话,按时段进行分析输入数据为.txt文件,数据部分展示如下:u110107_02169228380_530005_20190228125930_61AA.mp3u110107_18895672550_530005_20190228165337_FFFFE06F.mp3u110107_18895672550_530005_20190228165433_FFFFE0DC.mp3...
2019-04-04 16:21:06
14405
2
原创 python str与json类型转换
1.str 转jsonimport jsontext = '{"sentences":[{"silence_duration":7,"end_time":19585,"speech_rate":71,"begin_time":18740,\ "text":"喂","channel_id":1,"emotion_value":6.0},{"silence_duration":0,...
2019-03-28 11:53:12
4687
原创 将一个大文件夹拆分为多个小文件夹
任务:要将一个文件夹下的14694条音频文件转换为文本(python调用接口)因为一次运行的次数较多时,服务不稳,会报错想到将所有的音频文件拆分为小文件夹,每个文件夹里包含3000条音频,总共有5个文件夹。import osimport shutil def mkdir(path): folder = os.path.exists(path) if not folder: ...
2019-03-26 19:39:28
9697
1
原创 TensorFlow 运行TextCNN报错
最近在看TextCNN,运行代码时报错,如下:Variable cluster_weights already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO很奇怪的是这个错误有时候出现,有时候不出现;重启spyder之后就不出现了,运行一次之后又会报错。。。。抓狂。。。。。报错原因:主要是再次执行的时候...
2019-03-11 18:47:25
257
原创 spyder pip 安装tensorflow报错
1.在spyder中安装tensorflow之后,运行报错2.出错原因:pip 安装的tensorflow版本是1.13.1原有的numpy版本是1.14.0出错原有可能是tensorflow与numpy版本不兼容导致的3.修改方法numpy版本升级为最新版升级后的numpy版本为1.16.2具体操作可参考:https://www.twblogs.net/a...
2019-03-05 19:42:10
630
原创 批量读取文件夹下文件
1.批量读取文件夹下的.txt文件file_name = "G:/ASR/chunlan/1/"dirs = os.listdir(file_name)for dir in dirs: if dir.split('.')[-1] == 'txt': path = file_name + dir print(path) else: ...
2019-03-05 19:27:14
1002
原创 基于sklearn tfidf提取特征
https://blog.youkuaiyun.com/u010967382/article/details/79728404https://zhangzirui.github.io/posts/Document-14%20(sklearn-feature).md在用CountVectorizer()计算文本特征时,发现单个的词会被过滤掉,发现在CountVectorizer()中设置参数analyz...
2019-02-25 19:36:49
713
原创 SVM算法中各标签对应精确率,召回率,f1score
1.精确率,召回率,f1score主要参考博文https://www.cnblogs.com/pinard/p/5993450.html2.用sklearn计算各标签对应的精确率,召回率,f1score,support(测试样本个数)https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metricscl...
2019-02-21 09:25:40
10735
2
原创 数据库操作
1.mysql下载与安装https://blog.youkuaiyun.com/zhouzezhou/article/details/52446608上篇博文写的很清楚,就不重复写了安装过程中遇到的问题:打开cmd,输入“mysql -u root -p”回车,返回'no modual mysql'原因:环境变量没有配置好解决方案:配置环境变量时”用户变量”和”系统变量”下的path都添加...
2019-02-19 18:41:31
292
原创 数据库操作
1.数据库基本操作http://www.runoob.com/python/python-mysql.htmlhttp://www.runoob.com/python3/python3-mysql.htmlhttps://www.ctolib.com/TracyMcgrady6-pymsql_Operation.html2.数据批量导入数据库https://blog.csdn....
2019-02-18 20:41:59
111
原创 机器学习
(1)朴素贝叶斯《机器学习实战》第四章https://blog.youkuaiyun.com/hjimce/article/details/46054739《机器学习》周志华第七章(2)逻辑回归线性回归 https://blog.youkuaiyun.com/hjimce/article/details/45418645 http://www.cnblogs.com...
2018-07-20 21:52:40
197
原创 Voicebox
Voicebox官网http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html Voicebox下载http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.zipmatlab中voicebox工具箱的添加http://blog.youkuaiyun.com/cwfjimogudan/article/d...
2018-07-13 17:59:50
2956
原创 音频信号降采样
最近开始做鼾声算法,涉及到音频处理这一块。做算法首先要搜集数据,鼾声的录制是直接使用手机的录音功能,整晚录制的音频数据一般为6~8个小时,手机录音采样频率为48000Hz或者44100Hz,数据庞大,matlab无法整段读入,为了减小数据量以及方便之后对鼾声信号的处理,需要先对搜集的音频信号进行降采样处理。算法中需要将采样率减小到16000Hz。1)使用FFmpeg,FFmpeg的下载与使用见附件...
2018-07-13 17:06:40
9007
原创 机器学习算法与Matlab实践:k-近邻(kNN)
理论部分与“机器学习算法与python实践:k近邻(kNN)”这篇博文相同,实践数据也相同,差别为代码部分为作者用Matlab重新编写。 最近开始学习机器学习,理论部分主要参考周志华老师的《机器学习》这本书,实践部分主要参考《机器学习实战》这本书,另外还参考了一些博客。1.k近邻算法分析 k近邻(k-Nearest Neighbors,kNN)学习是一种常用的监督学习方法,其工作机制非常简单:给...
2018-07-10 17:03:21
4597
1
原创 JavaScript 计时事件
(1) setTimeout() 未来的某时执行代码var t=setTimeout(“javascipt语句”,毫秒)//第二个参数指示从当前起多少毫秒后执行第一个参数。(2) clearTimeout() 取消settTimeout()示例:test var c=0;var t;varele=
2016-04-10 09:00:11
214
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人