
机器学习
Medlar Tea
一杯枸杞茶
展开
-
python读取.mat文件
读取mat文件-v7格式import scipy.io as io mat = '*.mat'data = io.loadmat(mat)-v7.3格式import h5pymat='*.mat' #需要读取的mat文件路径data=h5py.File(mat) #读取mat文件读取特定内容所读取的mat文件...原创 2020-01-05 14:07:43 · 715 阅读 · 0 评论 -
python读写word文档
首先安装两个包:该包用于将.doc文件转置.docx,因为python只能处理.docx型文件pip install piwin32第二个包:pip install python-docx示例代码:转化:from win32com import client as wcw = wc.Dispatch('Word.Application')doc=w.Documents.Ope...原创 2020-02-25 10:35:17 · 424 阅读 · 0 评论 -
python相关常见问题
os.listdir()得到的文件顺序是无序的,除非用{0:07d}这样的有序数字命名的文件。如果要确保numpy计算得到的数据类型正确,一定要在后面加上个.astype(float32).Pandas读取csv之后的数据类型为Series,取元素需要用.iloc[].np.argsort()可以根据其中的值排序,然后返回对应值的index实现numpy数组合并可以用np.concate...原创 2020-01-11 16:26:33 · 193 阅读 · 0 评论 -
python的多线程和多进程
前言线程与进程的定义线程是一个基本的 CPU 执行单元。它必须依托于进程存活。一个线程是一个execution context(执行上下文),即一个 CPU 执行时所需要的一串指令。进程是指一个程序在给定数据集合上的一次执行过程,是系统进行资源分配和运行调用的独立单位。可以简单地理解为操作系统中正在执行的程序。也就说,每个应用程序都有一个自己的进程。**每一个进程启动时都会最先产生一个线程...原创 2020-01-11 12:06:09 · 314 阅读 · 1 评论 -
在最近邻Neighbor Nearest中使用cosine指标
先贴以下外国大神的分析在sklearn中,Neighbor Nearest算法的metric只有距离的度量,而没有cosine相似度这种方式的度量,其实很好理解,因为Neighbor Nearest模型需要构建“ball tree”或者是"kd tree",所以metric只能够是这种能够形成空间关系的metric。但是其实可以轻松地将cosine相似度转化为欧氏距离表示的方式。因为cos(x...原创 2020-01-08 09:44:46 · 1089 阅读 · 0 评论