Python
sherpahu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python使用numpy将dict保存为文件或从文件中加载出来
保存import numpy as npd={'a':1,'b':2)np.save('d.npy',d)加载import numpy as npd=np.load('d.npy',allow_pickle=True)原创 2021-04-09 15:16:12 · 770 阅读 · 0 评论 -
lightgbm gpu在ubuntu/linuxmint下的安装与验证的真正方法
垃圾教程太多sudo apt-get install libboost-dev下载项目https://github.com/microsoft/LightGBM解压zipcd Lightgbm-mastermkdir build ; cd buildcmake -DOpenCL_LIBRARY=/usr/local/cuda/lib64/libOpenCL.so -DOpenCL...原创 2019-12-22 16:45:22 · 658 阅读 · 1 评论 -
python生成exe,pyinstaller编码错误或闪退,果断换坑cxfreeze!
pyinstaller的大坑最近需要将一个python的Gui程序打包为exe按照网上博客的建议——“py2exe很久没有更新,完全不能使用,应该换用pyinstaller”, 我安装pyinstaller后, "果不其然"又遇上了python的经典编码问题, "pyinstall UnicodeDecodeError: 'gbk' codec can't decode byte 0xa8...原创 2018-08-18 10:17:05 · 8314 阅读 · 4 评论 -
机器学习-线性回归
基本概念在线性模型中通过一个线性组合进行预测, 由W和b根据x得到f(x)的值即: f(x)=或者写为: f(x)= 线性回归就是为了学得w和b的值, 然后进行回归预测相关公式利用最小二乘法可以得到进一步转化:将w和b合写在一起 矩阵X在最右边添上一列1回归方程可以改写为使用方差来估计误差方差为 也可以写作 由于上式为一个凸函数(下...原创 2018-09-28 09:08:36 · 671 阅读 · 0 评论 -
机器学习-逻辑回归
基本知识Sigmoid函数逻辑回归用于二分类任务, 我们在将特征的实值转化为分类的二元离散值时, 想要的最理想的函数是单位跃迁函数即: 利用这个函数就可以通过z的值建立一个到0,1的映射, 可以用于我们的二分类任务但是, 由于这个函数不连续, 使用起来不方便我们就用Sigmoid函数进行替代即: 这个函数在0附近出现变化很剧烈, 称为逻辑函数损失函数利用...原创 2018-09-29 10:48:04 · 635 阅读 · 0 评论 -
OpenCV实现面部识别并添加圣诞帽
Opencv抠图并面部检测后添加圣诞帽 从网上获取Trump的头像, 再使用EigenFaceRecognizer_create单独识别出Trumpimport cv2import numpy as npfilename='faces.jpg'hat=cv2.imread('hat.jpg')#构建maskhsv=cv2.cvtColor(hat,cv2.COLOR_...原创 2018-12-12 19:20:17 · 575 阅读 · 0 评论 -
NLP系列 8. 循环神经网络(RNN)
RNN提出背景人的记忆原理也是与当前输入和之前的输入有关的。每个预测的结果都会放到下一个输入里进行运算,与下一次的输入一起来生成下一次的结果。听到一句话“我来找你”,是在没听到一个字或词的时候大脑都会结合之前听到的和现在听到的组合起来,形成语句的理解。下面这种网络与我们的大脑对语句的理解过程很相似。RNN定义循环神经网络,Recurrent Neural Network。神经网络是一种...原创 2019-05-26 16:46:35 · 1149 阅读 · 0 评论 -
NLP系列 6. 神经网络基础
神经网络中的基础概念前馈神经网络:前馈神经网络是一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。输入层:神经网络的第一层。它接收输入信号(值)并将其传递至下一层,但不对输入值执行任何运算。它没有自己的权重值和偏置值。隐藏层:隐藏层的神经元(节点)通过不同方式转换输入数据。一个隐藏层是一个垂直堆栈的神经元集。输...原创 2019-05-22 17:33:21 · 386 阅读 · 0 评论 -
NLP系列 10. BERT
Transformer的原理BERT的算法来自谷歌的另一篇论文:https://arxiv.org/abs/1706.03762 。完全抛弃了RNN、CNN,而提出了另外一种新的网络结构:Transformer。Transformer现在是谷歌云TPU推荐的参考模型。Transformer由encoder和decoder组成,encoder、decoder分别由一些编码器和解码器构成。编码器...原创 2019-05-30 19:42:16 · 273 阅读 · 0 评论 -
NLP系列 7. 卷积神经网络
卷积运算定义:卷积是两个变量在某范围内相乘后求和的结果。称(f∗g)(x)(f*g)(x)(f∗g)(x)为f,g的卷积。连续的卷积定义为:(f∗g)(n)=∫−∞+∞f(τ)g(n−τ)(f*g)(n)=\int_{-\infty}^{+\infty}f(\tau)g(n-\tau)(f∗g)(n)=∫−∞+∞f(τ)g(n−τ)离散的卷积定义为:(f∗g)(n)=∑r=−∞+∞f(...原创 2019-05-23 19:08:18 · 758 阅读 · 0 评论 -
NLP系列 9. Attention机制
Attention机制介绍之前做项目时同组大佬用到过Attention机制,Attention机制对模型能够有一定的提升作用。人在看一张图片一篇文章时,不会对所有部分都投入同样的注意力,而是有所侧重。所谓侧重就是赋予不同的权重。Attention定义Attention是一种用于提升基于RNN(LSTM或GRU)的Encoder + Decoder模型的效果的的机制。Attention机制...原创 2019-05-28 15:07:28 · 425 阅读 · 0 评论 -
安装mlxtend,找不到包和The environment is inconsistent的解决方法
pip直接安装(pip install mlxtend)和conda安装(conda install -c conda-forge mlxtend)都失败了pip、conda直接安装找不到包,conda从conda-forge安装提示环境不一致(The environment is inconsistent)直接从pypi上下载whl,https://pypi.org/project/ml...原创 2019-09-07 16:35:17 · 3663 阅读 · 3 评论 -
Python机器学习之旅-1.聚类_KMeans
k-means是针对聚类所得簇划分的最小化平方误差采用的是贪心的策略(最小化式不容易解决,属于NP难问题),主要分三步进行1.初始化,随机分配簇的中心2.反复迭代计算簇中心3.等到为簇中心分配的数据点保持不变之后,得到簇中心以下通过一个简单的算法实例来进行说明(原本例子来源于中国大学MOOC-北京理工大学-Python机器学习应用,其中样本集由本人经百度文库下载得到,对于MOOC中的代码也有略微改...原创 2018-07-13 23:44:57 · 1037 阅读 · 1 评论 -
Python实现Github下载工具
Github单个文件没有下载的按钮,在知乎上看到过一些下载方法链接,gitzip必须得一个一个文档双击,并且不能一次性下载一个文件夹,downzip有时候却是下载失败(当然通常情况还是挺好用的),参考大神的第三种方法,找raw文件地址,我这里通过Python爬虫自动完成整个网页中文档或文件夹的下载import requestsimport refrom urllib.request im...原创 2018-07-12 21:55:02 · 6567 阅读 · 3 评论 -
Python day2 part1:字符串编码
字符串编码方式主要有两种:ASCII码、Unicode码和UTF-8码Unicode和UTF-8码支持汉字UTF-8码是可变长的,UTF-8中英语字符通常是1个字节,而汉字通常为3个字节,比Unicode更加节约在计算机中 内存、记事本里面使用Unicode编码,在文件或者传输途中使用UTF-8编码在网页中 服务器里面是Unicode,而网页上提供给浏览器的是U原创 2018-01-26 18:20:21 · 219 阅读 · 0 评论 -
Python day4:函数2
3.递归函数汉诺塔:def move(n,a,b,c):{ if(n==1): print('move %c to %c'%(a,c)) else: move(n-1,a,c,b) move(1,a,b,c) move(n-1,b,a,c)}move(3,'A','B','C')move A to Cmove A t原创 2018-02-02 21:06:30 · 151 阅读 · 0 评论 -
Python day3:函数1
1.调用函数:内置函数直接使用需要导入的函数,from xxx import fun再直接使用fun()import xxx用xxx.fun()使用函数2.函数参数a.默认参数d={'Michale':95,'Bob':75,'Tracy':85}print(d['Michale'])d['Bob']=80print(d['Bob'])print(d.g原创 2018-01-27 23:46:49 · 174 阅读 · 0 评论 -
Python day4:高级特性——切片、迭代
1.切片:L为一个列表,L[i:j]表示L[i]到L[j-1]的包含j-i个元素的部分.其中i和j都可以省略,省略i表示从0开始取起,省略j表示取到最后一个同时省略时就表示重新复制了一个列表. L[:j]表示前j-1个元素,l[i:]表示后i个元素同样,i和j也可以为负数,表示倒数切片若在后面再加上:k,变为L[i:j:k:],那么表示的是在第i个到第j-1个之间每k个原创 2018-02-02 23:35:50 · 243 阅读 · 0 评论 -
Python day2 part2:random函数
import randomprint(random.random())print(random.uniform(1,2))print(random.randint(1,5))lst=[1,5,4,8,55]random.shuffle(lst)print(lst)print(random.choice(lst))print(random.sample(lst,3))print(r原创 2018-01-27 09:06:39 · 167 阅读 · 0 评论 -
Python day5:列表生成式,生成器,迭代器
1.列表生成式生成有一定规律的列表可以使用列表生成式如生成1到10的列表L=[x for x in range(1,11)]生成1到10之中偶数的列表L=[x for x in range(1,11) if x%2==0]生成1到10之中数的平方列表L=[x*x for x in range(1,11)]多重循环:L=[m+n for m in range(1,11原创 2018-02-03 16:54:25 · 304 阅读 · 0 评论 -
Python 爬虫:2.几个爬虫实例
#百度搜索全代码import requeststry: kv={'wd':'Python'} r=requests.get('http://www.baidu.com/s',params=kv) print(r.request.url) r.raise_for_status() print(len(r.text))except: print('...原创 2018-02-27 11:39:13 · 5262 阅读 · 0 评论 -
Python爬虫 1.requests库的使用
requests.get()1.reuests.get(url,params=None,**kwargs)url:拟获取页面的url链接params:url的额外参数,字典或者字节流格式**kwargs:12个控制访问的参数2.Requests库的2个重要对象r=requests.get(url)r为response url为request3.Response对象的属性r.status_code ...原创 2018-02-21 22:46:45 · 426 阅读 · 0 评论 -
Python day6:字符串操作函数
1.分割函数:str.split(<separation>)按照某个字符(含空格)或特定的字符子串即<separation>分割字符串str,返回一个list①str.split()按照空格分隔str='1 2 3 4 5'list=str.split()print(list)输出['1', '2', '3', '4', '5']②str.split('字符或字符串')...原创 2018-02-24 21:27:10 · 253 阅读 · 0 评论 -
tesseract-oct库安装,再结合pytesseract对于图像的OCR识别
操作环境:1.tesseract-ocr 4.00.002.PIL库3.pytesseract库4.Python 3.6一、(1)tesseract-ocr库的下载:这是一个谷歌的开源引擎,使用效果比较好笔者在下载该库时踩坑颇多,从https://digi.bib.uni-mannheim.de/tesseract/上面下载后即可安装.这里面没有带上dev的是稳定版本,带dev的是实验版然而安装速...原创 2018-05-20 11:44:30 · 3046 阅读 · 2 评论 -
Tkinter学习_1.Hello World 初创窗口
前言本教程取材自Tkinter By Python 可自行下载PDF和源代码相关参数可以查询APItkinter 8.5 reference更多教程可以查询https://wiki.python.org/moin/TkInter/ 1.1 Basic Example不使用类实现Hello World窗口的输出import tkinter as tkroot=tk.T...原创 2018-07-18 14:23:00 · 1225 阅读 · 0 评论 -
Python day1:数据结构与变量运算
Python day1:一、数据类型1.整数:和数学上的基本写法一致正数:eg.3 负数:eg. -32.浮点数:eg.1.23浮点数计算存在误差科学记数法:eg.1*10^5=1e5 1.23*10^9=1.23e9 1.23*10^-5 =1.23e-53.字符串: a.在python3.6中可以使用单引号'或原创 2018-01-25 11:21:35 · 196 阅读 · 0 评论
分享