hyhpyx-优快云博客

原创 BiLSTM-CRF计算细节

1、计算所有路径得分的对数指数和 def _forward_alg(self, feats): init_alphas = torch.full((1, self.tagset_size), -10000.).cuda() init_alphas[0][self.tag_to_ix[START_TAG]] = 0. #注释1 forward_var = init_alphas #注释2 for feat in

2021-12-26 13:34:08 1099 2

原创从HMM到BiLSTM-CRF过程详解（1）

背景知识本小节主要对推导过程中存在的一些背景知识进行简要介绍，大家可以按照自己的情况进行阅读，有错误之处还请指出，谢谢啦~1.1 逻辑回归与最大熵模型1.1.1多分类逻辑回归模型与softmax函数1.1.1.1.1 多分类逻辑回归函数对于二分类逻辑回归函数想必大家肯定都很熟悉啦，我们在此简单回顾一下!逻辑回归模型如下：P(Y=1∣X)=ewP(Y=1|X) = \frac{e^{w}}{}P(Y=1∣X)=ew...

2021-12-13 15:14:18 1592

原创机器学习第一话：逻辑回归（使用梯度下降法求解）

逻辑回归The data我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员，你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据，你可以用它作为逻辑回归的训练集。对于每一个培训例子，你有两个考试的申请人的分数和录取决定。为了做到这一点，我们将建立一个分类模型，根据考试成绩估计入学概率。#三大件import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matpl

2021-03-22 20:44:57 520 1

原创机器学习第一话：初识逻辑回归

逻辑回归（Logistic regression）什么是逻辑回归？在我们以前的学习中，回归通常是指利用给定的样本信息X(x1,x2,...,xn)X(x_1,x2,...,x_n)X(x1,x2,...,xn)建立一个回归表达式，例如:y=β0x1+β1x2+...+βnxxy = \beta_0x1+\beta1x2+...+\beta_nx_xy=β0x1+β1x2+...+βnxx最中我们得到是一个值y^\hat yy^。对于预测某个样本是正例还是负例这种普通回归就不太适用，因为我

2021-03-22 20:15:34 315

原创 python 爬虫——快递物流查询

import requestsimport astnum = input('请输入运单号：')url = 'https://biz.trace.ickd.cn/yuantong/'+str(num)response = requests.get(url = url,headers = headers)response.encoding = response.apparent_encodingpage_txt = response.textpage_dict = ast.literal_eval

2020-10-07 00:37:16 944

转载超级鹰使用流程

超级鹰代码超级鹰流程1、首页 -> 软件ID -> 生成一个软件ID（并记住）2、开发文档模块 -> 下载python文档import requestsfrom hashlib import md5class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username # 此处是经过修改后的代码

2020-10-07 00:28:28 1896

原创 python环境下json文件的保存与读取

保存数据使用json.dump(需要被保存的内容,用于存储数据的文件对象)保存json文件例：例：import jsonnumbers = [2,3,5,7,9,11]with open(r'C:\Users\胡银洪\Desktop\jd.json','w') as f:json.dump(numbers,f)读取数据使用json.load(f)读取文件例：with open(r'C:\Users\胡银洪\Desktop\jd.json') as f: numbers =

2020-08-08 10:19:19 286

原创在jupyter notebook下python使用自定义模块

前言：当引用模块时，编译器会先在当前目录（也就是所运行的文件所处的目录），接着去sys.path、Python的安装目录去寻找你引用的模块，如果没有的话，就会报错。注意寻找的先后顺序。第一步：建立模块所谓模块其实就是将多个函数封装为扩展名为.py的文件。在jupyter创建.py文件的方法为：1、先写出所需使用的函数。例如：def test1():print(‘这是test1’)def test2():print(‘这是test2’)2、将该.ipynb保存为.py文件。具体方法为：点

2020-08-07 09:09:12 8153

原创 matplotlib各种图的绘制

折线图plt.plot(x,y)散点图plt.scatter(x,y)条形图from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname = r'C:\Windows\Fonts\simhei.ttf')a = ['政治','英语二','数学三','统计学']b = [82,78,122,120]plt.figure(

2020-07-15 18:04:55 320

原创 python类的入门

类的定义class Person: #名称首字母大写 def setage(self,age): self.age = age def getage(self): print(self.age) 类的使用#使用类的时候必须要实例化，而实例化之后的类的称为对象p = Person() ##这里p就是Person这个类的具体的实例对象,即self为pp.setage(18)p.getage()魔法方法__init____i

2020-07-05 09:52:00 207

原创常用sklearn库数据集调用方法

所需第三方库import numpyimport scipyimport matplotlibimport sklearnboston房价#导入boston房价数据集from sklearn.datasets import load_boston #将数据集赋给bostonboston = load_boston()#打印数据维度print(boston.data.shape) #导入boston房价数据集from sklearn.datasets import load_

2020-07-02 11:44:05 1157

原创初识pandas

import pandas as pdfrom IPython.display import displaydata = {'name':['taiyo','anna','peter','hana'], 'location':['new york','paris','berlin','london'], 'age':[24,55,66,54] }data_pandas = pd.DataFrame(data)#IPython.display可以在jupyte

2020-06-25 18:38:17 240 1

原创 python matplotlib库详解

%matplotlib inline#这是魔法函数，在jupyter notebook代替plt.show()import matplotlib.pyplot as plt# 在-10和10之间生成一个数列，共100个数x = np.linspace(-10,10,100)#用正弦函数创建第二个函数y = np.sin(x)#plot函数绘制一个数组关于另一个数组的折线图plt.plot(x,y,marker = 'x') ...

2020-06-25 18:07:30 616

原创初识numpy,scipy

from scipy import sparseimport numpy as npx = np.array([[1,2,3],[4,5,6]]) #利用numpy创建一个数组eye = np.eye(4) #创建一个4维单位向量print('x:\n{}'.format(x))print('eye:\n{}'.format(eye))##稀疏矩阵是指0元素的个数远远小于非0元素#可以通过numpy数组创建scipy稀疏矩阵，即只保留非0元素，并给出其位置，减少所用内存sparse

2020-06-25 17:49:53 203

原创 python 文件操作及OSError: [Errno 22]解决

打开文件及关闭文件法一：使用raw string，在前面加上rf = open(r'C:\Users\胡银洪\Desktop\picture\test.txt','w')# 若在该路径下无该文件，w模式（写模式下）则会自动创建该名称文件f.close()法二：加入转义字符\f = open('C:\\Users\\胡银洪\\Desktop\\picture\\test.txt','w')法三：利用/代替\f = open('C:/Users/胡银洪/Desktop/picture/tes

2020-06-08 20:10:22 1831

原创 python 常用快捷键（更新中）

ctrl+f ：打开查询框Windows+shift+s:截图ctrl+/:多行注释shift+enter:运行代码

2020-06-08 17:22:09 280

原创 pyhton 字符串

字符串含有引号的情况若字符串中含有单引号，则外层使用双引号s = "I'm a student"print(s)若不使用双引号，可以通过\方式s = 'I\'m a student'print(s)即通过\进行转义

2020-06-08 15:12:43 167

原创 pyhton break&continue

break从此处直接停止最内层循环i = 0while i<10: i = i+1 print('-'*30) if i==5: break #从此处直接停止最内层循环 print(i)结果为了检查break是否只是停止最内层循环，可设置两个循环，进行检验j = 0while j < 3: j = j + 1 i = 0 while i < 10: i = i+1 p

2020-06-08 11:44:44 225

原创 python ttf字体文件

发邮件至2532524866@qq.com，本人免费发送

2020-06-08 10:45:46 4698

原创贪婪匹配&最小匹配

贪婪匹配m = re.search(r'PY.*N','PYGDHFNCDWJNFHJNFN') #以PY开头，以N结尾,默认返回贪婪匹配，即返回最长的匹配m.group(0)最小匹配m = re.search(r'PY.*?N','PYGDHFNCDWJNFHJNFN') #最小匹配m.group(0)最小匹配操作符...

2020-06-07 12:53:49 292

原创 python爬虫小实例

本人奥迷一枚，新学爬虫，爬取贴吧评论，并进行简单文本分析加载所需包import xlwtimport csvimport codecsimport wordcloudimport jiebaimport requestsimport osimport reimport sklearnimport imageioimport csvfrom bs4 import BeautifulSoupimport bs4from wordcloud import WordCloud, STO

2020-06-07 12:49:29 315

原创 Re 库的match对象

match的类型import rematch = re.search(r'[1-9]\d{5}','BIT126095')if match: print(match.group(0))type(match)#返回match的类型

2020-06-04 18:00:34 447

原创正则表达式 RE基础语法

正则表达式常用操作符正则表达式语法实例raw string类型raw string类型（原生字符串类型）表示正则表达式，表示为：r’text’例如：r’[1-9]\d{5}’ 邮政编码raw string 是不含转义符的字符串也可以使用string表示，更繁琐例如：’[1-9]\d{5}'需要加一个\来表示正则表达式中的\dRE库主要功能函数import rematch = re.search(r'[1-9]\d{5}','BIT126095')#只返回第一个匹配结果pri

2020-06-04 17:39:34 668

原创 python request库及实例

爬虫requests库的get()方法以百度为例import requests#r为从网页上获得的内容（源代码，状态码，文本信息，编码方式等）r = requests.get("http://www.baidu.com")#状态码，只有200是正常的r.status_code#文本信息r.text#从HTTP header中猜测的响应内容编码方式r.encoding#从内容中分析出的响应内容编码方式r.apparent_encoding #将分析出的响应内容编码方式赋给从HTTP

2020-06-04 16:14:24 781

原创 python 爬取ultraman及数据保存

爬取import requestsfrom bs4 import BeautifulSoupimport bs4import osimport xlwtimport csvimport codecsdef getHTMLtext(url): try: r = requests.get(url,timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding

2020-06-04 16:13:27 218

原创中国大学排名定向爬虫

实例情况定向爬虫：只针对给定的url进行爬取ctrl+f ：网页搜索框步骤1：从网页上获取大学排名网页内容步骤2：提取网页内容中信息到合适的数据结构步骤3：利用数据结构展示并输出结构

2020-06-01 20:40:15 250

原创爬虫--信息

信息标记HTMLXMLJSONYAMLXML实例JSON实例YAML实例信息提取的一般方法方法一：完整解析信息的标记形式，再提取关键信息需要标记解析器。例如：bs4库的标签树遍历优点：信息解析准确缺点：提取过程繁琐，速度慢方法二：无视标记形式，直接搜索关键信息对信息的文本1查找函数即可优点：提取过程简洁，速度较快缺点：提取结果准确性与信息内容相关融合方法：结合形式解析与搜索方法，提取关键信息需要标记解析器及文本查找函数实例：提取HTML中所有URL连接思路：（1

2020-05-31 20:40:00 163

原创 python beautifulsoup

Beautiful Soup类的基本元素例子from bs4 import BeautifulSoupr = requests.get('https://python123.io/ws/demo.html')demo = r.textsoup = BeautifulSoup(demo,'html.parser') #'html.parser'是解析器print(soup.prettify())结果Beautiful Soup库的理解基于bs4库的HTML内容遍历方法from b

2020-05-31 19:41:08 301 1

原创 python 环境变量

环境变量简单说环境变量就是告诉系统在什么目录下寻找所需的东西如利用命令提示符安装python第三方包，我们是想要将包安装在anaconda下，所以需要先将当前anaconda的路径加入到命令提示符当前路径中...

2020-05-29 11:37:20 304

原创 python 决策树

python 决策树数据预处理导入pandas模块import pandas as pd读入数据，使用pandas中的函数pd.read_csv#路径中含中文时加入‘engine='python'’df=pd.read_csv(r'C:\Users\***\Desktop\Titanic.csv',engine='python')df.head()结果：‘PassengerId’,‘Name’,‘Ticket’,'Cabin’是我们不需要的数据，利用drop函数删除该变量，并检查剩余变

2020-05-29 10:03:46 561

hyhpyx的博客