- 博客(17)
- 收藏
- 关注
原创 LDA(Latent Dirichlet Allocation)主题模型
LDA(Latent Dirichlet Allocation)主题模型LDA(Latent Dirichlet Allocation)中文翻译为:潜在狄利克雷分布。LDA主题模型是一种文档生成模型,是一种非监督机器学习技术。它认为一篇文档是有多个主题的,而每个主题又对应着不同的词。一篇文档的构造过程,首先是以一定的概率选择某个主题,然后再在这个主题下以一定的概率选出某一个词,这样就生成了这篇文档的第一个词。不断重复这个过程,就生成了整篇文章(当然这里假定词与词之间是没有顺序的,即所有词无序的堆放在一个大
2020-12-28 14:26:37
1262
原创 python中rstrip()、lstrip()、strip()函数使用
这三个函数都可传入一个参数,指定要去除的首尾字符,需要注意的是以字符数组的形式传参。lstrip函数:去除字符串左边开始的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换行\n,制表符\t, 换页符\f;rstrip函数:去除字符串右边结束的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换行\n,制表符\t, 换页符\f;strip函数:去除字符串左右两边(首尾)的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换
2020-11-22 21:19:41
613
原创 爬虫之BeautifulSoup
import requests# 引入BS库,下面的bs4就是beautifulsoup4from bs4 import BeautifulSoupres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')# 把网页解析为BeautifulSoup对象soup = BeautifulSoup(res.text,'html.parser')第3
2020-08-10 17:00:43
186
原创 爬虫之requests
引入requests库import requestsrequests.get是在调用requests库中的get()方法,它向服务器发送了一个请求,括号里的参数是你需要的数据所在的网址,然后服务器对请求作出了响应。我们把这个响应返回的结果赋值给变量resres = requests.get(‘URL’)文本爬取import requestsres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawl
2020-08-10 15:08:04
1073
原创 变量名的命名规则
***Python 变量名必须以字母、下画线()开头,后面可以跟任意数目的字母、数字和下画线()。Python 语言是区分大小写的,因此 abc 和 Abc 是两个不同的标识符。变量名(标识符)不能是 Python 关键字,但可以包含关键字。例如下面变量,有些是合法的,有些是不合法的:abc_xyz:合法。_xyz:合法。HelloWorld:合法。1abc:不合法,标识符不允许数字开头。abc:合法。xyz#abc:不合法,标识符中不允许出现“#”号。Xyz abc:不合法,
2020-07-15 15:48:16
3267
原创 print()函数
print()函数,引号无论单引号还是双引号必须是英文状态下的引号无引号:只能输出数字或者数字运算单引号,双引号:输出任何你输入的数字,文字或者字符串等等三引号:是英文输入法下三个单引号,实现换行功能代码:print(1)print(1+1)print("计算1+1")print('计算1+1')print("计算'1+1'")print('计算"1+1"')print('''1+12+23+3''')运行结果:12计算1+1计算1+1计算’1+1’计算"1+1"
2020-07-15 15:36:50
1391
原创 数据异常检测(多元高斯模型)
数据下载:链接:https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码:qkg2代码import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatdata = loadmat('data/ex8data1.mat')x = data['X']x_val = data['X_val']y_val = data['y_val']plt.figure(
2020-05-27 22:21:10
735
1
原创 数据异常检测
数据下载:链接:https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码:qkg2两维数据异常检测(使用高斯原始模型)代码import pandas as pdimport numpy as npfrom scipy.io import loadmatimport matplotlib.pyplot as pltimport mathmat = loadmat('data/ex8data1.mat')print(mat.keys())#
2020-05-26 22:31:30
649
1
原创 python matplotlib在一张图片中显示多张图片
*1.加载的数据集中已自动生成X张图片import matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat('data1.mat') # 假设文件中有32张图片 img= mat['img']plt.figure()for i in range(1,X): # X为图片的个数 plt.subplot(a,b,i-1) # a,b 分别为图片集的行数,列数 plt.imshow(img[i-1])
2020-05-21 16:52:05
4403
原创 sklearn中的线性模型
数据下载:https://pan.baidu.com/s/1eHYQ6YHWXx8E-BZJk1qTFg提取码:o87r代码:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import linear_modelpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])model
2020-05-15 16:34:46
502
原创 正规方程
数据下载:链接:https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码:d0zk程序代码:import numpy as npimport pandas as pdpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms", "price"])data2 = (data2 - data2.mean()) / data2.std()data2.insert(
2020-05-15 15:08:46
227
原创 多变量线性回归
数据下载:链接:https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码:d0zk主程序:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms"
2020-05-15 15:01:00
436
1
原创 K_means算法
数据来源:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6x主程序:import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X = mat['X']def plot_data(X): plt.figure(figsize=(8, 5))
2020-05-15 11:38:41
241
原创 matplotlib.pyplot函数参数
首先看下该函数的:matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass=<class ‘matplotlib.figure.Figure’>, clear=False, **kwargs)参数:(1)num:可选参数,可以将该num理解为窗口的属性id。如果不提供该参数,则创建窗口的时候该参数会自增 figure
2020-05-14 19:28:12
749
原创 简单二分类(随机初始聚类点)
根据样本点距初始聚类点的距离,将样本点分类。样本点距离那个初始聚类点最近就分为哪一类,随机初始聚类点(k个),并计算分类后各簇的均值。数据下载链接:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6ximport numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X
2020-05-14 15:27:48
2457
原创 简单二分类(手动输入初始聚类点)
根据样本点距初始聚类点的距离,将样本点分类。样本点距离那个初始聚类点最近就分为哪一类,手动输入初始聚类点(k个),并计算分类后各簇的均值。数据下载链接:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6x复制这段内容后打开百度网盘手机App,操作更方便哦import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadm
2020-05-14 12:04:39
971
原创 pycharm(python3.7解释器)单变量线性回归
主程序:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])print(data.head())print(data.describe())data.plot(kind="s
2020-05-14 11:11:36
676
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人