自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 LDA(Latent Dirichlet Allocation)主题模型

LDA(Latent Dirichlet Allocation)主题模型LDA(Latent Dirichlet Allocation)中文翻译为:潜在狄利克雷分布。LDA主题模型是一种文档生成模型,是一种非监督机器学习技术。它认为一篇文档是有多个主题的,而每个主题又对应着不同的词。一篇文档的构造过程,首先是以一定的概率选择某个主题,然后再在这个主题下以一定的概率选出某一个词,这样就生成了这篇文档的第一个词。不断重复这个过程,就生成了整篇文章(当然这里假定词与词之间是没有顺序的,即所有词无序的堆放在一个大

2020-12-28 14:26:37 1262

原创 python中rstrip()、lstrip()、strip()函数使用

这三个函数都可传入一个参数,指定要去除的首尾字符,需要注意的是以字符数组的形式传参。lstrip函数:去除字符串左边开始的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换行\n,制表符\t, 换页符\f;rstrip函数:去除字符串右边结束的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换行\n,制表符\t, 换页符\f;strip函数:去除字符串左右两边(首尾)的指定字符,默认指定字符为空白字符(whiteSpace),如空格、回车\r,换

2020-11-22 21:19:41 613

原创 爬虫之BeautifulSoup

import requests# 引入BS库,下面的bs4就是beautifulsoup4from bs4 import BeautifulSoupres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')# 把网页解析为BeautifulSoup对象soup = BeautifulSoup(res.text,'html.parser')第3

2020-08-10 17:00:43 186

原创 爬虫之requests

引入requests库import requestsrequests.get是在调用requests库中的get()方法,它向服务器发送了一个请求,括号里的参数是你需要的数据所在的网址,然后服务器对请求作出了响应。我们把这个响应返回的结果赋值给变量resres = requests.get(‘URL’)文本爬取import requestsres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawl

2020-08-10 15:08:04 1073

原创 变量名的命名规则

***Python 变量名必须以字母、下画线()开头,后面可以跟任意数目的字母、数字和下画线()。Python 语言是区分大小写的,因此 abc 和 Abc 是两个不同的标识符。变量名(标识符)不能是 Python 关键字,但可以包含关键字。例如下面变量,有些是合法的,有些是不合法的:abc_xyz:合法。_xyz:合法。HelloWorld:合法。1abc:不合法,标识符不允许数字开头。abc:合法。xyz#abc:不合法,标识符中不允许出现“#”号。Xyz abc:不合法,

2020-07-15 15:48:16 3267

原创 print()函数

print()函数,引号无论单引号还是双引号必须是英文状态下的引号无引号:只能输出数字或者数字运算单引号,双引号:输出任何你输入的数字,文字或者字符串等等三引号:是英文输入法下三个单引号,实现换行功能代码:print(1)print(1+1)print("计算1+1")print('计算1+1')print("计算'1+1'")print('计算"1+1"')print('''1+12+23+3''')运行结果:12计算1+1计算1+1计算’1+1’计算"1+1"

2020-07-15 15:36:50 1391

原创 数据异常检测(多元高斯模型)

数据下载:链接:https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码:qkg2代码import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatdata = loadmat('data/ex8data1.mat')x = data['X']x_val = data['X_val']y_val = data['y_val']plt.figure(

2020-05-27 22:21:10 735 1

原创 数据异常检测

数据下载:链接:https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码:qkg2两维数据异常检测(使用高斯原始模型)代码import pandas as pdimport numpy as npfrom scipy.io import loadmatimport matplotlib.pyplot as pltimport mathmat = loadmat('data/ex8data1.mat')print(mat.keys())#

2020-05-26 22:31:30 649 1

原创 python matplotlib在一张图片中显示多张图片

*1.加载的数据集中已自动生成X张图片import matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat('data1.mat') # 假设文件中有32张图片 img= mat['img']plt.figure()for i in range(1,X): # X为图片的个数 plt.subplot(a,b,i-1) # a,b 分别为图片集的行数,列数 plt.imshow(img[i-1])

2020-05-21 16:52:05 4403

原创 sklearn中的线性模型

数据下载:https://pan.baidu.com/s/1eHYQ6YHWXx8E-BZJk1qTFg提取码:o87r代码:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import linear_modelpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])model

2020-05-15 16:34:46 502

原创 正规方程

数据下载:链接:https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码:d0zk程序代码:import numpy as npimport pandas as pdpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms", "price"])data2 = (data2 - data2.mean()) / data2.std()data2.insert(

2020-05-15 15:08:46 227

原创 多变量线性回归

数据下载:链接:https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码:d0zk主程序:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms"

2020-05-15 15:01:00 436 1

原创 K_means算法

数据来源:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6x主程序:import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X = mat['X']def plot_data(X): plt.figure(figsize=(8, 5))

2020-05-15 11:38:41 241

原创 matplotlib.pyplot函数参数

首先看下该函数的:matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass=<class ‘matplotlib.figure.Figure’>, clear=False, **kwargs)参数:(1)num:可选参数,可以将该num理解为窗口的属性id。如果不提供该参数,则创建窗口的时候该参数会自增 figure

2020-05-14 19:28:12 749

原创 简单二分类(随机初始聚类点)

根据样本点距初始聚类点的距离,将样本点分类。样本点距离那个初始聚类点最近就分为哪一类,随机初始聚类点(k个),并计算分类后各簇的均值。数据下载链接:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6ximport numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X

2020-05-14 15:27:48 2457

原创 简单二分类(手动输入初始聚类点)

根据样本点距初始聚类点的距离,将样本点分类。样本点距离那个初始聚类点最近就分为哪一类,手动输入初始聚类点(k个),并计算分类后各簇的均值。数据下载链接:链接:https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码:up6x复制这段内容后打开百度网盘手机App,操作更方便哦import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadm

2020-05-14 12:04:39 971

原创 pycharm(python3.7解释器)单变量线性回归

主程序:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])print(data.head())print(data.describe())data.plot(kind="s

2020-05-14 11:11:36 676

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除