自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

xiaobai110188的博客

原创 LDA(Latent Dirichlet Allocation)主题模型

LDA(Latent Dirichlet Allocation)主题模型LDA(Latent Dirichlet Allocation)中文翻译为：潜在狄利克雷分布。LDA主题模型是一种文档生成模型，是一种非监督机器学习技术。它认为一篇文档是有多个主题的，而每个主题又对应着不同的词。一篇文档的构造过程，首先是以一定的概率选择某个主题，然后再在这个主题下以一定的概率选出某一个词，这样就生成了这篇文档的第一个词。不断重复这个过程，就生成了整篇文章（当然这里假定词与词之间是没有顺序的，即所有词无序的堆放在一个大

2020-12-28 14:26:37 1356

原创 python中rstrip()、lstrip()、strip()函数使用

这三个函数都可传入一个参数，指定要去除的首尾字符，需要注意的是以字符数组的形式传参。lstrip函数：去除字符串左边开始的指定字符，默认指定字符为空白字符（whiteSpace），如空格、回车\r，换行\n，制表符\t，换页符\f；rstrip函数：去除字符串右边结束的指定字符，默认指定字符为空白字符（whiteSpace），如空格、回车\r，换行\n，制表符\t，换页符\f；strip函数：去除字符串左右两边（首尾）的指定字符，默认指定字符为空白字符（whiteSpace），如空格、回车\r，换

2020-11-22 21:19:41 709

原创爬虫之BeautifulSoup

import requests# 引入BS库，下面的bs4就是beautifulsoup4from bs4 import BeautifulSoupres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')# 把网页解析为BeautifulSoup对象soup = BeautifulSoup(res.text,'html.parser')第3

2020-08-10 17:00:43 222

原创爬虫之requests

引入requests库import requestsrequests.get是在调用requests库中的get()方法，它向服务器发送了一个请求，括号里的参数是你需要的数据所在的网址，然后服务器对请求作出了响应。我们把这个响应返回的结果赋值给变量resres = requests.get(‘URL’)文本爬取import requestsres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawl

2020-08-10 15:08:04 1115

原创变量名的命名规则

***Python 变量名必须以字母、下画线（）开头，后面可以跟任意数目的字母、数字和下画线（）。Python 语言是区分大小写的，因此 abc 和 Abc 是两个不同的标识符。变量名（标识符）不能是 Python 关键字，但可以包含关键字。例如下面变量，有些是合法的，有些是不合法的：abc_xyz：合法。_xyz：合法。HelloWorld：合法。1abc：不合法，标识符不允许数字开头。abc：合法。xyz#abc：不合法，标识符中不允许出现“#”号。Xyz abc：不合法，

2020-07-15 15:48:16 3387

原创 print()函数

print（）函数，引号无论单引号还是双引号必须是英文状态下的引号无引号：只能输出数字或者数字运算单引号，双引号：输出任何你输入的数字，文字或者字符串等等三引号：是英文输入法下三个单引号，实现换行功能代码：print(1)print(1+1)print("计算1+1")print('计算1+1')print("计算'1+1'")print('计算"1+1"')print('''1+12+23+3''')运行结果：12计算1+1计算1+1计算’1+1’计算"1+1"

2020-07-15 15:36:50 1476

原创数据异常检测（多元高斯模型）

数据下载：链接：https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码：qkg2代码import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatdata = loadmat('data/ex8data1.mat')x = data['X']x_val = data['X_val']y_val = data['y_val']plt.figure(

2020-05-27 22:21:10 802 1

原创数据异常检测

数据下载：链接：https://pan.baidu.com/s/1ePMpmTBeoECBFFgPZQrPAg提取码：qkg2两维数据异常检测（使用高斯原始模型）代码import pandas as pdimport numpy as npfrom scipy.io import loadmatimport matplotlib.pyplot as pltimport mathmat = loadmat('data/ex8data1.mat')print(mat.keys())#

2020-05-26 22:31:30 686 1

原创 python matplotlib在一张图片中显示多张图片

*1.加载的数据集中已自动生成X张图片import matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat('data1.mat') # 假设文件中有32张图片 img= mat['img']plt.figure()for i in range(1,X): # X为图片的个数 plt.subplot(a,b,i-1) # a,b 分别为图片集的行数，列数 plt.imshow(img[i-1])

2020-05-21 16:52:05 4469

原创 sklearn中的线性模型

数据下载：https://pan.baidu.com/s/1eHYQ6YHWXx8E-BZJk1qTFg提取码：o87r代码：import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import linear_modelpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])model

2020-05-15 16:34:46 865

原创正规方程

数据下载：链接：https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码：d0zk程序代码：import numpy as npimport pandas as pdpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms", "price"])data2 = (data2 - data2.mean()) / data2.std()data2.insert(

2020-05-15 15:08:46 258

原创多变量线性回归

数据下载：链接：https://pan.baidu.com/s/1GFVuNcF3iM3rIhbZd9lgfQ提取码：d0zk主程序：import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data2.txt"data2 = pd.read_csv(path, names=["size", "bedrooms"

2020-05-15 15:01:00 469 1

原创 K_means算法

数据来源：链接：https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码：up6x主程序：import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X = mat['X']def plot_data(X): plt.figure(figsize=(8, 5))

2020-05-15 11:38:41 262

原创 matplotlib.pyplot函数参数

首先看下该函数的：matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass=<class ‘matplotlib.figure.Figure’>, clear=False, **kwargs)参数：（1）num:可选参数，可以将该num理解为窗口的属性id。如果不提供该参数，则创建窗口的时候该参数会自增 figure

2020-05-14 19:28:12 817

原创简单二分类（随机初始聚类点）

根据样本点距初始聚类点的距离，将样本点分类。样本点距离那个初始聚类点最近就分为哪一类，随机初始聚类点（k个），并计算分类后各簇的均值。数据下载链接：链接：https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码：up6ximport numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadmat("./data/ex7data2.mat")X

2020-05-14 15:27:48 2499

原创简单二分类（手动输入初始聚类点）

根据样本点距初始聚类点的距离，将样本点分类。样本点距离那个初始聚类点最近就分为哪一类，手动输入初始聚类点（k个），并计算分类后各簇的均值。数据下载链接：链接：https://pan.baidu.com/s/1GT2HGMRtYJsVm7iWMi4qRw提取码：up6x复制这段内容后打开百度网盘手机App，操作更方便哦import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatmat = loadm

2020-05-14 12:04:39 1004

原创 pycharm(python3.7解释器)单变量线性回归

主程序：import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport cost_functionimport gd_functionpath = "ex1data1.txt"data = pd.read_csv(path, names=["Population", "Profit"])print(data.head())print(data.describe())data.plot(kind="s

2020-05-14 11:11:36 706

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除