
python
hllingg
叶子Q925848726
展开
-
主成分降维python代码实现(承接上一篇)
# coding=utf-8import pandas as pdimport numpy as npfrom sklearn.decomposition import PCAfrom sklearn.preprocessing import StandardScalerdata = pd.read_csv("pca.csv") # 数据的导入# print(type(data))...原创 2018-12-29 18:06:17 · 1139 阅读 · 0 评论 -
jieba的简单使用(Python)
Jieba库是一个优秀的第三方中文分词库,jieba支持三种分词模式:精准模式,全模式,搜索引擎模式.Jieba分词的三种模式精准模式:把文本精确的切分开,不存在冗余单词全模式:把文本中所有可能的词语都描述出来,有冗余搜索引擎模式:在精确模式基础上,对长词再次切分例子:1.全模式import jieba#全模式sentence="我喜欢上海东方明珠"result...原创 2019-02-13 17:48:56 · 535 阅读 · 0 评论 -
Python相关模块介绍和相关模块的安装与技巧
Python相关模块介绍1.numpy可以高效处理数据,提供数据组支持,很多模块都依赖他,比如pandas,scipy,matplotlib都依赖他,所以这个模块是基础2.pandas主要用于进行数据探索和数据分析3.matplotlib作图模块,解决可视化问题4.scipy主要进行数值计算,同时支持矩阵运算,并提供了很多高等数据处理功能,比如积分,傅里叶变换,微分方程求解...原创 2019-01-15 17:58:30 · 239 阅读 · 0 评论 -
主成分分析降维(用Python中的PCA模块实现)
之前本人写过一篇用Python实现主成分降维的文章,现在想想感觉方法很麻烦,因为Python的PCA模块可以很容易的完成数据降维。下面附上代码# 主成分分析# coding=utf-8import pandas as pd# import numpy as npfrom sklearn.decomposition import PCA# from sklearn.preproce...原创 2019-01-25 17:31:56 · 2003 阅读 · 0 评论 -
数据探索与数据清洗
一 数据探索数据探索的目的是及早的发现数据的一些简单规律或特征,数据清洗的目的是留下可靠的数据,避免脏数据的干扰.数据探索的核心是:数据质量分析(跟数据清洗密切联系) 数据特征分析(分布,对比,周期性,相关性,常见统计量等)二 数据清洗数据清洗可以按如下步骤进行缺失值处理(通过describe与len发现,通过0数据发现) 异常值处理(通过散点图发现) 异常值处理(通过...原创 2019-01-24 17:46:44 · 1056 阅读 · 0 评论 -
梯度下降和逻辑回归例子(Python代码实现)
import numpy as npimport pandas as pdimport osdata = pd.read_csv("iris.csv") # 这里的iris数据已做过处理m, n = data.shapedataMatIn = np.ones((m, n))dataMatIn[:, :-1] = data.ix[:, :-1]classLabels = data...原创 2019-01-08 18:21:35 · 1851 阅读 · 0 评论 -
正则表达式
最近在学怎么用Python爬虫,然后学了爬虫时可能用到的一些正则表达式,整理了一下如下: 原子原子是正则表达式中的最基本的组成单位,每个正则表达式中至少要包含一个原子。常见的原子类型有:a:普通字符作为原子b:非打印字符作为原子c:通用字符作为原子d:原子表 非打印字符:\n:换行\t:tab字表符通用字符:\w:匹配任意的一个字母数字或者下划线\d:匹配任意一个十...原创 2019-01-14 08:40:40 · 146 阅读 · 0 评论 -
模型评估
回归评估指标均方误差(MSE)MSE (Mean Squared Error)叫做均方误差。看公式 1m∑i=1m(yi−f(xi))21m∑i=1m(yi−f(xi))2均方根误差(RMSE)RMSE(Root Mean Squard Error)均方根误差。 1m∑i=1m(yi−f(xi))2−−−−−−−−−−−−−−−√1m∑i=1m(yi−f(xi))2 这是MSE开...转载 2019-01-07 18:13:29 · 1367 阅读 · 0 评论 -
读书总结--二分查找
感想:最近读了一本书,书名是《算法图解》个人觉得这本书挺好,里面讲了很多实用且易懂的算法,以后我会陆续的把自己的笔记搬到这上面,有兴趣的可以看一下。二分查找:二分查找是一种算法,其输入是一个有序的元素列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回NULL。下面的例子说明了二分查找的工作原理。随便想一个1~100的数字。你的目的是以最少的次数猜到这个数字。你每次猜测后,...原创 2019-06-30 22:59:11 · 154 阅读 · 0 评论