- 博客(14)
- 问答 (1)
- 收藏
- 关注
原创 使用Pandas 绘制带样式的Excel
import pandas as pdimport openpyxl#生成一个DataFramedata= pd.DataFrame(data=np.random.randn(6,3),columns=["a",'b','c'])#filename 保存的文件名filename = 'test.xlsx'writer = pd.ExcelWriter(filename,engine...
2019-11-14 12:13:16
1834
原创 python无监督学习,k-means算法
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 样本: 要求通过客户消费频率与金额为客户群体分3类import pandas as pdimport numpy as npimport m...
2019-01-13 14:54:59
853
原创 python监督式学习--分类标签,实现1-9的手写数字识别
监督式学习,由已有的数据包括输入输出,训练模型函数;然后把新的输入数据带入模型函数,预测数据输出;函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)使用knn算法样本:样本拥有两类,一部分是训练样本,一部分是测试样本,可以从文本中大概看出这是数字0,以0和1 表示,文件名‘-’前表示数字内容,后面表示样本的名字一,处理样本import pandas ...
2019-01-12 16:38:53
993
1
原创 pandas中 透视表与交叉表常用属性
pandas中透视表与交叉表使用pivot_table()和crosstab()实现透视表pivot_table()import pandas as pdimport numpy as npdetail=detail=pd.Dataframe({'order_id':[1,2,3,4,5], 'counts':[1,2,1,3,1], ...
2019-01-08 19:48:12
526
1
原创 pandas的基础应用
Pandas提供了一套名为DataFrame的数据结构,比较契合统计分析中的表结构,并且提供了计算接口,可用Numpy或其它方式进行计算。1 文件读取import pandas as pddataframe=pd.read_csv(r'C:\Users\Administrator\Desktop\mealcsv',encoding='gbk')'''读取 read_csvread...
2019-01-08 19:30:08
282
原创 matplotlib的基本绘图
基本绘图流程常用函数绘制折线图import matplotlib.pyplot as pltimport numpy as np#创建画布:plt.figure()#更改字体,让图片可以显示中文plt.rcParams['font.sans-serif'] = 'SimHei'plt.rcParams['axes.unicode_minus'] = False#设定x,...
2019-01-05 11:01:38
377
原创 Numpy的基本使用
数组的创建:import numpy as np#一维数组的创建:arr1 = np.array([1,2,3,4])#二维数组:arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])数组的属性:print('数组结构:',arr2.shape)print('数组元素个数:',arr2.size)print('数组元素类型:',a...
2019-01-03 20:02:22
253
原创 理解Scrapy架构图
Scrapy 使用了 Twisted['twɪstɪd](其主要对手是 Tornado)异步网络框架来处理网络通讯,可以加快我们的下载速度,不用自己去实现异步框架,并且包含了各种中间件接口,可以灵活的完成各种需求Scrapy Engine: 负责 Spider、ItemPipeline、Downloader、Scheduler 中间的通讯,信号、数据传递等Scheduler(调度器): 它负...
2018-12-28 19:59:11
467
1
原创 python,css渲染的雪碧图加密文字
有些网站的文字内容使用雪碧图加密,网站显示的内容源代码的内容雪碧图css网站根据css精灵图坐标渲染页面,首先我们要把css拿下来存到本地,然后筛选自己需要的import re,requestsfrom lxml import etreewith open('111.css','r',encoding='utf-8') as f: a = f.read()b=...
2018-12-26 23:21:40
400
原创 UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-13: ordinal not in range(12
环境:win10 + AnacondaUrllib中请求网址中带有中文报错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-13: ordinal not in range(128)使用urllib.parse.quote()把文字转码from urllib import requesti...
2018-12-21 16:27:00
3636
1
原创 Cookie 和 Session 基础知识
一、二者的定义:具体来说 cookie 机制采用的是在客户端保持状态的方案,而 session 机制采用的是在服务器端保持状态的方案。Session是建立在cookie上使用的。*cookie 机制是一种客户端的机制,cookie 的内容主要包括:名字,值,过期时间,路径和域。若不设置过期时间,则表示这个 cookie 的生命期为浏览器会话期间,关闭浏览器窗口,cookie 就消失。s...
2018-12-20 20:01:08
585
原创 Urllib中反爬
Urllib中反爬环境:win10+Anaconda3.5+pycharm1,加headersfrom urllib import request#导入库url='https://www.baidu.com/'#网址headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.3...
2018-12-20 19:45:34
251
空空如也
bat for命令判断里面是否存在指定字符串。
2019-04-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人