
python
文章平均质量分 53
Song_Lynn
这个作者很懒,什么都没留下…
展开
-
python numpy array random 随机排列(打乱训练数据)
对numpy.array重新排列:numpy.random.shuffle(x):修改本身,打乱顺序import numpy as nparr = np.array(range(0, 21, 2))np.random.shuffle(arr)arr #打乱顺序后的数组, 如[2, 6, 4, 8, 12, 16, 0, 18, 10, 14, 20]arr = np.array...原创 2018-09-22 21:07:36 · 32830 阅读 · 2 评论 -
python3爬虫(二):解析库之Beautiful Soup
python3爬虫(二):解析库之Beautiful SoupBeautiful Soup是一个可以从HTML或XML中提取数据的python库,了解了HTML或XML的结构,能很方便地获取数据一、准备1、安装库和解析器这里使用的是 beautifulsoup4 以及 lxml 作为解析器pip install beautifulsoup4pip install lxmlHTML例...转载 2018-10-07 15:40:29 · 1308 阅读 · 0 评论 -
python3爬虫(一):请求库之requests
python3爬虫(一):请求库之requestsRequest是基于urllib编写、采用Apache2 Licensed开源协议的HTTP库,在使用方面Requests比urllib更加方便一、HTTP请求1. GETrequests.get(url [, params={‘key’: ‘value’}])通过url的查询字符串传递数据时,数据以键值对的形式跟在url的一个问号之...原创 2018-10-05 16:09:34 · 1532 阅读 · 0 评论 -
Python之pandas的DataFrame
Python之pandas的DataFrameimport pandas as pdimport mathdf=pd.DataFrame({'key':['a','b','c'],'data1':[1,2,3]})1、生成新列df['newcol'] = df['data1'].apply(lambda x: math.sin(x))原创 2018-10-03 15:19:15 · 415 阅读 · 0 评论 -
Python之对数组元素做批量操作
在进行数据分析、数据挖掘的时候,需要对数据进行处理,即对数组或矩阵的行或列进行批量的相同操作import numpy as npdata = np.array([[2,4,6,8],[10,12,14,16]])shape = data.shape()data = [data[i][j]/2 for j in range(shape[1])] for i in range(shape...原创 2018-08-03 22:22:37 · 15544 阅读 · 3 评论 -
Python之日期
Python之日期模块:import datetime1.转换(1)datetime -> strnow = datetime.datetime.now()str = now.strftime('%Y-%m-%d %H:%M:%S')(2) str -> datetimestr = "2014-12-18 15:32:24"date = datetime.d...原创 2018-08-03 22:13:39 · 235 阅读 · 0 评论 -
python数据导出为csv文件
python数据导出为csv文件1 介绍将 list 或 numpy.narray 类型的数据导出为csv文件(同理可扩展到导出为excel,即写入的文件格式为xls,且最后使用to_excel()方法)2 包及相关方法pandas - DataFrame() - join() - to_csv() / to_excel()3 代码import pan...原创 2018-07-08 16:49:58 · 65871 阅读 · 1 评论 -
Python3之字符串
Python3之字符串基础内容创建:为变量分配一个值即可 单行:’xxx’ 或 “xxx”多行:”“” 或 ”’访问:使用方括号来截取字符串,var[i], var[:]不支持单字符类型,单字符也作为一个字符串所有字符串都是 Unicode 字符串转义字符在字符串中使用特殊字符时,用反斜杠 \ 转义字符 转义字符 描述 \(在尾行时)...转载 2018-04-03 16:09:11 · 465 阅读 · 0 评论 -
Python3之Number(数字)
Python3之Number(数字)说明用于存储数值数据类型不允许改变,若改变数字数据类型的值,将重新分配内存控件可使用 del 语句删除数字对象的引用类型int : 整型(整数)包括正负,不带小数点,无大小限制,可当做Long类型使用(python2有Long类型)进制 十六进制:0x, 0X八进制:0o, 0O二进制:0b, 0Bfloat ...转载 2018-04-02 22:28:25 · 389 阅读 · 0 评论 -
Python3之运算符
Python3之运算符算术运算符混合运算时,整数转换为浮点数 - 加:+ - 减:- - 乘:* - 除:/ - 取模:% - 幂:** - 取整除:// (商的整数部分)print(21/10) # 2.1print(21//10) # 2print(9.0//2.0) # 4.0比较(关系)运算符等于:==...转载 2018-04-02 22:27:23 · 338 阅读 · 0 评论 -
Python3之基本数据类型
Python3之基本数据类型 变量不需要声明变量在使用前必须赋值,赋值后变量才被创建赋值方式:等号 = ,左边是变量名,右边是存储在变量中的值多变量赋值a = b = c = 1 # 创建一个整型对象,值为1,三个变量被分配到相同的内存空间上a, b, c = 1, 2, "hello" # 分别分配给三个变量删除对象引用:del语句,d...转载 2018-04-01 22:22:33 · 321 阅读 · 0 评论 -
Python3之基础语法
Python3之基础语法编码默认:源码文件以UTF-8编码,字符串都是unicode字符串指定:# -*- coding: cp-1252 -*-标识符第一个字符:字母表中的字符或下划线 _其它部分:由字母、数字、下划线 _ 组成大小写敏感python3中,允许非ASCII标识符关键字标准库提供了keyword模块,可输出当前版本的所有关...转载 2018-04-01 11:18:04 · 1390 阅读 · 0 评论 -
Python3爬虫(一):请求库之urllib
Python3爬虫(一):请求库之urlliburllib是python3中用于操作url的内置库。在python2中分为urllib和urllib2简单的爬取网页urllib.request.urlopen(url, data, timeout)url:请求地址data:上传数据转换格式:urllib.parse.urlencode(dict_name).encode(‘utf8...原创 2018-10-03 15:16:07 · 530 阅读 · 0 评论 -
python生成序列中n个不重复的的元素
python生成序列中n个不重复的元素很多时候需要从序列中随机抽取n个元素,并且要求是不重复的python的random模块中的sample能够实现random.sample(seq, num)import randoma = range(10)b = random.sample(a, 4) #[4, 7, 2, 9]# 也可以是字符串s = ['123', '543', '...原创 2018-09-22 20:40:28 · 2924 阅读 · 0 评论 -
python爬虫使用requests和BeautifulSoup出现中文乱码
python爬虫使用requests和BeautifulSoup出现中文乱码requests和BeautifulSoup都是自行检测网页编码并进行编码的,所以可能会出现检测错误,需要手动更改编码方式,使得中文能够正常显示from bs4 import BeautifulSoupimport requestsheaders = { 'user_agent': 'Mozilla/5.0 (...原创 2018-10-07 17:35:55 · 2017 阅读 · 1 评论