- 博客(82)
- 收藏
- 关注
原创 财政收入影响因素分析和预测模型
描述:采用数据挖掘算法中人工神经网络算法,首先用Adaptive—Lasso方法找出相关性最大的因素,根据现有的数据建立神经网络模型,然后对未知属性做出预测。代码:import pandas as pddef Data_pro(feature,data): data_train = data.loc[range(1994, 2014)].copy() # 取2014年前的数据建模 ...
2018-04-30 21:40:34
6085
6
原创 航空公司客户价值分析
描述:采用数据挖掘算法中K-Means聚类算法,首先对数据探索,清洗,规约,然后对数据归一化处理,使用K-Means算法进行聚类分析,代码:#-*- coding:utf -8-*-import pandas as pd#对数据基本探索,返回最大最小值def Data_Explore(data): outputfile = 'F:/chapter7_explore_result....
2018-04-30 21:38:16
642
原创 电力切漏电用户自动识别
描述:使用数据挖掘中LM神经网络和CART决策树算法,首先分析窃漏电用户行为特征,对数据预处理,采用拉格朗日插值算法补全数据,构建专家样本,建立LM神经网络和CART决策树模型,同时画出两个模型的ROC曲线图和可视化混淆矩阵,用于评价模型优劣。代码:#将原始数据分为20%的测试样本和80%的训练样本import pandas as pdfrom random import shuffle #导...
2018-04-30 21:36:31
712
原创 python爬取flickr官网上图片
代码:import requestsimport urllib.requestfrom bs4 import BeautifulSoupfrom selenium import webdriverimport randomfrom selenium.webdriver.chrome.options import Optionsimport re#http请求头headers = ...
2018-04-30 21:33:19
7272
1
原创 python爬取贴吧用户评论,用户名等相关信息
代码:# coding:utf-8# 引入requests请求包import requestsimport urllib# 给一个url参数 返回源代码def get_datasource(url): try: response = requests.get(url) if response.status_code == 200: ...
2018-04-30 21:32:01
3224
1
原创 定向爬取新浪股票和百度股票数据
代码:import reimport requestsfrom bs4 import BeautifulSoupdef getHTMLtext(url,code = "utf-8"): try: r = requests.get(url) r.raise_for_status() r.encoding = code ...
2018-04-30 21:30:07
2023
原创 根据搜索内容爬取招聘网的职位招聘信息
代码:import requestsfrom bs4 import BeautifulSoupimport timedef getHtml(url,code='gbk'): try: r = requests.get(url) r.raise_for_status() r.encoding = code return...
2018-04-30 21:26:03
438
原创 根据搜索内容爬取拉钩网和招聘网的职位招聘信息
代码:import requestsimport timeimport randomip_list = ['117.135.132.107', '121.8.98.196', '194.116.198.212']#http请求头信息headers={'Accept':'application/json, text/javascript, */*; q=0.01','Accept...
2018-04-30 21:24:16
681
原创 requests和beautifulSoup库爬取豆瓣各类型电影
代码:# -*-coding:utf-8-*-from selenium.webdriver.chrome.options import Optionsfrom bs4 import BeautifulSoupfrom selenium import webdriverimport reimport requestsimport timeimport jsonimport rand...
2018-04-30 21:21:26
968
原创 python之matplotlib库的基本操作
matplotlib库丰富的绘图功能,具体如下:#绘图import matplotlib.pyplot as plt #导入图像库plt.rcParams['font.sans-serif'] = ['SimHei'] #设置中文标签plt.rcParams['axes.unicode_minus'] = False #设置负号正常显示plt.figure(figsize = (7,
2018-02-07 17:22:25
890
原创 python之Pandas库的基本操作
Pandas的安装比较容易,安装好Numpy之后,可以通过pip install pandas直接或者下载源码之后安装,但是默认的Pandas还不能读写Excel文件,需要安装xlrd(读),xlwt(写)库才能支持Excel的读写,方法如下:pip install xlrd 为python添加读入Excel的功能pip install xlwt 为python添加写入Excel的功
2018-01-16 17:43:07
1051
原创 python之Matplotlib库的简单操作
Matplotlib是最著名的会图库,主要用于二维绘图,也可以进行简单的三维绘图,安装可以通过pip install matplotlib直接安装,也可以下载源代码安装import numpy as npimport matplotlib.pyplot as plt #导入Matloptlibx = np.linspace(0,10,1000) #作图自变量y = np.sin(
2018-01-16 17:27:33
689
原创 python之scipy库简单操作
Scipy提供了真正的矩阵,以及大量基于矩阵运算的对象与函数,功能包含最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,信号处理和图像处理,常微分方程求解等,Scipy依赖于Numpy库,因此安装Scipy时应先安装Numpy库,Scipy安装与其他库一样,可通过pip install Scipy安装,也可以自行下载源代码,然后用pip install 路径+文件名全称(包括.后缀
2018-01-15 11:14:09
4443
原创 python之Numpy库简单操作
在windows中,Numpy安装与其他库一样,可通过pip install numpy安装,也可以自行下载源代码,然后用pip install 路径+文件名全称(包括.后缀文件名)进行安装,源码下载链接:https://pypi.python.org/pypi/numpy/1.14.0,选择对应版本下载即可import numpy as np #一般用np作为numpy的别名a = n
2018-01-15 11:07:34
483
原创 查找GPA最高的学生
# 找到GPA最高的学生 class Student: def __init__(self, name, hours, qpoints): self.name = name self.hours = float(hours) self.qpoints = float(qpoints) def getName(self)
2018-01-13 16:42:48
1088
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人