
大数据开发
文章平均质量分 93
大数据相关的实验
pearzili
挑战懒惰的人。
展开
-
使用线性回归模型对波士顿数据集进行预测。
1、数据集读入导入sklearn的自带数据集——boston数据集,分别取出特征向量,以及样本。2、数据预处理,根据需要进行标准化,归一化处理查看数据集中的数据,X的数据最小为0.0,最大为711,y的数据最小为5.0,最大为50。数据的跨度较大,因此采用最小最大标准化的规则来把数据归一化到[0,1],以便让代价函数收敛得更快一点。标准化后的数据:3、将数据集划分为训练集与测试集将数据集按照8:2的比例划分为训练集与测试集:4、利用训练数据构建模型..原创 2020-06-11 11:54:51 · 3799 阅读 · 0 评论 -
使用scrapy爬虫
实验目的1. 使用scrapy爬虫实验要求1. 使用scrapy爬虫实验过程导入srapy库打开pycharm,点击file下的settings,导入anaconda下的python编译器。点击Project interpreter,在右侧窗口选择show all interpreter,点击+号,进入anaconda下的python编译器导入。点击OK后在proj...原创 2020-02-29 11:13:25 · 289 阅读 · 0 评论 -
使用贝叶斯模型对房价进行预测。
实验试题 房屋数据集预处理一、实验概述:【实验要求】保存程序,并自行存档; 最终的程序都必须经过测试,验证是正确的; 认真记录实验过程及结果,回答实验考试报告中的问题。【实施环境】(使用的材料、设备、软件)Python开发环境二、实验考试内容题目 房屋数据集预处理【实验内容】请下载housing.csv文件。这是反应若干个小镇的房价的数据集,对数据...原创 2020-02-29 11:08:38 · 4040 阅读 · 1 评论 -
使用透视表对数据进行预处理。
学校要求的做实验,参考老师发的代码。实验目的1. 了解和掌握透视表进行数据预处理方法实验要求使用python的pandas进行操作。涉及知识包括:1.数据框的增删查改;2.批量读取数据;3.变量类型的转换;4.数据框的重塑与合并;5.生成数据透视表。实验过程导入数据:引入pandas等库对数据进行导入。读取2004年的数据,并且查看前5行数据...原创 2020-02-29 11:02:28 · 910 阅读 · 0 评论 -
爬虫+分析数据绘图
实验目的1. 爬虫+分析数据绘图实验要求1. 爬虫+分析数据绘图实验过程寻找存放数据的文件打开谷歌浏览器,输入网址:http://finance.sina.com.cn/stock/sl/按住f12键,在浏览器的后台点击Network观察下方的数据变化。点击newSinaHy.php发现表格数据全放在这个文件夹下,点击右键选择copy,再选择copy li...原创 2020-02-29 10:58:18 · 1341 阅读 · 0 评论 -
使用python对tushare中证500的数据进行股票评价。
实验目的1. 股票评价实验要求对中证500股票进行评价。实验过程获取中证500的历史数据,把中证500的股票代码放在一个dataFrame()中。import tushare as tsimport pandas as pddata_code=pd.DataFrame()code=ts.get_zz500s().codedata_code['code']=c...原创 2020-02-29 10:54:44 · 2748 阅读 · 0 评论