
数据分析项目
文章平均质量分 80
数据分析
静水``流深
这个作者很懒,什么都没留下…
展开
-
狗狗评分分析
一、项目简介(一)项目情况推特用户 @dog_rates 的档案也叫做 WeRateDogs。以诙谐幽默的方式对人们的宠物狗评级。这些评级通常以 10 作为分母。但是分子呢?分子一般大于 10。如11/10、12/10、13/10 等,WeRateDogs 拥有四百多万关注者,曾受到国际媒体的报道。WeRateDogs 推特档案包括基本的推特信息,如 5000 多条推特,但并不包括所有数据,转发用户和喜爱用户是两个遗漏的列。不过档案中有一列包括每个推特文本,可以用来提取评级、狗的名字和 "地位" (原创 2021-09-05 14:54:38 · 595 阅读 · 0 评论 -
数据分析-python基于Excel的操作
import pandas as pdinputfile = r'D:\XXX\data_analysis\SDC DA Assessment - Data Analysis & Visualization.xlsx.xlsx'outputfile = r'D:\XXX\data_analysis\result' # 结果文件# 导入excel文件pwc_orders = pd.read_excel(inputfile, header =0, sheet_name=0)pwc_r.原创 2021-03-21 20:48:09 · 296 阅读 · 0 评论 -
Titanic: Machine Learning from Disaster_01
一、数据预处理import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltimport seaborn as sns1 导入数据trainfile = '../input/titanic/train.csv'testfile = '../input/titanic/test.csv'train = pd.read_csv(trainfile)test = pd.read_csv(testfil原创 2020-07-08 17:13:19 · 158 阅读 · 0 评论 -
Titanic: Machine Learning from Disaster_02
二、模型的建立1 初步建模结果1.1 使用cross-validation评估训练结果 & 得到测试结果from sklearn.model_selection import cross_val_score # cross-validationfrom sklearn.linear_model import LogisticRegression # 逻辑回归from sklearn.tree import DecisionTreeClassifier # 决策树from原创 2020-07-08 17:07:56 · 135 阅读 · 0 评论