
Python
与Python相关的总结与分享
木柘
虽然我的心既傲慢又温柔,我的性格柔弱,然而,我是不可战胜的。
展开
-
小白安装与测试openCV(for Python)
一、下载安装openCV打开openCV官网点击Releases来下载openCV 4.1.1.下载完毕,解压到你的硬盘上。进入 ./build/python/cv2/python-3.7二、配置使用openCV的环境创建我们需要的环境conda create -n "env_cv" python=3.7并进入我们所创建的新的环境env_cv三、安装依赖包根据...原创 2019-08-17 21:17:52 · 298 阅读 · 0 评论 -
Pandas中DataFrame基本函数整理
构造函数DataFrame([data, index, columns, dtype, copy]) #构造数据框属性和数据DataFrame.axes #index: 行标签;columns: 列标签DataFrame.as_matrix([columns]) #转换为矩阵DataFrame...转载 2019-08-17 18:19:37 · 1642 阅读 · 0 评论 -
深度之眼比赛实战训练营第06次打卡
特征工程知识点的讲解以及特征工程对成绩的提高任务简介:运用特征工程知识对成绩提高到top80%,描述一下pipline对特征组合的方便之处,还有哪些方法可以对成绩有所提高?详细说明:由于特征工程对于后续成绩的提高有着奇特的效果,所以在两次课中会运用特征组合以及管道知识对数据进行处理和特征的组合,希望大家不要完全按照我的方法来进行特征组合,这个时候大家自己要尝试不同的组合,对特征的重要度也需要...原创 2019-08-17 10:56:31 · 248 阅读 · 0 评论 -
深度之眼比赛实战训练营第08次打卡
预测未来销售:赛题解读以及数据下载导入、赛题的理解分析详细说明:本节将会赛题的背景资料的了解以及数据文件的分布以及数据的下载以及本地导入,赛题的理解分析通过对构建自己对构建特征来说有一个比较大的作用,针对于数据的解读来说比较重要的一环。数据的解读包括数据的EDA、数据的可视化,数据的类型、数据的文件分布、数据的特征组合的一些猜测都在这里面会涉及到。一、赛题的数据数据的文件以及数据的...原创 2019-08-20 17:22:22 · 466 阅读 · 0 评论 -
深度之眼比赛实战训练营第02次答疑直播
1、集成的问题2、lightgbm为什么很低LightGBM使用有要求,基于梯度树,适用于特征少数据量大。3、get_dummies和LabelEncoder的问题(1)get_dummies可能会造成维度灾难;(2)LabelEncoder减小维度。4、相关性问题(1)对于feature_importance进行特征选择的时候我们一般选择特征为正相关的;(2)对于高相...原创 2019-08-20 17:21:31 · 406 阅读 · 0 评论 -
Conda命令总结
Anaconda下conda命令总结一、安装Anaconda进入Anaconda官网下载页面下载安装对应平台的Anaconda,推荐Python3.7版本。具体细节参见我的另一篇博文二、conda命令的使用1、查看环境中安装的包conda list # 查看当前环境所安装的所有包pip list # 查看当前环境所安装的所有包二者都可以查看当前环境中所安装的包,个人...原创 2019-08-11 10:20:15 · 805 阅读 · 1 评论 -
深度之眼比赛实战训练营第04次打卡
房价的数据预处理之探索性数据分析任务简介:数据的读取与显示、查看数据的缺失情况、查看数据的类型情况、查看特征之间的相关性。打卡详情:读取train.csv文件并且显示后五行,自行查阅pandas中的两种数据结构分别是什么?并做出总结(文字)。Pandas的可视化函数有哪些?(文字),person系数为什么可以用来衡量数据之间的相关性?(图文并茂的提交),如何利用pandas来显示数据信息...原创 2019-08-10 17:15:34 · 268 阅读 · 0 评论 -
深度之眼比赛实战训练营第03次打卡
比赛赛题的思路(波士顿房价预测)1、如何看赛题?Competition Description ==> 赛题描述Practice Skills ==> 练习的技能比如,房价是连续值,不能分类只能够回归。2、看赛题的什么内容?看数据集的描述,包括描述、特征3、看到数据之后才能做出判断把数据下载下来以及查看具体数据。4、思路分享5、读入CS...原创 2019-08-09 22:25:36 · 177 阅读 · 0 评论 -
深度之眼比赛实战训练营第07次打卡
模型的集成对成绩的提高任务简介:运用模型的集成知识对成绩提高到top20%作业(详解):截图排名top20%及以上,描述一下模型的叠加对结果的影响,还有哪些方法可以对成绩有所提高?之前的模型叠加的成绩不是很好,然后自己运用所学到的知识把排名提高到top10%,参考老师提供的代码方案,截图提交。一、集成学习介绍:基础集成技术1、最大投票(Max Voting)法2、平均(Aver...原创 2019-08-18 21:05:15 · 264 阅读 · 0 评论 -
深度之眼比赛实战训练营第05次打卡
构建基础baseline**任务名称:**构建baseline**任务简介:**完成一个基本的baseline提交到kaggle上然后有成绩详细说明:本节将会向大家介绍利用python数据清洗和数据预处理以及模型的构建,拟合数据,进行对test数据集进行预测,提交到成绩有排名。会先从理论讲起,再到实际的的一个操作。数据清洗和数据处理是比赛以及任何一种机器学习模型的必须要经过的过程,而且...原创 2019-08-13 19:52:27 · 440 阅读 · 0 评论 -
Anaconda和pip配置镜像源
Anaconda和pip配置镜像源一、配置conda镜像源在这里我们选择清华的Tuna镜像源,中科大源挂了(2019.9.8号左右)。打开cmd,输入指令:conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/conda config --add channels ht...原创 2019-09-11 16:38:35 · 12335 阅读 · 0 评论