python
大师兄你家猴跑啦
主要Java 、spark 、大数据技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 爬虫APP URL
1、安装环境 python 2.7 2、安装scrapy Pip2.7 install scrapy; 如果不是这么安装,则windows下scrapy命令用不了;先pip2.7 uninstall scrapy再install;3、输入scrapy 有命令提示则安装正确;4、Windows 下进入爬虫项目里,cd D:\PythonWorkspace\spider; 执行命令...原创 2017-12-25 16:36:50 · 2059 阅读 · 0 评论 -
Mac pycharm 导入pyspark
转载于:点击打开链接1 前提:已经安装了pycharm,下载了spark(官网下载,我下的是spark-2.1.1-bin-hadoop2.7.tgz,解压缩后为文件夹spark-2.1.1-bin-hadoop2.7,我将文件放在了/Applications/spark/下,这个文件夹里面有python文件,python文件下还有两个压缩包py4j-some-version.zip和pyspar...转载 2018-03-22 00:00:58 · 1956 阅读 · 0 评论 -
UnknownHostException :logSave
1、提交程序报错;(1)利用crontab 设置定时任务,利用python 脚本提交spark程序时,报UnknownHostException :logSave 错,具体错误如下:Exception in thread "main" java.lang.IllegalArgumentException: java.net.UnknownHostException: logSave ...原创 2018-04-24 14:01:54 · 1889 阅读 · 0 评论 -
特征选择和特征理解
特征选择和特征理解特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自己最熟...转载 2018-07-04 14:48:27 · 570 阅读 · 0 评论
分享