- 博客(9)
- 收藏
- 关注
原创 tensorflow安装教程
修改源镜像conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config --set show_...
2019-01-26 14:56:48
182
原创 linux常用shell命令汇总
补数据startDate=20180901endDate=20181021startSec=`date -d "$startDate" "+%s"`endSec=`date -d "$endDate" "+%s"`for((i=$startSec;i<=$endSec;i+=86400))dodtb=`date -d "@$i" "+%Y-%m-%d"`hiv
2018-11-15 10:52:08
241
原创 SparkSQL使用
一、默认配置Spark_HOME:进入目录/soft/client/spark-2.1.1-bin-2.6.0/conf文件夹,文件如下:spark-defaults.conf //设置spark maeter地址、每个executor进程的内存、占用核数等spark-env.sh //spark相关的各种环境变量log4j.properties.template //设...
2018-10-16 17:29:35
467
1
原创 Python建模常用代码
整理记录,不定期更新评测指标from scipy.stats import ks_2sampks_value = lambda y_pred,y_true: ks_2samp(y_pred[y_true==1], y_pred[y_true!=1]).statisticfrom sklearn import metricsprint 'AUC: %.4f' % metrics.r...
2018-07-10 14:29:55
2149
原创 Hive使用技巧总结
1.在Hive中可以使用正则表达式set hive.support.quoted.identifiers=None; select a.pin, `(pin)?+.+` from Table2.输出表数据时,显示列名set hive.cli.print.header=true;
2018-07-04 18:13:44
1929
转载 使用随机森林做特征选择
使用随机森林训练模型from sklearn.ensemble import RandomForestClassifierfeat_lables = trainx.columnsforest = RandomForestClassifier(n_estimators=10000, random_state=0,n_jobs=1)forest.fit(trainx, trainy)imp...
2018-07-04 17:48:12
9774
2
原创 宝洁八大问
STAR原则,即Situation(情景)、Task(任务)、Action(行动)和Result(结果)一、请你举一个具体的例子,说明你给自己确定了一个很高的目标,然后达到这个目标。目标+执行力二、请举例说明你在一项团队活动中如何团结他人,并且起到领导者的作用,并带领团队最终获得所希望的结果。领导力三、请你描述一种情形,在这种情形中你必须去寻找相关的信息
2017-04-22 00:00:09
3557
原创 统计概念总结
一、p值P值指的是在一个特定的统计模型H_0下,随机变量的某个统计量T等于数据观测值t或比观测值更为极端的概率。样本数据决定。准则1:P值可以表达的是数据与原假设的不匹配程度。P值越小越不匹配。准则2:P值并不能衡量原假设为真的概率。只解释数据与假设之间的关系,不解释假设本身。准则3:科学结论、商业决策或政策制定不应该仅依赖于P值是否超过一个给定的阈值。这一条给出了
2017-04-21 23:56:24
759
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人