
深度学习
文章平均质量分 76
qq_42839893
这个作者很懒,什么都没留下…
展开
-
特征工程6大方法
1) Add interaction featuresHere you’ll add interaction features for each pair of categorical features (ip, app, device, os, channel). The easiest way to iterate through the pairs of features is with itertools.combinations. For each new column, join the va原创 2021-01-15 00:08:56 · 164 阅读 · 0 评论 -
kaggle_courses_geospatial-analysis(1)
geospatial-analysisIntroduction读入数据绘制地图!!!得到所有国家的地图边界数据!!!画出我中华人民共和国的地图画出Kiva慈善组织的在全世界范围内的行善地点IntroductionIn this micro-course, you’ll learn about different methods to wrangle and visualize geospatial data, or data with a geographic location.Along th原创 2021-01-14 17:10:42 · 120 阅读 · 0 评论 -
kaggle_course_overfitting & early-stopping
Early stoppingoverfitting & early-stoppingIntroductionInterpreting the Learning CurvesCapacityEarly Stoppingone example !!!1.数据预处理2.搭建网络与进行编译3.模型训练与可视化loss曲线图overfitting & early-stoppingIntroductionRecall from the example in the previous lesson原创 2021-01-12 16:38:05 · 538 阅读 · 0 评论 -
kaggle course for feature_Engineering_Skill 1 Categorical Encodings
Skill 1 Categorical Encodings预先的操作使用LGB进行预测以ROC来进行模型的评价1) Construct features from timestamps2) Label Encoding(preprocessing.LabelEncoder()函数,直接用数字不同代表不同)3.Create train/validation/test splitsSkill 1 Categorical Encodingsway 1 count encodingCount Encodingw原创 2021-01-12 12:55:39 · 139 阅读 · 0 评论 -
kaggle_course(Parsing Dates)
change the string to datatime64标准形式landslides[‘date_parsed’] = pd.to_datetime(landslides[‘date’], format="%m/%d/%y")pd.to_datetime(landslides[‘date’], infer_datetime_format=True)有的时候比较智能,能自动识别格式然而,也可能犯错的.dt.day 可以将day提取出来np.where函数用来找东西...原创 2021-01-07 17:08:37 · 101 阅读 · 0 评论 -
How to handle the missing value && scale and normalization
How to handle the missing value && scale and normalizationHow to handle the missing value.dropna函数按照行进行丢弃(axis = 0).dropna函数按照列进行丢弃(axis = 1).fillna(0)将缺失值直接填充为0.fillna(method='bfill', axis=0):将下一行的缺失数据直接填充为上一行的数据scale and normalizationscaling you原创 2021-01-07 16:25:12 · 301 阅读 · 0 评论 -
# 数据可视化基础(Matplotlib)
import matplotlib.pyplot as plt%matplotlib inline解决中文的显示问题(但是不知道为什么对我的 linux系统不起作用)import matplotlib.pyplot as pltplt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 用来正常显示中文的标签plt.rcParams[‘axes.unicode_minus’] = False折线图x = [1,2,3]y= [2,4,6]#linewid原创 2021-01-03 13:24:37 · 196 阅读 · 0 评论 -
# 正则表达式梳理
正则表达式"."能匹配除了换行符(\n)之外的任意字符,“*”表示0个或者多个表达式贪婪匹配 ".*" ‘可能会匹配到过多的内容’非贪婪匹配 ".*?"不过我们在实战中基本上用的还是非贪婪匹配example 1example 2 推荐.*?的用法strip的用法sub的用法以某一个为axis进行绘制折线图柱状图热力图绘制散点图sns.scatterplot()with the regression line用颜色区分两类要是我们准备用颜色来区分,那么就不能用这个regplot这个函数,而应该用lmp原创 2020-12-29 20:57:51 · 426 阅读 · 0 评论 -
kaggle course --NLP
kaggle course --NLPhttps://spacy.io/usage原创 2020-12-29 11:43:51 · 180 阅读 · 0 评论 -
## kaggle course!!! (以后再来编辑吧)
#https://www.kaggle.com/player8844/working-with-external-libraries/editkaggle course!!!python 基本库 和 pandas 基本库kaggle course is a wonderful place to build up our fundamental ability !numpy.random.randint(low = 1,high =5 ,size = 10) # 从1-5(不包括5,随机生成10个)原创 2020-12-27 19:30:46 · 192 阅读 · 0 评论 -
Colab使用指南(包括基础操作以及如何从kaggle上直接下载赛题数据)
谷歌的colab可以使用GPU,且一次免费时长可以达到12个小时,对于没有设备但是想要尝试深度学习的朋友们是一个不错的选择。https://colab.research.google.com/notebooks/intro.ipynbcolab连接GPU再去点击右边的connect,然后就会变成这样子的啦:连接成功:挂载谷歌的云端硬盘:from google.colab import drivedrive.mount(’/content/gdrive’)点击网页然后一直点击确定原创 2020-08-16 16:09:43 · 1784 阅读 · 1 评论 -
预测分析·员工满意度预测(传统回归机器学习方法梭哈!)
(本文将以预测员工满意度为背景,使用MSE为衡量标准,尝试各种非集成或者集成的模型,包括:线性回归,KNN,SVM,回归树,随机森林,AdaBoost,GBRT,Xgboost)最近玩了一下这个新手赛,顺便总结一下学过的传统机器学习方法(回归)赛题具体如下链接: link.赛题&数据赛题员工满意度又称雇员满意度,是团队精神的一种参考,也就是个体对他所从事的工作的一般态度。是组织成员对其工作特征的认知评价,是员工通过比较实际获得的价值与期望获得的价值之间的差距后,对工作各方面满足与否的态度原创 2020-07-26 14:05:08 · 3547 阅读 · 0 评论 -
华为云上anaconda环境布置及Jupyter外网连接
本文介绍如何在华为云上进行anaconda的环境布置及Jupyter外网连接,其他平台同理。一、华为云上anaconda环境布置wget https://link.zhihu.com/?target=https%3A//repo.continuum.io/archive/Anaconda3-2020.02-Linux-x86_64.sh).sh Anaconda3-2020.02-Linux-x86_64.sh3.Next Just ALL YES4.那么我们手动设置环境变量接下来设置ec原创 2020-07-26 13:46:40 · 1114 阅读 · 4 评论