
R
写代码的阿呆
每天保持进步就是最大的进步!
展开
-
R | 常用函数-1
目录1 读入数据1.1 csv格式1.2 xlsx格式1.3 txt文件2 好用的函数2.1 revalue函数2.2 rep函数2.3 ifelse函数2.4 mode函数2.5 &nbs...原创 2019-03-26 00:15:37 · 1474 阅读 · 0 评论 -
机器学习 | 变量选择
变量选择方法1 背景2 变量选择方法有哪些?3 什么叫向前/向后选择以及逐步回归、最优子集?AIC/BIC又是怎么定义的?3.1 四种统计上变量选择的方法3.2 什么是AIC/BIC3.2.1 AIC3.2.2 BIC4 如何实现5 参考1 背景为什么要聊一聊机器学习中的变量选择问题呢?因为这个问题在机器学习中相当重要,并且也是面试必问题之一,刚好前几天面试还被问到了变量选择中一个很细节的知识...原创 2019-04-14 01:38:16 · 11735 阅读 · 0 评论 -
R | 使用ggplot绘制对比箱线图
绘制对比箱线图1 单独测试2 封装成函数3 总结1 单独测试library(ggplot2)p<-ggplot(data=df_plot, aes(x=label,y=score))+ geom_boxplot(aes(fill=label))+ theme(legend.position = 'none', title = element_text(family = 'STK...原创 2019-04-22 21:26:18 · 8129 阅读 · 0 评论 -
机器学习 | 从文本分析看《解忧杂货店》
从文本分析看《解忧杂货店》1 讲故事版本2 PPT版本3 写在最后之前参加狗熊会人才计划的毕业作品,和大家分享一下,分为故事版本和PPT版本。1 讲故事版本https://mp.weixin.qq.com/s/0GTMi_AvfVzUXEpcvIGmZghttps://mp.weixin.qq.com/s/w7ZRoNrndjaRYL8pMie6Mw2 PPT版本...原创 2019-04-19 18:56:54 · 617 阅读 · 1 评论 -
机器学习 | 斗鱼直播热度影响因素分析
斗鱼直播热度影响因素分析1 报告来源2 思路3 PPT分享1 报告来源上学期导师课《商务大数据分析》团队一起完成的数据分析报告,PPT和大家分享一下。2 思路完成作品“斗鱼直播热度影响因素分析”。背景介绍。从直播市场→直播平台→斗鱼平台盈利模式→斗鱼主播热度变量说明。因变量为对数直播热度,自变量包括基本信息等4个维度共18个变量。上述变量均通过Python爬虫进行获取描述性分析。从...原创 2019-04-20 13:28:07 · 3281 阅读 · 3 评论 -
R语言 | 最近用到的函数
最近用R语言干了下面的事情1 如何取消科学计数法?2 ggplot绘图如何填充箱子颜色?3 如何算两个向量的差集?4 如何用rmd直接输出word5 自定义了一些常用的函数待补充1 如何取消科学计数法?options(scipen = 200) # scipen 表示在200个数字以内都不使用科学计数法2 ggplot绘图如何填充箱子颜色?参考 https://mp.weixin.qq...原创 2019-05-12 23:29:56 · 1535 阅读 · 0 评论 -
R语言 | 记一次用R语言进行数据分析的经历
利用R语言进行数据分析1 前言2 问题及解决思路和代码2.1 问题1:逻辑判断生成新变量2.1.1 问题描述2.1.2 规则2.1.3 对应的R语言基础2.1.4 伪代码2.1.5 真正的实现2.1.6 分组计算得结果2.2 问题2:正则提取特征+绘制对比箱线图2.2.1 问题描述参考1 前言最近无论是实习还是做项目,更多的都是使用Python来做一些分析,建模的工作,最近刚好用到R语言来解决...原创 2019-07-24 00:46:38 · 5709 阅读 · 1 评论 -
R | 常用函数-2
常用R函数-21 前言2 常用函数2.1 看变量的类型 mode2.2 dataframe根据某一列进行降序/升序排列 order2.3 字符串拼接 paste2.4 判断向量中是否存在一个元素 %in%2.5 缺失值相关函数2.6 判断两列是否完全一样——identical2.7 取消科学计数法,用原始数据的方式——options2.8 删空格-某列字符删去多余的空格-str_trim2.9 查...原创 2019-07-24 02:29:44 · 468 阅读 · 0 评论