
代码
文章平均质量分 77
拦羊嗓子回牛声
一拂额前发,深藏功与名
展开
-
R语言-关键节点问题-方案二
紧接方案一由于方案一每次输出一个权重最高结点,然原始网络规模达100W,到假设一秒输出一个结点也约需要277小时,到中间阶段,有很多结点具有相同的权重。因此做性能优化,每次输出权重最大的全部结点,预计可以吧时间缩短在3小时以内。缺点是同属最大权重的结点间可能相关,导致结果不是特别精准,尤其随着权重变小,规模变大,尤其明显,所以设置当最大权重为5的时候停止输出。实现代码:libr原创 2017-06-30 10:41:56 · 1063 阅读 · 0 评论 -
R语言-向量机-员工离职预测训练赛
题目:员工离职预测训练赛网址:http://www.pkbigdata.com/common/cmpt/员工离职预测训练赛_竞赛信息.html要求:数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。数据分为训练数据和测试数据,分别保存在pfm_train.csv和pfm_test.csv两原创 2017-09-11 11:00:25 · 1336 阅读 · 0 评论 -
R语言-决策树-员工离职预测训练赛
题目:员工离职预测训练赛网址:http://www.pkbigdata.com/common/cmpt/员工离职预测训练赛_竞赛信息.html要求:数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。数据分为训练数据和测试数据,分别保存在pfm_train.csv和pfm_test.csv两原创 2017-09-11 10:50:00 · 2801 阅读 · 0 评论 -
R语言-关键节点问题-方案四-K-shell分解法
K-shell分解法,O(N) step 1 查找网络中所有度为1的节点,并将这些节点及连接的边去掉。 step 2 经过步骤1后,网络中可能会出现新的度为1的节点,循环执行步骤1,直至所剩的网络中没有度为1的节点为止。 step 3 去掉网络中剩余度为2的节点,一次类推,重复循环执行。 step 4 重复以上操作,直至网络中没有节点为原创 2017-07-10 11:00:11 · 3304 阅读 · 0 评论 -
R语言-关键节点问题-方案三
依旧是无向图关键节点问题,此方案使用一次性计算权重,排序输出,胜在运算快,避免循环。权重计算公式:节点权重=节点度+直接关联节点的度权重计算比较粗糙,仅为试水,并为后面的方案做铺垫。library(dplyr)library(RMySQL) # 载入RMySQL包conn <- dbConnect(MySQL(),dbname = "NE原创 2017-07-06 11:08:04 · 692 阅读 · 0 评论 -
R语言-时间序列-销量预测
数据源:day sales2015/1/1 1196132015/2/1 584812015/3/1 903502015/4/1 1519752015/5/1 2014642015/6/1 2180752015/7/1 2974482015/8/1 3330362015/9/1 5241852015/10/1 6744262015/11/1 6526502015/12/1原创 2017-07-04 11:41:03 · 6524 阅读 · 0 评论 -
R语言-股票数据库(4)-股票行业和概念板块数据-Wind
################################################################################################################## 行业数据 ###################################################################原创 2017-07-11 11:26:55 · 3540 阅读 · 0 评论 -
R语言-股票数据库(3)-股票日K线信息-前复权-Wind
前文股票历史交易数据是未复权的,在此使用WIND数据库获取复权后价格安装Rstudio: https://www.rstudio.com/products/rstudio/download/安装WIND客户端: WAPI.PE.exe用户名:略 密码:略WindR 读取数据通过下面7 个函数实现的。w.wsd 读取历史序列数据,包括日间的行情数据,基本面数据以及技术数据指标。原创 2017-07-11 11:22:16 · 2115 阅读 · 0 评论 -
R语言-股票数据库(2)-股票日K线信息-未复权
注:1、此方法获得的股票价格是实际价格,未进行前/后复权 2、只举例深市的获取方法,沪市的同理 3、步骤:先从网上爬取每个股票的交易历史,存为csv格式文件;读取csv文件数据加载至mysql数据库###################################################################################原创 2017-07-11 11:08:17 · 1137 阅读 · 0 评论 -
R语言-股票数据库(1)-股票上市日期
############################################################################################################################################获取股票上市日期##################################################原创 2017-07-11 10:57:24 · 1077 阅读 · 0 评论 -
R语言-关键节点问题-方案一
问题说明:社交网络以及其他各种各样的网络,在社会经济、自然科学等领域中发挥着越来越大的作用,而其中一个很核心的问题是了解一个节点在网络中发挥的作用。比如SARS的传播,可能香港一个超级传播者带来的影响比其他100甚至1000个人还多;一条谣言的传播,一个核心大号的转发可能带来巨大的影响。因此需要我们有一种能力,可以从生物的大规模基因调控网络中,找到导致疾病的重要基因;从大规模的社交网络中,找到原创 2017-06-28 16:37:07 · 1663 阅读 · 0 评论 -
R语言-逻辑回归+主成分分析-员工离职预测训练赛
题目:员工离职预测训练赛网址:http://www.pkbigdata.com/common/cmpt/员工离职预测训练赛_竞赛信息.html要求:数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。数据分为训练数据和测试数据,分别保存在pfm_train.csv和pfm_test.csv两原创 2017-09-11 11:10:59 · 7628 阅读 · 1 评论