自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Chrome不自动保存密码,一旦重启浏览器就需要重新填写密码的问题

由于此前经常清理浏览器的缓存,在某一次清理缓存后,Chrome不再自动保存密码,一旦重启浏览器就需要重新填写密码的问题。网上搜了很久,倒是找到一条比较有用的信息,找到Chrome的配置文件,文件的路径为:C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default当然我们可以按照有些人建议的,删除整个Default文件夹,但是删除后,保存到书签、添加的扩展程序就都没了。因此,我的解决方法如下:1、关闭浏览器,将Def

2020-10-20 15:12:09 6930 5

原创 R中使用foreach时清理内存

R中使用foreach时清理内存foreach能较大的提高计算速度,但是R不会自动清理内存,导致内存经常容易负载过高,因此使用时需要注意及时清理内存,以如下例子所示。我需要读取一批excel文件,在运行下面的代码前,经过4次测试,Rstudio的内存情况是这样的(Mb):232, 237, 231.8, 230.2在执行下面的代码后qcc_result <- foreach(i=1:length(qcc_result_files), .combine=rbind) %dopar% {

2020-06-05 15:49:17 1968

原创 UniAccess Agent 的删除方法

偶尔一次惹上了这个流氓软件,进程无法直接停止,服务无法停止,注册表无法删除,安装目录被隐藏。UniAccess Agent是用来监视员工的, 是由LeagSoft开发的监控软件,使用360卸载时会提示需要输入管理员密码,使用360的进程管理器也看不到对应的进程。试了各种方法,最终试出了这个方法,mark一下:1. 使用Geek Uninstaller关闭对应的进程:UniAcces...

2019-10-24 16:28:40 27815 8

原创 R的批处理——调用Rscripts及传参

下面我通过不传参和传参的方式进行调用。 不传参的方式 首先,新建一个R脚本(E:\test.R),目的是往E盘写入一个文件。脚本内容如下:# test.R​data = data.frame(x=c(1,2,3), y=c(4,5,6))write.csv(data, "e:/test.csv", row.names = F)然后新建一个bat脚本,脚本调用方式为:Rscr...

2019-07-11 10:51:39 3472

原创 shiny包 学习(一)

shiny除了支持自带的标签,也可以像html一样编辑网页。如下代码所示:library(shiny)ui &amp;lt;- shinyUI(fluidPage( titlePanel(&quot;My Shiny App&quot;), sidebarLayout( sidebarPanel(), mainPanel( p(&quot;p create...

2019-03-07 16:16:46 1839

原创 使用分区处理MySQL的亿级数据

mysql在查询上千万级数据的时候,通过索引可以解决大部分查询优化问题。但是在处理上亿数据的时候,需要用到的东西就超出索引的范围了。数据表(日志)是这样的:表大小:1T,约24亿行;表分区:按时间分区,每个月为一个分区,一个分区约2-3亿行数据(40-70G左右)。操作日志含有json字段。经过与需求方讨论后,我们决定只取某一个月的数据作为样本,该样本的数据行数约3.5亿行。数据处...

2019-03-07 15:48:21 10901

原创 dplyr包官方文档翻译

dplyr包官方文档翻译1. 最基本的函数小结2. 分组(Grouped)操作Grouped 操作分组对动词的影响如下:3. select 操作4. Mutating 操作5. group_by()6. _at()7. 管道操作符8. data table总结dplyr包可以让以下操作步骤变得简单,如:它提供了一些操作类型的“动词”、函数,适用于大多数情况的数据操作,帮助你用代码实现你的想法。...

2019-02-24 22:50:45 778

原创 ggplot2画饼图的问题

某天突然遇到要用ggplot2画饼图,画的时候发现图形有问题。数据集是这样的:dt = data.frame(A = c(10, 4, 3, 2, 1), B = c('A','B','C','D','E'))效果是这样的:很明显,饼图的坐标和图形的方向是相反的,这是因为标签坐标计算反了方向。原来的生成图形代码如下:library(ggplot2)dt = data.f...

2018-08-29 20:49:44 4639

原创 处理更新R3.5.1时,Rstutio报错“libatk-1.0-0.dll”缺失的错误

提示Rterm运行失败,在R的bin目录下打开Rterm,结果发现Rterm是可以正常daka打开的。此时按错误提示安装"libatk-1.0-0.dll"即可,不过在网上搜到的方法有错误,所以稍微整理下。第一,下载这个dll文件,放到"C:\Windows\System32",(按照脚本之家上给的方法,说系统如果是64位就放在"C:\Windows\SysWOW64"这个目录下,不过...

2018-07-25 11:16:35 1250

原创 大宗交易数据挖掘(四)

数据分析维度初步整理好以后,可以尝试用R去做一些相关性分析,不过效果太差,因为实际情况中,线性回归的效果是很差的。

2018-03-03 18:41:04 990

原创 大宗交易数据挖掘(三)

计算维度数据集字段

2018-03-03 17:47:41 1116

原创 大宗交易数据挖掘(二)

获取数据上一篇的流程图中介绍了大致思路,实际实现的时候,数据需要分成2个部分,历史数据和每日更新的数据。其中每日更新的数据量较小,直接从第三方数据网站获取,单线程爬虫即可搞定;历史数据用来做模型训练,所涉及的体量较大。 本篇着重解决历史数据的问题:一、大宗交易的历史数据 这里通过多线程爬虫实现,具体思路如下: 以下为主入口代码,其他代码略微有些多,暂时不上传了: ...

2018-03-03 17:15:50 880

原创 大宗交易数据挖掘(一)

思路在网上可以看到很多关于股票的数据挖掘,其中也包括了一些大宗交易的数据挖掘和分析。本人之前也做过比较长时间的学习,所以出于好奇,尝试对这类数据进行挖掘:最开始的想法 来看下百度百科对于大宗交易的解释: 百度百科的大宗交易介绍总的来说,就是大宗交易在盘后完成,交易所公布交易双方的价格,数量和席位名称(如XX证券公司XX营业部)。 有一个说法:股东要减持的话,往往是需要大量的时间...

2018-03-03 16:10:10 1603

原创 R的Parallel包学习

R的并行计算一般简单的例子都可以在百度上找到了,稍微深入点的就要多尝试下了: 这里用a,b两个向量做测试,先定义两个向量,计算b向量是不是在a向量里,是的话就是1,否则就是0。主要是测试编写函数和传递参数。# 单线程a <- 1:5000b <- round(runif(50000, 100, 10000),0)func2 <- function(i){ num <- b[i]

2017-07-25 19:55:00 5169

原创 R语言中文分词Rwordseg的安装

R语言中文分词Rwordseg的安装装起来有点复杂。需要安装jdk,Rtools,rJava才能安装Rwordseg,具体步骤如下:第一步,安装jdk,过程略。第二步,安装Rtools:下载地址:https://cran.r-project.org/bin/windows/Rtools/ 说明:如果电脑使用的R版本是3.3.x,那么就下载Rtools33.exe,如果说你的R版本是3.2

2017-07-17 10:48:32 1400

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除