
get小技巧
Watch_dou
一名算法工程师,欢迎交流,由于比较忙,来不及回复评论,有事可以私戳我
展开
-
时间序列预测中特征构建
传统统计学习方法: naive approach, moving average, Holt linear, exponential smoothing, ARIMA, and Prophet现代机器学习方法: 树模型等深度学习方法: LSTM、Seq2seq、Transform-XL等树模型需要人为构建特征,同时预测值不可超越区间内取值的上限。深度学习网络,可以发现输入数据之间的交互关系,同时可以发现趋势。根据数据可以尝试不同的方法,选择较优的方法。下面是树模型的构造特征的方法。1. 时间戳特原创 2020-07-30 21:35:49 · 6412 阅读 · 4 评论 -
关联规则数据构建
关联规则数据的构建是实施算法的前提,在查阅大量的资料之后,也没有找到能讲得清晰的数据构建过程,以下数据的构建是本人对于数据的构建,仅供参考。以下案例仅仅针对,类似“每一行代表一个用户购买一个商品”。> x <- data.frame(item=c('a','b','a','b','c'),user=c('1','1','2','2','2'))> x item u...原创 2018-05-16 23:52:43 · 1022 阅读 · 0 评论 -
R语言批量变量命名/结果命名问题解决
在程序设计时,经常遇到批量变量重命名的问题,或者需要把每个结果都保存,给每一次的结果命名,以便选择性查看结果。 思路: 批量命名,最能想到的就是字符串,然而字符串不可以作为变量名,如何? 下面就是利用assign(字符串,fun)来解决将运行结果放入字符串plotList <- list()name <- temp_prop$replace_itemclass_num &...原创 2018-05-17 08:34:27 · 12495 阅读 · 0 评论 -
python库安装出现Microsoft Visual C++ 14.0 required问题解决
出现上述错误,最简单的方法就是安装c++2015即可,然而网上乱七八糟的软件下载,下面提供百度云盘链接,直接下载安装即可用。 点击下载 安装到电脑即可。...原创 2018-05-16 21:12:48 · 6165 阅读 · 5 评论 -
python中因surprise库导致的MemoryError分析
在使用python的surprise库的KNN时,出现内存问题,之后发现是自己电脑内存太低,尤其是32位的电脑,系统内存是被分配好的,64位的好一些,删除了一些软件之后,内存还是不足,借用朋友的电脑,一切都ok了。因此,在服务器上或者内存足够的情况下,不用担心内存问题。...原创 2018-05-16 21:25:09 · 29483 阅读 · 5 评论 -
surprise安装问题解决
python库 Surprise是scikit系列中的一个推荐系统库,很多人已经熟悉scikit-learn和scikit-image,在下载的过程中出现的坑。pip install scikit-surprise如果安装按照上述方法,pip list 未发现该库,仔细看安装程序最后提示,出现”Microsoft Visual C++ 14.0 required”并附有相应的网址,然而直接...原创 2018-05-16 21:34:39 · 6261 阅读 · 0 评论 -
ggplot2画图坐标轴数字设置不显示科学计数法
有时候看着R坐标轴的数字挺刺眼的,科学计数法的表示形式真让人难过,解决方法也是很简单的,如下设置就ok了!options(scipen=200)原创 2018-05-16 21:54:34 · 17088 阅读 · 0 评论 -
Google Chrome下载地址
不用翻墙,几乎最新的谷歌浏览器下载地址原创 2018-07-05 16:24:26 · 1970 阅读 · 0 评论 -
FastStone Capture 8.5.0.0注册码
亲测,成功,拿走。企业版序列号: name:bluman serial/序列号/注册码:VPISCJULXUFGDDXYAUYF原创 2018-08-08 09:43:06 · 5471 阅读 · 7 评论 -
python库下载(包括一些pip安装不成功的库下载)
经常遇到一些python库pip不下来,手动安装pip稳妥些,下面是python库下载(包括一些pip安装不成功的库下载)点击下载原创 2018-08-22 09:18:28 · 3444 阅读 · 0 评论 -
python的CTypes模块调用C++程序的问题详细解决
gcc/g++问题在网上搜索了一些将c/c++转化为.so文件的gcc方法,但是尝试却失败,继续查找发现是c++代码要用g++ c++中自建.h文件的处理过了第一关,接下来等着的是.h文件的处理,cd /usr/include发现全是.h的文件,首先必须将bg.cc中的.h部分单独建立.h函数并添加到cd /usr/include下,然后,g++ for语句的变量定义问...原创 2018-09-09 18:45:09 · 1561 阅读 · 0 评论 -
python 正则表达式找出字符串中的纯数字
1、简单的做法>>> import re>>> re.findall(r'\d+', 'hello 42 I'm a 32 string 30')['42', '32', '30']然而,这种做法使得字符串中非纯数字也会识别>>> re.findall(r'\d+', "hello 42 I'm a 32 str12312ing 3...原创 2018-09-24 09:09:03 · 7674 阅读 · 0 评论 -
PPT炫酷英文字体设置之Centaur
国外一些魔幻电影中的海报经常会见到,指环王、霍比特人,充满科幻色彩,这就是Centaur 。自己设置如下效果,可添加其他设置。很多该字体的设置就不举例了。(本文用到的插图是插件iSlide中的,可以说非常好用。)未完待续 . . ....原创 2018-09-26 18:51:05 · 1048 阅读 · 0 评论 -
Xshell中鼠标选中内容自动换行或退出的彻底解决办法(不用退出其他软件)
之前一直用Xshell,后来装了很多软件,也修改了Xshell的一些设置,不知道到底是啥导致了Xshell中鼠标选中内容自动换行或退出的问题,一直没去解决,直到同事反馈了问题,搜索发现,是因为装载的其他软件主要是翻译类的软件,将其禁用或者彻底卸载即可 。然而,在这里,我并不想禁用我可爱的即时翻译软件QTranslate原创 2018-11-15 17:12:52 · 3991 阅读 · 0 评论 -
GitLab上Markdown页面内与页面间跳转详解
1、项目简介现在有一个项目,想在GitLab上记录一些重大事件,然而事件内容比较复杂,想通过截图的方式将其保存在项目下,然后,用Markdown记录所有事件,并将截图放到文字下,然而,有时候截图可能很长,就想通过相对路径的链接来达到跳转查看截图的效果。下面详细说一下。2、项目文件有一名叫douzi的项目,其下的文件以及文件夹如下:picture newsapp_ios 1.png ...原创 2019-03-22 19:52:27 · 5419 阅读 · 0 评论 -
R code execution error处理
R code execution error解决方法:Ctrl + Shift + F10 to restart your R session原创 2019-05-22 13:18:35 · 19335 阅读 · 10 评论 -
Rmarkdown的PDF文件插入本地图片
借助在其他端上的文件时不可以的,测试成功,在本地指定文件路径即可,如下:原创 2018-05-03 11:20:07 · 15358 阅读 · 3 评论 -
R语言gganimate动态可视化以及ImageMagick安装问题解决
gganimate安装gganimate是一款基于ggplot2的动态可视化扩展包,简单就是将ggplot2绘图对象转为gif动图的形式。devtools::install_github("dgrtwo/gganimate")library(gapminder)library(ggplot2)theme_set(theme_bw())g <- ggplot(gap...原创 2018-04-19 17:33:53 · 4873 阅读 · 2 评论 -
Xshell安装rz与sz命令
服务器安装rz与sz命令:yum install lrzsz从服务端发送文件到客户端: sz 文件名 从客户端上传文件到服务端: rz 文件名在弹出的框中选择上传文件下载文件的路径即可。sz:将选定的文件发送到本地机器 rz:弹出一个文件选择窗口,从本地选择文件上传到服务器...原创 2018-04-17 11:50:00 · 4430 阅读 · 0 评论 -
R语言筛选出不重复的行的几种方法
介绍五种筛选不重复行的数据原创 2017-07-22 19:13:52 · 15787 阅读 · 0 评论 -
R语言之三种左连接
数据处理中经常遇到表连接问题,本次介绍R语言中三种左连接方法,这三种是等价的,不过会有时间快慢问题,斟酌使用。法一:> data0 <- merge(a,c,all.x=TRUE,by='CELLPHONE')法二:> data1 <- sqldf('select a.*,b.* from a left join ...原创 2017-07-19 12:37:11 · 7505 阅读 · 0 评论 -
Anaconda3中出现sklearn.model_selection不存在问题
Anaconda3中from sklearn.model_selection import train_test_split出现importError: No module named ‘sklearn.model_selection’。 在电脑开始输入Anaconda,打开Anaconda Prompt输入:conda list 查阅sklearn版本信息,发现版本是0.17.1,此版本中是不包原创 2017-08-21 17:20:42 · 18658 阅读 · 1 评论 -
根据两个分类变量按某一数值型变量计算频率
根据一个变量按某一数值型变量计算频率或者占比也许很简单,呐SQL,两个呢,或许用SQL就开始大想特想,消耗脑细胞。 I’m coming! 数据描述:有三列数据,前两列是分类变量,第三列是数值型变量。 过程是这个样子的:1.将两个分类变量的取值分别作为二维列联表的行跟列,呀!列联表用上啦,没错xtabs()来啦;2.然后按照行或者列求比列就是了,没错,就是pro.table();3.是二维列表原创 2017-09-13 19:33:05 · 1582 阅读 · 0 评论 -
Cmder利器
目录 Cmder到底是什么? Cmder优点 Cmder常用快捷键 常见问题及解决方案 Chocolatey软件包管理系统 window下常用的开发环境应用 Cmder到底是什么?Cmder是一款Windows环境下非常简洁美观易用的cmd替代者,它是一个跨平台的命令行增强工具,可以集成windows batch, power shell, git, lin原创 2017-11-13 20:13:50 · 7623 阅读 · 0 评论 -
Anaconda官网下载慢之国内镜像下载
Anaconda官网下载实在太慢,选择清华镜像进行高速下载。原创 2018-01-22 17:43:06 · 1988 阅读 · 0 评论 -
深度学习框架比较
源自机器之心编译 原文链接:https://medium.com/@ricardo.guerrero/deep-learning-frameworks-a-review-before-finishing-2016-5b3ab4010b06#.z8zuthuwmTensorFlow链接:https://www.tensorflow.org/对于那些听说过深度学习但还没有太过专门深入转载 2018-01-31 16:41:12 · 2129 阅读 · 0 评论 -
一文了解 2018 年最值得关注的 12 大框架
【优快云编者按】如今的 IT 领域对开发者要求越来越高,对各种框架的掌握变得非常重要,掌握多种框架可以让开发者快速开发原型和实际项目。本文将列举 12 个适合移动开发者以及 Web 开发者的框架,并且分别介绍了这些框架的优点及应用。 以下为译文: 新年伊始,很多开发者便开始规划自己的本年度学习计划,如果你还没有决定好在 2018 年学什么,那么本文将给你一些指引。在这篇文章中,我将分享一转载 2018-01-31 17:49:57 · 690 阅读 · 0 评论 -
Gephi安装
1、去官网下个最新的idk 9.0.4 并安装 右转教程 2、官网下载Gephi0.9.2 3、找到gephi的安装路径,修改etc下的gephi.conf文件,将jdkhome的#号注释去掉,并设置jre的安装路径,jdkhome=”E:\Program Files\Java\jdk-9.0.2”(视情况而定)。原创 2018-01-26 10:12:41 · 11986 阅读 · 0 评论 -
vtt或srt字幕挂载
遇到vtt字幕与视频分离情况,如何在视频上加载字幕呢? 如若字幕格式是srt就省去了一转化的步骤。vtt格式必须转化为srt格式,如下: 1、用notebook++或其他编辑器打开,并将开头的WEBVTT字样去掉; 2、将其复制,放到一记事本中,名字保证和视频名字一致,文件后缀为srt,切记,一定还有中文的要保证,是unicode的!(记事本另存为时最下方设置unicode) 3、下载一个原创 2018-01-21 00:26:39 · 14030 阅读 · 0 评论 -
FastStone Capture——轻量级长截屏软件
超级轻量级的一款长截屏软件!非常好用! FastStone Capture 链接:https://pan.baidu.com/s/1o9ZZkuQ 密码:p18v 下载解压,点开红色的exe文件即可(中文版) 红色下的文件是英文版 点开后就是这样界面 具体功能鼠标放上去就知道用法 截完之后的界面保存即可 结果如下,清晰可见原创 2018-01-21 00:49:55 · 3715 阅读 · 0 评论 -
windows用户的一些特殊python库下载地址
点击下框中的字进入下载页面: Click进入windows用户的一些特殊python库下载界面原创 2018-02-10 22:13:19 · 530 阅读 · 0 评论 -
百度API之Python解析IP
百度高清ip解析的API已经不能申请,本次解析是通过普通的APIimport urllib.request import jsondef get_addr(ip,ak): try: url='https://api.map.baidu.com/location/ip?ip='+str(ip)+'&ak='+ak+'&coor=bd09ll' ...原创 2018-03-02 22:55:24 · 1239 阅读 · 2 评论 -
matplotlib中字体设置问题
在画hist图时直接windows本机的宋体指定路径 songTi = matplotlib.font_manager.FontProperties(fname=’C:\Windows\Fonts\simsun.ttc’) 传给相应的参数即可:songTi = matplotlib.font_manager.FontProperties(fname='C:\Windows\Fonts\si...原创 2018-03-03 14:55:32 · 20841 阅读 · 16 评论 -
Rmarkdown安装配置、输出PDF正文中文以及图片中文配置
如果想用R的markdown做HTML或者word,OK,直接安装Rmarkdown即可(在安装此包之前需要安装knitr包),也不用担心中文乱码的问题。 实际上用上面得到的HTML或者word转化为也OK,然而对于有完美主义者的人来说,绝不会这么做,因为这样得到的PDF太垃圾,图简直TMD太糟糕。 事实上,好的东东是要付出代价的。配置安装 R、Rstudio 、 pandoc(...原创 2018-04-14 22:58:20 · 25227 阅读 · 11 评论 -
R语言中两表连接且输出不重复数据
在做项目中遇到了如此问题,其中整理的结果表中没有会员ID信息,只有会员电话号码信息,且每一行为唯一一个会员。另外一张member表中包含会员ID以及会员电话信息,但是这张表有重复的会员信息,也就是说一个会员在member表中多次出现,memeber表比整理的表要大很多。说明:1.在项目过程中,数据量较大,用到的是data.table包,需要用到SQL中的语句减少代码量,因此需要sqldf包原创 2017-07-18 13:12:02 · 3113 阅读 · 0 评论