
正则表达式
文章平均质量分 59
wa2003
这个作者很懒,什么都没留下…
展开
-
用R语言的RCurl和正则表达式爬团购网的旅游团购数据
用R里的包Rcurl,代码如下 url='http://beijing.lashou.com/travel/menpiao' # web=readLines(url,encoding='UTF-8'); #逐行读取网页源文件 head(web,10); goods_name head(goods_name,1) [1] "【马驹桥】皕富园农场" goods_name",go原创 2015-04-28 21:53:05 · 1215 阅读 · 0 评论 -
leafletR的几个注意
1、toGeoJSON挑字符格式 乱码一定要清除掉,否则出差,尤其是互联网爬的数据,要用正则去处理。常用的清理方法如下: hp.df$loupanmingcheng<-gsub("[^a-zA-Z0-9\u4e00-\u9fa5]","",hp.df$loupanmingcheng); #替换乱码; # [\u4e00-\u9fa5] 匹配汉字-汉字的正则表达式; [\a-zA-Z0原创 2015-06-23 11:11:03 · 1603 阅读 · 0 评论