转载请注明出处啊喂!
http://write.blog.youkuaiyun.com/postedit/38684445
续上文【用HTTP analyzer找出网页脚本不可见的信息】http://blog.youkuaiyun.com/jansii/article/details/38123071
将xls中的"https://hq.sinajs.cn/?_=0.8689907682128251&list=gb_msft"
复制到浏览器地址栏,enter发现是打不开的,果然加密了。
今天研究腾讯财经中的恒生指数http://stock.qq.com/hkHSI
发现脚本中有以下部分
点进去一看⊙﹏⊙赫然就是恒生实时数据,当天时间对应恒生指数以及交易量。
一看URL,并没有https?
现在数据都不怎么需要加密吗?
于是受到启发,把前面谷歌数据网址的s去掉,在浏览器上尝试,可以了……
用R抓抓看
没什么问题!终于拿下!再用字符串处理一下即可。
注意到后面是goog,那换成别的行吗?查一下微软的编号是MSFT
改成MSFT,跑跑看
不错,甚满意~~