- 博客(4)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 备注
1.win下换行\r\n 2.批处理,在每个命令前添加“call”,可以使得命令能依次执行下去 3.utf-8中文范围[\u4e00-\u9fff]
2013-05-13 20:41:03
331
原创 pthon 爬虫
爬虫是在师兄写的基础上改的,师兄的原本代码是爬取所有股票的所有新闻,我修改了下,爬取指定日期的新闻: # -*- coding: UTF-8 -*- import time,urllib2,urllib,StringIO,sys,os,multiprocessing,sqlite3 from datetime import datetime def utf8(i):
2013-03-21 17:17:05
877
原创 win7下用U盘安装unbutu备忘录
最近在用python,由于已有的网络爬虫代码字符编码的问题,于是需要安装linux系统 安装的版本是ubuntu 12.04.1 1. 用ultraiso把系统刻录进U盘,方法参考网络,在“便捷启动”那边选到syslinux 2.安装easybcd 3.我的笔记本是三星的,是每次都要重新设置bios启动顺序 4.开机按“esc”进入启动设备选择 5.“F2”进入bios设置 6.引导
2013-03-18 17:51:56
566
转载 分布式数据库 HBase
转载自:http://www.oschina.net/p/hbase HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Had
2012-11-04 09:41:40
216
ubuntu上python无法爬取网页
2013-08-01
TA创建的收藏夹 TA关注的收藏夹
TA关注的人