node.js抓url数据

本文介绍了一种利用Node.js中的http模块从指定URL获取页面内容的方法,并通过iconv-lite进行编码转换,最终将结果保存到本地文件中。此过程涉及网络请求、文件操作及字符编码转换等关键技术。
var http  = require('http');
var fs    = require('fs');
var iconv = require('iconv-lite');
var url   = require('url');

var html  = '';
var getURL= url.parse('http://xuezaijiongtu.blog.163.com');
var req   = http.get(getURL, function(res){
	res.setEncoding('binary');
	res.on('data', function(data){
		html += data;
	}).on('end', function(){
		var buf = new Buffer(html, 'binary');
        var str=iconv.decode(buf, 'GBK');//将GBK编码的字符转换成utf8的
		fs.open('test.txt', 'w', 0777, function(err, fd){
			if(err) throw err;
			fs.write(fd, str, 0, 'utf8', function(err){
				if(err) throw err;
				fs.closeSync(fd);
			})
		});
	})
}).on('error', function(err){
	console.log('http get error:', err);
});

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值