go语言实现百度贴吧网页简单爬取

本文介绍了一种使用Go语言进行百度贴吧网页爬取的方法,通过简单的代码实现了对魔兽世界贴吧1-10页的爬取,并将数据保存为文本文件。代码中详细展示了如何设置URL、发送HTTP请求、读取响应内容及保存数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#go语言实现百度贴吧网页简单爬取

package main

import (
	"fmt"
	"io/ioutil"
	"net/http"
	"strconv"
)

//定义两个变量:url和文件地址
const(
	urlfile="https://tieba.baidu.com/f?kw=%E9%AD%94%E5%85%BD%E4%B8%96%E7%95%8C&ie=utf-8&pn="
	fileName = `H:\`
)
//爬取1-10页魔兽世界百度贴吧的网站信息 
func main() {
	startWork(1,10)
}

func startWork(start,end int){
	for i:=start;i<=end;i++{
		//1、明确url
		url:=urlfile+strconv.Itoa((i-1)*50)
		fmt.Println("开始爬取第",i,"页:",url)

		//2、获取服务器响应包数据
		resp,err:=http.Get(url)
		if err!=nil{
			fmt.Println("resp err:",err)
			continue
		}
		defer resp.Body.Close()

		//3、读取数据
		content,err:=ioutil.ReadAll(resp.Body)
		if err!=nil{
			fmt.Println("readAll err:",err)
			continue
		}

		//4、保存数据
		fileName2:=fileName+"魔兽世界"+strconv.Itoa(i)+".txt"
		ioutil.WriteFile(fileName2,content,0666)
		fmt.Println("成功打印了第",i,"页")
	}
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值