java小作业(十八)

1.利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到D:\\zp\\xieru.txt中

package com.sj.homework;

import java.io.File;
import java.io.IOException;

import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到E:\\zp\\xieru.txt中
 * @author 	ws
 * @time	8.15
 */
public class Test {
	public static void main(String[] args) throws IOException {
		String urlPath = "http://news.ifeng.com/a/20180815/59831553_0.shtml";//html路径
		Document document = Jsoup.connect(urlPath).post();//获取文档对象
		String yc_tit_txt = document.getElementsByTag("h1").text();//获取标题文本
		
		String yc_con_txt = document.getElementById("yc_con_txt").text();//获取内容文本
		
		String filePath = "E:/zp/xieru.txt";//存放文件路径
		String str = "标题:\n\t"+yc_tit_txt+"\n内容:\n\t"+yc_con_txt;//存放文件的内容
		File file = new File(filePath);//文件添加到内存
		FileUtils.write(file, str);//写入文件
		System.out.println("写入成功");//写入结果输出控制台
	}
}


2.利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上

package com.sj.homework;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.commons.io.FileUtils;

/**
 * @desc	利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上
 * @author 	ws
 * @time	8.15
 */
public class Test2 {
	public static void main(String[] args) throws IOException {
		String path = "E:/zp/xieru.txt";//文件路径
		File file = new File(path);//写入内存
		List<String> list = FileUtils.readLines(file, "UTF-8");//读取每行,存入list
		for (String every : list) {//foreach逐个输出在控制台
			System.out.println(every);
		}
	}
}


3.利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上

package com.sj.homework;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,
 * 			计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上
 * @author 	ws
 * @time	8.15
 */
public class Test3 {
	public static void main(String[] args) throws IOException {
		String url = "http://news.ifeng.com/a/20180814/59812253_0.shtml";//html路径
		Document element = Jsoup.connect(url).post();//获取文档
		String str = element.text();//获取字符串类型的文档
		int num = str.split("抖音").length-1;//分隔抖音字符,获取出现次数
		System.out.println("抖音出现的次数为:"+num);//结果输出在控制台
	}
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值