总共有接近2000w的词条,其中几百万的词条有摘要图片,一天接到运营反馈有些词条的摘要图显示内容为暂无图片,下面是一个case:
所以,咱们需要找出几百万词条的摘要图片中显示为“暂无图片”的词条,并进行处理。
具体思路如下
第一步:
从文件系统中获取词条的id和摘要图的url
第二步:
下载摘要图片到本地,并存储本地图片的名称和词条id的对应关系到文件,这里展示下下载并存储的核心方法
public static String saveUrlAs(String fileUrl, String savePath, String folder) {
DataInputStream in = null;
DataOutputStream out = null;
HttpURLConnection connection = null;
ByteArrayOutputStream outstream = null;
try {
URL url = new URL(fileUrl);
connection = (HttpURLConnection) url.openConnection();