获取富文本中的图片链接

最新推荐文章于 2024-02-28 19:58:28 发布

原创最新推荐文章于 2024-02-28 19:58:28 发布 · 4.3k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

java 专栏收录该内容

17 篇文章

订阅专栏

本文介绍了一种从富文本中提取图片地址的方法，并提供了一个具体的Java实现案例。该方法使用正则表达式来匹配和抓取HTML代码中的图片源。

有时候做轮播图的时候需要从富文本中获取到图片地址，代码如下所示

/**
     * 得到网页中图片的地址
     */
    public static String getImgStr(String htmlStr) {
        Set<String> pics = new HashSet<>();
        String img = "";
        Pattern p_image;
        Matcher m_image;
        //     String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
        String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
        p_image = Pattern.compile
                (regEx_img, Pattern.CASE_INSENSITIVE);
        m_image = p_image.matcher(htmlStr);
        while (m_image.find()) {
            // 得到<img />数据
            img = m_image.group();
            // 匹配<img>中的src数据
            Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
            while (m.find()) {
                pics.add(m.group(1));
            }
        }
        System.out.println(pics.size());
        return pics.size()>=1 ? pics.iterator().next():"";
    }