android截取网页字符,Android富文本编辑器,webview中提取HTML代码,去标签获得纯文字...

本文介绍如何在WebView中从HTML内容中提取纯文字,以便计算输入文字的个数。首先,你需要获取HTML内容,然后使用正则表达式去除空格、HTML标签等杂质。通过replaceAll方法两次匹配并替换,最后计算words字符串的长度即为纯文字的个数。这个过程对于富文本编辑器中的内容统计非常有用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题:webview中html内容提取纯文字。

富文本编辑器中,要读取html内容,想要获得输入文字的个数,html中有各种标签,有图片,有视频音频等,怎么提取纯文字呢。如下图

46d595521c7a3d4088593b73d7aca085.png

方法

第一,获得html

html内容就要看你的代码了,获得它是第一位的了,就好像下图这样。

75f8c55624f3ebfae7a9bd71c1e931de.png

第二,去除杂质:空格,各种html标签,用正则方法解决。

下面的words就是获得的纯文字了。

String regFormat = "\\s*|\t|\r|\n";

String regTag = "]*>";

String words = html.replaceAll(regFormat,"").replaceAll(regTag,"");

第三,length()获得纯文字长度

int wordNumber = words.length();

Log.d(TAG, " words 内容长度是-----》 " + wordNumber + " words 输入内容是-----》 " + words);

String length = wordNumber+"";

mWordsNumber.setText(length);

注意setText(length)中的length是string类型,上面wordNumber是int类型,int转string直接加一个空字符串就OK了,我还犯了这个错误。

既然看到这里了,就来个

赞 吧!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值