Html Editor -- 去掉Word中多余的字符

本文介绍了一种用于清除从Word复制到HtmlEditor时产生的冗余代码的方法,通过使用特定的JavaScript函数,可以在保留大部分格式的同时减少冗余代码,有助于解决因冗余代码导致的文章字数超出限制的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在使用Html Editor时,有一个常用的操作,就是将Word中编辑好的内容直接复制到Html Editor中来,但这样会产生很多冗余的代码,而很多网站的Html编辑器都有字数限制, 冗余代码造成发布的文章字数超过限制。使用以下函数,可以去除冗余代码,并且尽可能的保留格式(字体信息会丢失)

function MSWordClean() {
 var text = document.getElementById('oDiv').innerHTML;
 
 text=text.replace(/<//?SPAN[^>]*>/gi,"");
 text=text.replace(/<(/w[^>]*) class=([^ |>]*)([^>]*)/gi,"<$1$3");
 text=text.replace(/<(/w[^>]*) style="([^"]*)"([^>]*)/gi,"<$1$3");
 text=text.replace(/<(/w[^>]*) lang=([^ |>]*)([^>]*)/gi,"<$1$3");
 text=text.replace(/<//?/?xml[^>]*>/gi,"");
 text=text.replace(/<//?/w+:[^>]*>/gi,"");
 text=text.replace(/<span[^>]*><//span[^>]*>/ig,"");
 text=text.replace(/<span[^>]*><//span[^>]*>/ig,"");
 text=text.replace(/<span><span>/ig,"<span>");
 text=text.replace(/&nbsp;/," ");
 var tmp = new RegExp("(<P)([^>]*>.*?)(<//P>)","gi");
 text=text.replace(tmp,"<div$2</div>");
 
 document.getElementById('oDiv').innerHTML = text;
}

下面是效果,可以粘一段Word文档去试试


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值