python处理html字符实体& # 34 或& quot 格式

在 HTML 中 <>& 等字符有特殊含义(<,> 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用  HTML 源代码中使用字符实体。如需显示小于号,我们必须这样写:&lt; 或 &#60。(字符实体名称是 &lt;,实体编号&#60;)。浏览器渲染 HTML 页面时,会自动把字符实体串换成真实字符。

字符实体类似这样:

&entity_name;

或者

&#entity_number;

字符实体由三部分组成:

第一部分是一个 & 符号,第二部分是实体(Entity)名字,第三部分是一个分号。 比如,要显示小于号(<),就可以写&lt; 。

注意:实体名称对大小写敏感!使用实体名而不是数字的好处是,名称易于记忆。不过坏处是,浏览器也许并不支持所有实体名称(对实体数字的支持却很好)。

例如我们在html页面配置:

{
"xxId":"pingyi.huang"
}

前端直接传给后端,后端拿到的数据就是:

{
  &#34;xxId&#34;: &#34;pingyi.huang&#34;
}

Python可以通过html.unescape 反转义字符实体,将它转成真实数据

import html

data = '&#34;xxId&#34;: &#34;pingyi.huang&#34';
data = html.unescape(data)
print(data)

转义后数据

{
  "xxId": "pingyi.huang"
}

 Html 中常用的字符

&amp;&lt;&gt;&quot;&qpos;&copy;&reg;&trade;
&#38;&#60;&#62;&#34;&#39;&#169;&#174;&#8482;
&<>"'©®
 
### 处理代码中双引号被转义为 `&amp;quot;` 在不同编程语言环境中,处理HTML实体`&amp;quot;`的方式有所不同。以下是几种常见编程语言的具体实现方法。 #### JavaScript 中的解决方案 对于JavaScript而言,可以利用正则表达式来匹配并替换所有的`&amp;quot;`实例: ```javascript var yc = &quot;example with &amp;quot;text&amp;quot;&quot;; yc = yc.replace(/&amp;quot;/g, &#39;&quot;&#39;); console.log(yc); // 输出: example with &quot;text&quot; ``` 此段脚本通过全局模式 `/&amp;quot;/g` 查找字符串内所有出现的位置,并将其替换成标准的双引号[^1]。 #### PHP 中的解决方案 当面对PHP环境下的JSON数据序列化问题时,可以直接采用内置函数`str_replace()`来进行批量替换操作: ```php &lt;?php $data[&quot;chosed_list&quot;] = &#39;[{&quot;name&quot;:&quot;mary&quot;,&quot;weight&quot;:&quot;75kg&quot;}]&#39;; // 原始数据显示可能存在问题 echo htmlspecialchars($data[&quot;chosed_list&quot;]); // 解决方案:使用 str_replace 函数转换特殊字符 $data[&quot;chosed_list&quot;] = str_replace(&#39;&amp;quot;&#39;, &#39;&quot;&#39;, $data[&quot;chosed_list&quot;]); ?&gt; ``` 上述代码片段展示了如何先展示原始含有错误编码的数据,再通过调用`str_replace()`完成修复工作[^2]。 #### Python 中的解决方案 Python提供了多种方式解码HTML实体,在这里推荐使用第三方库如htmlBeautifulSoup: ```python import html encoded_string = &#39;example with &amp;quot;text&amp;quot;&#39; decoded_string = html.unescape(encoded_string) print(decoded_string) # 输出: example with &quot;text&quot; ``` 这段Python代码借助于`html.unescape()`方法轻松实现了对HTML实体的有效解析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值