令人气恼的 preg_match bug

在处理大文本文件时,使用preg_match函数遇到了无法匹配大段内容的问题,疑似因内存限制导致。通过简化正则表达式及采用strpos+substr替代方案成功解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一个 157k 大小的txt文件,用 preg_match 匹配其中的一些内容,结果死活匹配不出内容来,检查来检查去,没有发现什么问题,为了检验是否跟平台有关系,在 windows 下php 5.2.11 和linux 空间的 5.2.17 都试了,还是不行。


还是怀疑匹配规则问题,最后建化成  preg_match_all("{<ul>(.*?)</ul>}is", $txt, $res)。 能提取到一个 <ul>  </ul> 之间的内容, 令一个提不出来,对比了一下, 第一个匹配的内容长度较小,几百字节;第二个要匹配的内容比较大,有 140k 多字节。


怀疑,肯定,以及非常肯定,preg_match 函数在分配数组大小的时候做了限定,超过一定大小就忽略, 或者他根本就是有bug,超过一定长度就出现错误了。


折腾浪费了很多时间,没力气研究php源码验证是否这个原因了,用 strpos+substr 解决了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值