背景介绍
在Web应用开发中,我们经常需要获取上传PDF文件的页数信息。虽然可以使用pdf.js等第三方库,但这些库通常比较重量级。本文将介绍一种使用正则表达式直接解析PDF文件内容来获取页数的轻量级方案。
实现原理
PDF文件虽然是二进制格式,但其内部结构是基于文本的。PDF文件中通常包含类似 /N 10 或 /Count 10 这样的标记来记录总页数。我们可以通过正则表达式来匹配这些标记并提取页数信息。
代码实现
1. 基础函数结构
typescript
const getPdfPageCount = (file: File): Promise<number> => {
return new Promise((resolve, reject) => {
const reader = new FileReader();
reader.onload = (e) => {
// 解析逻辑
};
reader.onerror = () => reject(new Error("读取文件失败"));
reader.readAsText(file);
});
};
2. 页数提取逻辑
typescript
reader.onload = (e) => {
try {
const content = e.target?.result as string;

最低0.47元/天 解锁文章
9007

被折叠的 条评论
为什么被折叠?



