PDF 转 Excel(XLSX):怎么不让表格变一团乱

先搞清楚:你的 PDF 里的表格是真实文字,还是扫描图片?
这个问题直接决定转出来的效果,但几乎所有教程都跳过了它。打开 PDF,用鼠标拖选一个单元格里的数字。如果光标能划过文字并高亮显示,说明这是文字型 PDF。如果光标在整页上拉出一个蓝色矩形,就像框选一张图片一样,那就是扫描图片型 PDF。
文字型 PDF 转出来通常很干净,列的对齐、行数、小数点基本都能保留。扫描型 PDF 则要先经过 OCR(光学字符识别)才能提取表格,而 OCR 的精度会受扫描歪斜、分辨率低、色带褪色等因素拖累。期望值要放合理:一份清晰的 300 dpi 双列简单表格扫描件,转出来接近完美;一份歪七扭八的 40 列财务报表复印件,不管用哪个工具,都免不了手动收拾。
用 Filuni 把 PDF 转成 Excel 的完整流程
Filuni 的PDF 转 Excel 工具支持文字型和扫描型两种 PDF,不需要注册账号,每次会话没有上传数量限制,导出文件也不带水印。具体步骤如下:
- 打开工具。 进入 PDF 转 Excel 页面,中间有一个上传区。
- 上传文件。 把 PDF 拖进去,或者点击上传区手动选文件。文件通过 HTTPS 传输,处理完成后服务器会自动删除,不做任何保存。
- 等待转换。 一份普通的 5 页 PDF 含两三张表,10 秒以内就能完成。50 页的扫描件走 OCR 可能需要 30 到 60 秒,取决于分辨率。
- 下载 XLSX。 点下载按钮,用 Excel、Google Sheets 或 LibreOffice Calc 打开都行。
流程就这些,中间不会弹出任何付费墙。
怎么防止列和行转完就塌
哪怕是文字型 PDF,如果原始布局有合并单元格、多行表头或者嵌在表格里的脚注,转出来的电子表格也可能乱得让人头疼。打开 XLSX 之后,先检查这几个地方:
- 顶部的合并单元格。 转换工具处理跨列表头时,有时会把一个合并格拆成多个独立格,有时又反过来把本该分开的列合并在一起。先看第 1 行和第 2 行。
- 数字被识别成文本。 如果 Excel 在数字格的左上角显示绿色三角,说明这格是文本格式。选中整列,用数据 > 分列(固定宽度),或者在旁边一列乘以 1 再粘贴为数值的方式修正。修好之后再跑 SUM 或 AVERAGE,否则计算结果会是 0。
- 货币符号粘在数字上。 像「$4,320.00」这样的值直接做加法会出错,用查找替换(Ctrl+H)把整列的货币符号清掉。
- 跨页断行。 PDF 有时会在一行数据中间换页,导致转出来出现只有一两个格有内容的残行。在每 50 到 60 行数据附近仔细找一找,发现了就手动把断掉的两行合并。
如果做了这些检查表格还是没法用,试试只上传包含目标表格的几页,而不是整份文档。大多数转换工具——包括 Filuni——处理 2 页的片段比处理 200 页文件中埋在第 147 页的表格效果要好得多。
其他可以备用的工具
Adobe Acrobat Pro 处理复杂多表 PDF 的效果最好,但要收费。Microsoft Word 可以直接打开 PDF 并转成可编辑格式——如果你需要先把 PDF 转成 Word 再把表格复制到 Excel,这个路子可以试试。Google Drive 用 Google Docs 打开 PDF 时会自动对其进行 OCR,对扫描件有时比专门工具更好使。Tabula 是一款专为从文字型 PDF 提取表格而生的免费桌面软件。但论零门槛、免账号、免费用这几点,这些工具都比不上 Filuni。
常见问题
转出来的 Excel 里所有数据都挤在一列,没有分开,怎么办?
这通常是因为原 PDF 用空格对齐列而不是制表符,转换器把整行当成一个字符串处理了。在 Excel 里选中 A 列,点数据 > 分列,选固定宽度,然后手动拖动分隔线对准数据边界。两分钟搞定,90% 的情况都能解决。
我的 PDF 是扫描的发票,OCR 能把表格识别准确吗?
取决于扫描质量。清晰、水平、200 dpi 以上的简单发票扫描件转换效果通常不错。如果扫描有轻微旋转,或者原件是复写纸,预计要手动改几个值。涉及关键财务数据时,不管转换结果看起来多整齐,都建议对照原件核对两三行再放心用。
一次可以转多少页?
Filuni 没有公开页数上限,每次会话也没有文件数量限制。页数非常多的文件(尤其是扫描件)自然需要更长时间。如果你有一份 300 页的报告却只需要其中三张表,建议先把 PDF 裁剪到对应页,转换会更快,结果也更干净。
上传带有保密信息的 PDF 安全吗?
Filuni 在转换完成后会从服务器删除上传的文件,不做存储、索引或分享。对于极度敏感的文件(法律文书、病历等),最保险的选择始终是本地桌面工具。对于日常业务数据,比如销售报表或库存表,Filuni 采用的服务端处理方式是在线文件工具中的通行做法。
试试 Filuni 的免费工具
本文提到的工具,加上 120+ 款其他工具。免费、无需注册、浏览器直接用。