PDF를 Excel(XLSX)로 변환할 때 표가 무너지지 않게 하는 방법

먼저 확인할 것: PDF 표가 선택 가능한 텍스트인가, 스캔 이미지인가?
이 한 가지 질문이 변환 결과의 품질을 결정합니다. 대부분의 가이드는 이 부분을 그냥 넘어가는데, 사실 가장 중요합니다. PDF를 열고 셀 값을 드래그해 보세요. 커서가 텍스트 위를 자연스럽게 지나가며 선택된다면 텍스트 기반 PDF입니다. 반대로 커서가 페이지 전체를 파란 사각형으로 덮는다면 — 마치 사진을 선택하는 것처럼 — 스캔 이미지 PDF입니다.
텍스트 기반 PDF는 변환이 잘 됩니다. 열 구분, 행 수, 소수점까지 대부분 그대로 살아남습니다. 스캔 PDF는 표를 추출하기 전에 OCR(광학 문자 인식) 처리가 필요한데, 스캔이 기울어져 있거나 해상도가 낮거나 잉크가 번진 경우 OCR 정확도가 떨어집니다. 기대치를 미리 조정해 두는 게 좋습니다. 300 dpi로 반듯하게 스캔된 단순한 2열짜리 표라면 거의 완벽하게 나오지만, 40개 열이 빼곡한 재무 보고서를 구겨서 복사한 문서라면 어떤 도구를 써도 손으로 정리하는 작업이 남습니다.
Filuni로 PDF를 Excel로 변환하는 방법
Filuni의 PDF to Excel 변환 도구는 텍스트 기반 PDF와 스캔 PDF를 모두 처리합니다. 계정 가입 없이, 세션당 업로드 제한 없이, 워터마크도 없습니다. 구체적인 과정은 다음과 같습니다.
- 도구를 엽니다. PDF-to-Excel 페이지로 이동하면 화면 중앙에 파일 업로드 영역이 보입니다.
- 파일을 업로드합니다. PDF를 드래그 앤 드롭하거나 업로드 영역을 클릭해 파일을 선택하세요. 파일은 HTTPS로 전송되며 처리가 끝나면 서버에서 자동으로 삭제됩니다. 어디에도 저장되지 않습니다.
- 변환을 기다립니다. 표 두세 개가 있는 5페이지짜리 PDF라면 10초 안에 끝납니다. 50페이지 분량의 스캔 문서를 OCR 처리할 경우 해상도에 따라 30~60초 정도 걸릴 수 있습니다.
- XLSX를 다운로드합니다. 다운로드 버튼을 클릭하면 됩니다. Excel, Google Sheets, LibreOffice Calc 어디서든 바로 열 수 있습니다.
전체 과정이 정말 이게 전부입니다. 결제 화면 같은 건 중간에 끼어들지 않습니다.
열과 행이 뒤틀리지 않게 하는 방법
텍스트 기반 PDF도 원본 레이아웃에 병합 셀, 여러 줄짜리 헤더, 표 안에 끼어든 각주가 있으면 스프레드시트가 지저분하게 나올 수 있습니다. XLSX를 열자마자 확인할 사항들을 정리했습니다.
- 상단의 병합 셀. PDF 변환기는 걸쳐 있는 헤더를 별도 셀로 쪼개거나, 반대로 독립적이어야 할 열들을 합쳐버리는 경우가 있습니다. 1행과 2행부터 먼저 확인하세요.
- 텍스트로 저장된 숫자. 숫자 셀 모서리에 초록색 삼각형이 보이면 해당 셀이 텍스트 문자열로 들어온 겁니다. 해당 열을 선택하고 데이터 > 텍스트 나누기에서 고정 너비로 처리하거나, 1을 곱하는 방법으로 값만 붙여넣기 해보세요. SUM이나 AVERAGE 수식을 쓰기 전에 반드시 수정해야 합니다.
- 숫자에 붙은 통화 기호. 「$4,320.00」같은 값은 합계가 제대로 계산되지 않습니다. 찾기 및 바꾸기(Ctrl+H)로 해당 열 전체에서 기호를 제거하세요.
- 페이지 경계에서 잘린 행. PDF는 행 중간에서 페이지가 넘어가기도 합니다. 데이터 50~60행마다 페이지가 끊기는 위치 근처에서 비정상적으로 짧은 행(셀 한두 개만 채워진 행)이 있는지 찾아 수동으로 합쳐주세요.
이렇게 확인해도 표가 여전히 쓰기 어려운 상태라면, 전체 문서 대신 필요한 페이지만 잘라서 다시 업로드해 보세요. Filuni를 포함한 대부분의 PDF 변환 도구는 200페이지짜리 파일 속 147페이지에 묻힌 표보다 2페이지짜리 발췌본을 훨씬 깔끔하게 처리합니다.
알아두면 좋은 대안들
복잡한 다중 표 PDF에서는 Adobe Acrobat Pro가 가장 정확한 결과를 냅니다. 유료라는 단점이 있지만요. Microsoft Word는 PDF를 직접 열어 편집 가능한 문서로 변환해 주는데, 먼저 PDF를 Word로 변환한 다음 표를 Excel로 복사해야 할 때 유용합니다. Google Drive는 Google Docs로 PDF를 열면 OCR 처리가 되어, 스캔 파일에서는 오히려 더 나은 결과가 나오기도 합니다. Tabula는 텍스트 기반 PDF에서 표를 추출하는 데 특화된 무료 데스크톱 앱입니다. 하지만 계정 없이, 제한 없이, 무료로 바로 쓸 수 있다는 점에서 Filuni를 따라오는 도구는 없습니다.
자주 묻는 질문
변환된 Excel 파일에 모든 데이터가 한 열에 몰려 있는 이유가 뭔가요?
PDF가 탭 대신 공백으로 열을 정렬했을 가능성이 큽니다. 이 경우 변환기가 행 전체를 하나의 문자열로 인식합니다. Excel에서 A열을 선택한 뒤 데이터 > 텍스트 나누기로 이동해 너비가 일정함을 선택하고, 데이터가 실제로 나뉘는 위치에 구분선을 드래그해 놓으면 됩니다. 2분이면 끝나고, 이런 유형의 문제 90%는 해결됩니다.
스캔한 청구서 PDF인데 OCR이 표를 제대로 인식할까요?
스캔 품질에 달려 있습니다. 단순한 청구서를 반듯하게 200 dpi 이상으로 스캔했다면 변환이 잘 됩니다. 조금이라도 기울어져 있거나 먹지 복사본이라면 몇몇 값은 손으로 수정해야 할 수 있습니다. 재무 관련 중요 데이터라면 결과물 전체를 믿기 전에 반드시 원본과 두세 행을 대조 확인하세요.
한 번에 몇 페이지까지 변환할 수 있나요?
Filuni는 페이지 수 상한을 따로 공개하지 않으며, 세션당 파일 수 제한도 없습니다. 수백 페이지짜리 파일, 특히 스캔 문서는 당연히 시간이 더 걸립니다. 300페이지 보고서에서 표 세 개만 필요하다면, 해당 페이지만 잘라내서 올리는 게 훨씬 빠르고 결과도 깔끔합니다.
기밀 스프레드시트를 PDF로 올려도 안전한가요?
Filuni는 변환이 끝나면 업로드된 파일을 서버에서 삭제합니다. 저장하거나 인덱싱하거나 공유하지 않습니다. 법률 문서나 의료 기록처럼 극도로 민감한 파일이라면 로컬 데스크톱 도구를 쓰는 게 가장 안전합니다. 매출 보고서나 재고 현황표 같은 일반 업무 데이터라면 Filuni가 사용하는 서버 측 처리 방식은 온라인 파일 도구의 표준적인 관행입니다.
Filuni의 무료 도구 사용해보기
이 글의 모든 것 — 그리고 120개 이상의 도구. 무료, 회원가입 불필요, 브라우저에서 바로.