🤔 이런 경험 있으신가요?
스캔한 교과서 PDF를 모바일 읽기용 EPUB으로 변환하고 싶은데:
- 직접 변환 → 깨진 텍스트 또는 빈 페이지
- 온라인 도구 → 레이아웃 완전히 망가짐
- Calibre 변환 → 각 페이지가 이미지로, 검색 불가
이것은 스캔 PDF가 본질적으로 이미지 모음이지 텍스트 문서가 아니기 때문입니다!
문제 이해하기: 스캔 PDF vs 텍스트 PDF
| 특징 | 텍스트 PDF | 스캔 PDF |
|---|---|---|
| 콘텐츠 유형 | 선택 가능한 텍스트 | 순수 이미지 |
| 텍스트 검색 | ✅ 가능 | ❌ 불가능 |
| 직접 EPUB 변환 | ✅ 잘 됨 | ❌ 깨짐/빈 페이지 |
| 필요한 처리 | 포맷 변환 | OCR + 변환 |
💡 스캔인지 확인하는 방법
PDF를 열고 텍스트를 선택해 보세요:
- 선택 가능 → 텍스트 PDF, 직접 변환 가능
- 선택 불가 또는 블록으로 선택됨 → 스캔, OCR 필요
리플로우 EPUB이란?
EPUB에는 두 가지 레이아웃 모드가 있습니다:
| 유형 | 리플로우 | 고정 레이아웃 |
|---|---|---|
| 글꼴 크기 | 조절 가능 | 고정 |
| 줄 바꿈 | 화면에 맞춤 | 없음 |
| 검색 | 지원 | 미지원 |
| 적합한 용도 | 모든 화면 크기 | 대형 화면 |
해결책: OCR + 변환
스캔 PDF를 리플로우 EPUB으로 변환하려면 두 단계가 필요합니다:
- OCR 인식: 이미지에서 텍스트 추출
- 포맷 변환: EPUB 형식으로 변환
방법 1: 우리 OCR 도구 사용 (권장)
우리 도구는 고급 OCR 엔진을 통합하여 원스톱 인식 및 변환을 제공합니다:
1스캔 PDF 업로드
OCR 변환 페이지에 드래그 앤 드롭
2인식 언어 선택
한국어, 영어, 중국어, 일본어 등 지원
3출력 형식으로 EPUB 선택
시스템이 자동으로 OCR을 수행하고 리플로우 EPUB 생성
4결과 다운로드
검색 가능하고 글꼴 조절 가능한 EPUB 파일 획득
✅ 우리 도구의 장점
- 다국어 인식 지원
- 문서 구조 자동 감지
- 기본 서식 유지
- 진정한 리플로우 레이아웃 생성
- 선택적 이미지 보존
사용 사례별 추천
📚 학술 논문/교과서
수식이 적고 텍스트 위주의 학술 문서. 스마트폰/Kindle에서 읽고 주석 달기에 적합.
추천: 온라인 OCR 도구 또는 ABBYY
⚖️ 법률 문서
법률 텍스트, 판례 분석. EPUB으로 변환하여 텍스트 음성 변환으로 듣기.
추천: 온라인 OCR 도구
📊 차트가 많은 문서
통계 보고서, 재무제표. 차트는 이미지로 유지해야 함.
추천: 고정 레이아웃 EPUB 또는 PDF 유지
더 나은 OCR 품질을 위한 팁
1. 스캔 품질 향상
- 최소 300 DPI로 스캔
- 균일한 조명, 그림자 피하기
- 페이지를 똑바로, 기울임 없이
2. PDF 전처리
- PDF 편집기로 대비 조정
- 과도한 여백 잘라내기
- 필요시 기울기 보정
FAQ
Q: OCR에 오류가 있으면?
OCR은 100% 정확하지 않습니다, 특히 흐린 스캔의 경우. Sigil을 사용하여 EPUB을 교정하세요.
Q: 수식을 인식할 수 있나요?
수학 수식 OCR은 어렵습니다. 간단한 수식은 될 수 있고; 복잡한 것은 보통 이미지로 유지됩니다.
Q: 표가 올바르게 인식되나요?
간단한 표는 대부분의 OCR 도구에서 작동; 복잡한 표는 수동 조정이 필요할 수 있습니다.