python-poppler 어떻게 쓰는 건지 모르겠다. 문서가 없다; 10.01.09 08:41
PDF 추출 API python
파이썬으로 PDF를 읽어서 한글을 제대로 뽑아낼 수 있나요? pyPdf, pdftools 모두 실패 by kz
2 개의 댓글이 있습니다.
pdftotext를 파이프로 부르는 걸로 부족한가요?
서상현 텍스트로 했을 때 소실될지도 모르는 편집 정보도 살려볼까 하구요. 일단 pdftotext 했을 때 한글이 안 깨진 문서가 나오는 건 확인했지요. :)
pdftotext를 파이프로 부르는 걸로 부족한가요?
10.01.09 20:18서상현 텍스트로 했을 때 소실될지도 모르는 편집 정보도 살려볼까 하구요. 일단 pdftotext 했을 때 한글이 안 깨진 문서가 나오는 건 확인했지요. :)
10.01.09 20:22