me2day

python-poppler 어떻게 쓰는 건지 모르겠다. 문서가 없다; 10.01.09 08:41

파이썬으로 PDF를 읽어서 한글을 제대로 뽑아낼 수 있나요? pyPdf, pdftools 모두 실패 by kz

미투 0

2 개의 댓글이 있습니다.

서상현 서상현

pdftotext를 파이프로 부르는 걸로 부족한가요?

10.01.09 20:18
kz kz

서상현 텍스트로 했을 때 소실될지도 모르는 편집 정보도 살려볼까 하구요. 일단 pdftotext 했을 때 한글이 안 깨진 문서가 나오는 건 확인했지요. :)

10.01.09 20:22