me2day

파이썬으로 PDF를 읽어서 한글을 제대로 뽑아낼 수 있나요? pyPdf, pdftools 모두 실패 08.04.15 07:11

미투 0

9 개의 댓글이 있습니다.

유리디체 유리디체

일단 텍스트 파일로 먼저 옮겨보세요. 피디에프 파일은 한글로 전환이 안되거든요.텍스트에서 복사해서 한글에 갖다 붙이삼

08.04.15 09:25
kz kz

그....... hwp가 아니고 말이죠...;;;;

08.04.15 09:53
헤이 헤이

ㅎㅎㅎ

08.04.15 10:13
민노씨 민노씨

저도 그런 생각 종종 들었는데.. 꼭 성공하셔서 방법 좀 알려주시길. : )

08.04.15 10:36
푸디딕 푸디딕

hwp 대략 난감. iText-Jython으로 되려는지는 잘 모르겠네요.

08.04.15 10:42
유리디체 유리디체

Oooops~ ^^;;

08.04.15 10:54
kz kz

유리디체, ㅋㅋㅋ 제가 글을 대충 썼나봐요. 죄송 :p

08.04.15 13:43
kz kz

reportlab은 쓰기 전용; xpdf를 쓰라는 답이 다수라서 이따 해볼 예정.

08.04.15 15:47
kz kz

python-poppler 어떻게 쓰는 건지 모르겠다. 문서가 없다;

10.01.09 08:41