• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (0%) 1911210/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 740
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4411
446 [Python] m3u8 파일의 목록에 있는 ts 파일들을 merge하는 방법 6 이니스프리 이니스프리 20.06.20.22:03 1345
445 [파이썬] 여러 개의 공백을 하나로 줄이는 방법 이니스프리 이니스프리 19.12.28.00:12 1320
444 빠르고 간단한 인터넷 속도 측정기 14 망할윈도우미 망할윈도우미 18.05.28.20:05 1307
443 [Python] 이차원 리스트에서의 다중조건 정렬 이니스프리 이니스프리 20.02.08.23:00 1299
442 [Python] wav, mp3 재생하기 이니스프리 이니스프리 20.03.15.13:43 1295
441 [파이썬] 폴더 및 하위 폴더 내의 파일에서 문자열을 일괄적으로 replace하는 스크립트 이니스프리 이니스프리 19.12.25.13:01 1240
440 그누보드 캡챠(KCaptcha)의 설정을 변경하는 방법 이니스프리 이니스프리 18.11.14.21:22 1240
439 GitHub에서 학생계정 얻고 Private Repo 사용하기 5 Seia Seia 18.06.23.22:34 1232
438 [파이썬] 명언 엑셀파일 to CSV 변환 스크립트 이니스프리 이니스프리 19.07.09.23:19 1221
437 [Python] Requests에서 SSLError 발생 시 대처 방법 이니스프리 이니스프리 21.09.19.15:12 1216
436 [Python] 엑셀 파일에 암호 설정 (Set password for Excel file using Python) 3 image 이니스프리 이니스프리 21.07.09.21:21 1196
435 [할인정보] 핫스팟쉴드 엘리트 VPN 평생 이용권 99.99달러 3 이니스프리 이니스프리 17.02.09.23:25 1185
434 [건강/의학] 허리디스크,목디스크 혹은 허리,목아프신분들을 위한 팁. 2 image death death 17.01.25.21:25 1178
433 masonry 라이브러리 사용시 세로방향 이미지 겹침 문제에 대한 해결방법 이니스프리 이니스프리 19.07.20.23:39 1166
432 레노버 랩탑에서 Fn 키 설정 및 Ctrl 키와의 상호전환에 대하여 이니스프리 이니스프리 20.01.02.22:22 1104
431 Programmers에서 비메오 오류로 강의가 재생되지 않을 때 해결방법 이니스프리 이니스프리 19.12.10.19:22 1095
430 미국 내 주별 세일즈 택스에 대한 정리 (펌) 이니스프리 이니스프리 18.12.09.10:43 1090
429 [Python] 영어로 표기된 날짜를 숫자로 변환 이니스프리 이니스프리 21.05.30.11:39 1072
428 더현대닷컴 vs Hmall의 차이 이니스프리 이니스프리 20.01.26.20:10 1072
427 [Python] 2개의 리스트를 딕셔너리로 변환하는 3가지 방법 이니스프리 이니스프리 20.10.25.15:34 1056