• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (1%) 2546890/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [1차 해결 및 추가] 서버 접속 불가 문제 안내 12 마스터 마스터 24.06.20.15:22 335
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 2367
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 6053
516 [Pillow] 파이썬에서 이미지 파일의 포맷을 알아내는 방법 이니스프리 이니스프리 19.11.14.23:25 134
515 [Python] 2020년 5급 신임관리자 교육과정에 파이썬 도입! image 이니스프리 이니스프리 20.02.11.23:48 134
514 [VSCode] 1개의 OS에 VSCode 여러 개를 설치 및 구동하기 이니스프리 이니스프리 24.05.26.05:09 134
513 목록통관건 개인통관고유부호 필수 사용안내 이니스프리 이니스프리 19.08.28.23:14 137
512 [Flutter] 오프라인 강좌 10/20(일) image 이니스프리 이니스프리 19.10.14.11:36 138
511 [Python] print 되는대로 string으로 변환하는 function 이니스프리 이니스프리 22.05.22.19:59 138
510 [Python] Tabulate 모듈로 작성한 테이블을 파일로 저장할 때 에러가 발생하는 경우 이니스프리 이니스프리 24.04.20.23:45 138
509 [Python] MP4 -> JPG thumbnail 生成 1 이니스프리 이니스프리 22.06.04.16:38 139
508 [파이썬] OS에 따라서 경로를 달리하기 이니스프리 이니스프리 20.01.07.22:15 140
507 [Ramnode] SSD 용량 추가! 2 image 이니스프리 이니스프리 20.02.17.22:20 140
506 [KAL] 보너스 항공권 공제 마일리지 표 (평수기) 1 image 이니스프리 이니스프리 19.10.16.14:55 141
505 무료 온라인 스토리지 전송속도 비교 3 image 이니스프리 이니스프리 19.11.27.18:40 141
504 [펌] 신발 깔창 리뷰 이니스프리 이니스프리 20.01.01.17:26 141
503 [Python] 폴더 내 이미지의 height를 측정하여 height < n 미만인 파일을 삭제하기 이니스프리 이니스프리 20.08.13.20:08 141
502 [Python] Youtube_dl 사용시 주의할 점 이니스프리 이니스프리 21.03.12.22:14 141
501 [Python] MP4 50% 進行된 frame을 JPG thumbnail로 生成 이니스프리 이니스프리 22.06.06.15:15 141
500 [Python] 딕셔너리 자료형에서 .get() 메서드 사용시 에러 회피하기 이니스프리 이니스프리 20.02.15.22:48 143
499 [Python] 문자열에서 숫자만 뽑아서 정수로 반환하는 함수 이니스프리 이니스프리 20.02.12.00:01 144
498 [Python] print() 문의 문자열 출력 형식 2 이니스프리 이니스프리 20.02.15.22:16 144
497 [Python] random 함수가 계속하여 동일한 결과를 출력할 때 해결방법 이니스프리 이니스프리 24.05.15.19:32 145