• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (0%) 2007770/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 994
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4672
511 hosting.kr 개인정보 보호 서비스 image 이니스프리 이니스프리 21.09.20.10:46 212
510 [Python] ImportError: No module named '_curses' 에러에 대한 대처 방법 이니스프리 이니스프리 21.09.19.21:44 2812
509 [Python] Requests에서 SSLError 발생 시 대처 방법 이니스프리 이니스프리 21.09.19.15:12 1219
508 [미디어위키] Liberty 스킨 스타일 깨지는 문제 수정하기 2 image title: 은메달도다 21.09.19.12:51 239
507 [Python] Requests에서 JSON 데이터를 POST 전송하는 방법 x2 이니스프리 이니스프리 21.08.22.08:16 9677
506 [프린터/복합기] 캐논 복합기 MF6XX ID 및 PIN 1 이니스프리 이니스프리 21.08.16.09:19 505
505 [Python] Naver Login with requests 1 image Hanam09 Hanam09 21.07.17.01:48 2877
504 [Python] 엑셀 파일에 암호 설정 (Set password for Excel file using Python) 3 image 이니스프리 이니스프리 21.07.09.21:21 1196
503 [Python] 구버전 KeyCaptcha 정답 좌표 찾기 image 네모 네모 21.07.09.02:46 157
502 [Python] 패스워드 걸린 PDF 파일을 오픈하여 패스워드를 삭제한 채로 저장하기 이니스프리 이니스프리 21.07.08.18:26 598
501 [Python] 구글 뉴스 RSS 파싱 2 이니스프리 이니스프리 21.07.04.13:49 231
500 [Python] 이미지 파일의 Exif 정보 삭제하기 (+ 식빵자세 산냥이) image 이니스프리 이니스프리 21.07.03.13:42 262
499 [Python] PDF2image 모듈이 실행되지 않을 때 이니스프리 이니스프리 21.06.23.20:36 2664
498 유료 VPN 선택과 관련하여 참고할 웹 문서! 2 이니스프리 이니스프리 21.06.08.19:28 248
497 [Python] 영어로 표기된 날짜를 숫자로 변환 이니스프리 이니스프리 21.05.30.11:39 1074
496 [Python] Google Trend의 '최근 인기 검색어' 크롤링 3 이니스프리 이니스프리 21.05.02.12:24 486
495 [Python] for 문에 두 개의 리스트를 넣고 enumerate를 사용하는 방법 이니스프리 이니스프리 21.05.01.21:01 219
494 [Python] 입력받은 연도가 윤년이 아니면 그보다 가장 가까운 과거의 윤년을 출력하기 8 이니스프리 이니스프리 21.04.19.20:23 437
493 [Javascript] 이미지 업로드 전 가로x세로 사이즈를 확인하여 지정된 크기 이상인 경우 alert 띄우는 스크립트 이니스프리 이니스프리 21.04.17.21:28 123
492 [HTML] 특정 사이트의 파비콘을 다운로드 받는 방법 이니스프리 이니스프리 21.04.16.22:02 262