• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (0%) 2003820/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 971
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4651
531 [Python] Zip 파일에서 특정 확장자의 파일들만 특정 폴더에 압축 풀기 이니스프리 이니스프리 22.08.01.19:31 539
530 [Python] PyMuPDF의 사용방법 이니스프리 이니스프리 22.07.28.21:33 490
529 [Python] Poppler 등 설치하지 않고 PDF -> Image 하는 모듈 이니스프리 이니스프리 22.07.28.11:20 225
528 [Python] 문자열을 숫자 크기대로 정렬하기 이니스프리 이니스프리 22.07.21.19:57 590
527 [Matplotlib] X축 눈금 레이블 텍스트를 회전시키는 방법 이니스프리 이니스프리 22.07.18.21:05 204
526 [Telegram] Bot의 inline keyboard 제거 이니스프리 이니스프리 22.07.01.20:35 190
525 [Filepond] 가로로 이미지 나열 이니스프리 이니스프리 22.06.20.21:26 259
524 [Selenium] Page down 이니스프리 이니스프리 22.06.19.12:40 167
523 [Python] Function to save list into a text file line by line 이니스프리 이니스프리 22.06.11.21:33 166
522 [Python] Bypassing Cloudflare's anti-bot page with Cloudscraper module 이니스프리 이니스프리 22.06.10.22:11 197
521 [Python] MP4 움짤을 clip하여 thumbnail 生成하기 이니스프리 이니스프리 22.06.09.08:35 173
520 [Python] MP4 50% 進行된 frame을 JPG thumbnail로 生成 이니스프리 이니스프리 22.06.06.15:15 133
519 [Python] MP4 -> JPG thumbnail 生成 1 이니스프리 이니스프리 22.06.04.16:38 131
518 [Python] Sending SMTP メール(Gmail) - Redmail module 이니스프리 이니스프리 22.06.02.20:38 123
517 [Python] PyHWP의 hwp5txt를 利用하여 Hancom file을 불러오기 이니스프리 이니스프리 22.05.29.07:59 371
516 [Python] print 되는대로 string으로 변환하는 function 이니스프리 이니스프리 22.05.22.19:59 133
515 [Python] Windows에서 Pocketsphinx 설치할 때 Swig 설치하는 방법 이니스프리 이니스프리 22.04.16.20:15 536
514 [Python] extension이 標示되지 않는 online image의 extension을 알아내기 이니스프리 이니스프리 22.04.01.20:51 170
513 [Python] PyMySQL에서 executemany()로 2 dimensional Array을 사용하여 DB에 적용하기 2 이니스프리 이니스프리 21.10.09.22:06 523
512 [Python] Google_images_search 모듈 : 구글에서 이미지 검색 및 크롤링하기 이니스프리 이니스프리 21.09.21.18:03 308