• 목록
  • 아래로
  • 위로

※ 법적 문제의 소지가 있어 구체적인 스크립트는 기재하지 않습니다.

 

 

CGV 홈페이지에서 새로운 날짜의 티켓이 오픈하였는지 여부를 크롤링하여

 

원하는 좌석을 예매하려는 분들이 많이 계시는 것으로 알고 있습니다.

 

구글링해보면 CGV 홈페이지가 개편된 이후에 Python Requests로 크롤링하는 것이 막혔다는 취지의 글들이 있습니다.

 

하지만 여전히 Selenium을 사용하지 않고도 가능합니다!!

 

제 사견으로는 Requests로 크롤링이 가능한 웹페이지를 Selenium으로 크롤링한다면,

 

빈대를 잡으려 초가삼간을 태우는 격으로서 사실상 크롤링에 실패한 것으로 봅니다.

 

 

크롤링 방법에 대한 요지를 말씀드리면 다음과 같습니다.

 

(URL 생략) GetScheduleSearchKey에 POST 전송을 할 때 headers를 적절히 넣는 것이 핵심입니다.

 

특히 cookies 관련하여 ASP.NET_SessionId를 다른 URL에서 받아오던지 해서 잘 넣어줘야 합니다.

 

URL_PREV_COMMON은 꼼꼼하게 보지 않으므로 적당히 넣어주면 됩니다.

 

참고로 최근에 홈페이지가 개편된 사이트 중 상당수는 cookies를 조작하면 여전히 Requests로 크롤링이 가능합니다.

(ex. 교보문고)

 

 

그리고 기술적이라기보다는 실무적인 문제에 가깝지만 CGV 측에서 간혹 날짜를 건너뛰어서 티켓을 오픈하는 경우가 있습니다.

 

예컨대 2023. 8. 7. 시점에서 2023. 8. 14.부터 2023. 8. 21.까지의 티켓 및 2023. 8. 28.일 자의 티켓이 오픈되는 경우가 있습니다.

 

단순히 예매 가능한 마지막 날짜만 크롤링하여 받아오면 2023. 8. 23.일 자의 영화를 예매하려고 할 때 낭패를 볼 수 있으니 참고하세요 ^-^

 

작성자
이니스프리 119 Lv. (2%) 4232020/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 시스템 점검 작업 완료 안내 10 마스터 마스터 24.09.05.16:25 3150
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 10598
540 [Python] \u3000을 공백으로 치환하기 이니스프리 이니스프리 23.10.29.14:51 396
539 [디지털 포렌식 전문가] 제21회 실기 시험 일정 image 이니스프리 이니스프리 23.10.29.01:39 257
538 [Python] Ordered Set 이니스프리 이니스프리 23.09.19.20:24 273
[Python] CGV 예매 관련 크롤링 (개요) 이니스프리 이니스프리 23.08.22.21:10 578
536 [Python Requests] multiple cookies를 다루기 - "There are multiple cookies with name python" 에러 처리 이니스프리 이니스프리 23.08.22.01:40 340
535 [Python] How to send BOLD text with Telegram bot 이니스프리 이니스프리 23.08.10.19:51 287
534 [Python] Downloading Youtube Private Videos with Youtube_dlp - 유튜브 '비공개' 동영상 다운로드 이니스프리 이니스프리 23.06.30.20:05 455
533 [Vultr] 원클릭 NextCloud 설치 시 config.php 위치 이니스프리 이니스프리 23.03.05.10:16 303
532 [Python] zipfile 모듈 한글 파일명 깨짐 현상 해결방법 이니스프리 이니스프리 22.08.03.19:37 980
531 [Python] Zip 파일에서 특정 확장자의 파일들만 특정 폴더에 압축 풀기 이니스프리 이니스프리 22.08.01.19:31 603
530 [Python] PyMuPDF의 사용방법 이니스프리 이니스프리 22.07.28.21:33 728
529 [Python] Poppler 등 설치하지 않고 PDF -> Image 하는 모듈 이니스프리 이니스프리 22.07.28.11:20 303
528 [Python] 문자열을 숫자 크기대로 정렬하기 이니스프리 이니스프리 22.07.21.19:57 670
527 [Matplotlib] X축 눈금 레이블 텍스트를 회전시키는 방법 이니스프리 이니스프리 22.07.18.21:05 264
526 [Telegram] Bot의 inline keyboard 제거 이니스프리 이니스프리 22.07.01.20:35 235
525 [Filepond] 가로로 이미지 나열 이니스프리 이니스프리 22.06.20.21:26 333
524 [Selenium] Page down 이니스프리 이니스프리 22.06.19.12:40 232
523 [Python] Function to save list into a text file line by line 이니스프리 이니스프리 22.06.11.21:33 231
522 [Python] Bypassing Cloudflare's anti-bot page with Cloudscraper module 이니스프리 이니스프리 22.06.10.22:11 280
521 [Python] MP4 움짤을 clip하여 thumbnail 生成하기 이니스프리 이니스프리 22.06.09.08:35 235