• 목록
  • 아래로
  • 위로

※ 법적 문제의 소지가 있어 구체적인 스크립트는 기재하지 않습니다.

 

 

CGV 홈페이지에서 새로운 날짜의 티켓이 오픈하였는지 여부를 크롤링하여

 

원하는 좌석을 예매하려는 분들이 많이 계시는 것으로 알고 있습니다.

 

구글링해보면 CGV 홈페이지가 개편된 이후에 Python Requests로 크롤링하는 것이 막혔다는 취지의 글들이 있습니다.

 

하지만 여전히 Selenium을 사용하지 않고도 가능합니다!!

 

제 사견으로는 Requests로 크롤링이 가능한 웹페이지를 Selenium으로 크롤링한다면,

 

빈대를 잡으려 초가삼간을 태우는 격으로서 사실상 크롤링에 실패한 것으로 봅니다.

 

 

크롤링 방법에 대한 요지를 말씀드리면 다음과 같습니다.

 

(URL 생략) GetScheduleSearchKey에 POST 전송을 할 때 headers를 적절히 넣는 것이 핵심입니다.

 

특히 cookies 관련하여 ASP.NET_SessionId를 다른 URL에서 받아오던지 해서 잘 넣어줘야 합니다.

 

URL_PREV_COMMON은 꼼꼼하게 보지 않으므로 적당히 넣어주면 됩니다.

 

참고로 최근에 홈페이지가 개편된 사이트 중 상당수는 cookies를 조작하면 여전히 Requests로 크롤링이 가능합니다.

(ex. 교보문고)

 

 

그리고 기술적이라기보다는 실무적인 문제에 가깝지만 CGV 측에서 간혹 날짜를 건너뛰어서 티켓을 오픈하는 경우가 있습니다.

 

예컨대 2023. 8. 7. 시점에서 2023. 8. 14.부터 2023. 8. 21.까지의 티켓 및 2023. 8. 28.일 자의 티켓이 오픈되는 경우가 있습니다.

 

단순히 예매 가능한 마지막 날짜만 크롤링하여 받아오면 2023. 8. 23.일 자의 영화를 예매하려고 할 때 낭패를 볼 수 있으니 참고하세요 ^-^

 

작성자
이니스프리 119 Lv. (0%) 2214540/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 1039
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4710
33 [Python] 스도쿠의 정오를 확인하는 함수 이니스프리 이니스프리 20.02.13.15:28 124
32 [Javascript] 이미지 업로드 전 가로x세로 사이즈를 확인하여 지정된 크기 이상인 경우 alert 띄우는 스크립트 이니스프리 이니스프리 21.04.17.21:28 123
31 [Python] Sending SMTP メール(Gmail) - Redmail module 이니스프리 이니스프리 22.06.02.20:38 123
30 하나 더 적금 우대금리 image 이니스프리 이니스프리 20.02.27.14:32 123
29 [Dropbox] 곧 시행될 세금 변경에 관한 중요한 알림 image 이니스프리 이니스프리 19.10.12.08:26 122
28 외국어(인도-유럽어족) 학습에 관하여 4 이니스프리 이니스프리 21.02.21.00:01 122
27 '20 SNULT 일정 image 이니스프리 이니스프리 19.11.23.13:07 122
26 [Python] Tabulate 모듈로 작성한 테이블을 파일로 저장할 때 에러가 발생하는 경우 이니스프리 이니스프리 24.04.20.23:45 121
25 [카고야] 공지 메일이 왔네요~ 이니스프리 이니스프리 20.01.08.13:27 121
24 [Flutter] 오프라인 강좌 이니스프리 이니스프리 20.01.09.00:12 121
23 DHTML 에디터에서 Hard Break vs Soft Break 이니스프리 이니스프리 20.01.12.13:48 120
22 [오프라인 강좌] 오픈소스 협업을 위한 Git 트레이닝 image 이니스프리 이니스프리 20.01.08.00:13 119
21 구글 검색 Tip image 슬기 슬기 19.10.14.11:42 119
20 [Python] Wildcard match 이니스프리 이니스프리 20.07.13.17:15 118
19 MS Office 제품군 명칭 변경 image 이니스프리 이니스프리 20.07.02.18:05 116
18 [Python] random 함수가 계속하여 동일한 결과를 출력할 때 해결방법 이니스프리 이니스프리 24.05.15.19:32 116
17 IPVanish의 한국서버가 4개로 확충되었습니다. image 이니스프리 이니스프리 20.01.11.11:27 116
16 헷갈리는 출생지를 가진 인물들 1 이니스프리 이니스프리 20.06.26.21:09 116
15 [Python] SSL: CERTIFICATE_VERIFY_FAILED에 대한 대처 방법 (2) 이니스프리 이니스프리 24.05.05.21:04 114
14 [Python] 3개의 list를 하나의 dictionary로 변환하기 이니스프리 이니스프리 20.06.10.21:47 114