• 목록
  • 아래로
  • 위로

※ 법적 문제의 소지가 있어 구체적인 스크립트는 기재하지 않습니다.

 

 

CGV 홈페이지에서 새로운 날짜의 티켓이 오픈하였는지 여부를 크롤링하여

 

원하는 좌석을 예매하려는 분들이 많이 계시는 것으로 알고 있습니다.

 

구글링해보면 CGV 홈페이지가 개편된 이후에 Python Requests로 크롤링하는 것이 막혔다는 취지의 글들이 있습니다.

 

하지만 여전히 Selenium을 사용하지 않고도 가능합니다!!

 

제 사견으로는 Requests로 크롤링이 가능한 웹페이지를 Selenium으로 크롤링한다면,

 

빈대를 잡으려 초가삼간을 태우는 격으로서 사실상 크롤링에 실패한 것으로 봅니다.

 

 

크롤링 방법에 대한 요지를 말씀드리면 다음과 같습니다.

 

(URL 생략) GetScheduleSearchKey에 POST 전송을 할 때 headers를 적절히 넣는 것이 핵심입니다.

 

특히 cookies 관련하여 ASP.NET_SessionId를 다른 URL에서 받아오던지 해서 잘 넣어줘야 합니다.

 

URL_PREV_COMMON은 꼼꼼하게 보지 않으므로 적당히 넣어주면 됩니다.

 

참고로 최근에 홈페이지가 개편된 사이트 중 상당수는 cookies를 조작하면 여전히 Requests로 크롤링이 가능합니다.

(ex. 교보문고)

 

 

그리고 기술적이라기보다는 실무적인 문제에 가깝지만 CGV 측에서 간혹 날짜를 건너뛰어서 티켓을 오픈하는 경우가 있습니다.

 

예컨대 2023. 8. 7. 시점에서 2023. 8. 14.부터 2023. 8. 21.까지의 티켓 및 2023. 8. 28.일 자의 티켓이 오픈되는 경우가 있습니다.

 

단순히 예매 가능한 마지막 날짜만 크롤링하여 받아오면 2023. 8. 23.일 자의 영화를 예매하려고 할 때 낭패를 볼 수 있으니 참고하세요 ^-^

 

작성자
이니스프리 119 Lv. (1%) 2646680/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [1차 해결 및 추가] 서버 접속 불가 문제 안내 12 마스터 마스터 24.06.20.15:22 600
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 2577
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 6277
236 JavaScript와 Canvas로 이미지의 배경값을 자동으로 산출하기 Seia Seia 20.09.12.06:37 300
235 [Python] URL에서 파일을 다운받지 않고 파일용량를 알아내는 방법 3 이니스프리 이니스프리 20.05.13.21:01 300
234 하루에 포인트를 많이 쌓는 법 3 image title: 은메달도다 17.01.12.16:02 299
233 [Python Requests] multiple cookies를 다루기 - "There are multiple cookies with name python" 에러 처리 이니스프리 이니스프리 23.08.22.01:40 294
232 [Python] clint를 이용한 requests에서의 다운로드 프로그레스바 이니스프리 이니스프리 20.05.29.14:53 292
231 (펌) 앱코, 감성초월 레트로 키보드 K850 & K830 마지막 하루!! 1 image 하루살이 title: 황금 서버 (30일)하루살이 17.02.28.00:41 292
230 [할인정보] Bullguard 백신 - 발렌타인데이 70% 할인 이벤트! 3 image 이니스프리 이니스프리 17.02.09.22:42 287
229 [할인정보] 더페이스샵 1월 멤버십데이 (오늘부터!) 1 image 이니스프리 이니스프리 17.01.02.10:19 287
228 php8.0 대응 라이믹스 오류 해결법 NUBE title: 크롬NUBE 21.03.08.11:39 286
227 [할인정보] 트렌드마이크로 맥시멈 시큐리티 80% 할인! image 이니스프리 이니스프리 17.01.31.18:38 285
226 [특가] 오늘 하루, TRON G41마우스 19,800원 특가 1 image 하루살이 title: 황금 서버 (30일)하루살이 17.02.27.13:00 282
225 트래픽 절감 관련 모 커뮤니티 사이트의 회의 결과 이니스프리 이니스프리 24.05.15.16:51 281
224 [Amina] 그누보드 + 아미나 설치 방법 (처음 시작하는 분들을 위한 간단 매뉴얼) 이니스프리 이니스프리 20.10.01.16:48 281
223 [Python] 이미지 파일의 Exif 정보 삭제하기 (+ 식빵자세 산냥이) image 이니스프리 이니스프리 21.07.03.13:42 280
222 [Python] 두 개의 변수를 하나의 for문에서 돌리기 - zip() 활용 이니스프리 이니스프리 20.06.16.14:53 280
221 [Python] 폴더 내 모든 엑셀 파일의 작성자를 출력하기 3 이니스프리 이니스프리 20.07.06.20:33 278
220 이미지 사이즈 줄이는 대표 사이트3 7 마당쇠15 마당쇠15 20.05.14.18:08 277
219 [Python] COS Pro 1급 5-4 풀이 이니스프리 이니스프리 20.02.15.16:24 277
218 [생활정보] 12/5-12/11 7일간 와퍼 주니어 51% 할인 (1900원) 6 image 이니스프리 이니스프리 16.12.10.00:26 277
217 게시글 이동시 포인트는 차감됩니다. 2 image 에듀 title: 맛스타의 자물쇠에듀 16.12.03.22:34 276