• 목록
  • 아래로
  • 위로

PHP cURL을 이용하여 페이스북을 크롤링할 때에는 다음과 같은 점을 유의해야 하네요.


1. 


"curl_setopt($ch, CURLOPT_HEADER, 1);" 또는 curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);


이렇게 헤더정보를 보내는 옵션을 꼭 넣어야 하네요.


이걸 넣지 않으면 봇으로 인식해서 브라우저를 업데이트하라는 메시지만 뜨고 크롤링을 막아버리네요 ㅠㅠ


트위터나 인스타는 이런 방식으로 막지 않는데 유독 페북만 막는군요.


다행히 페북도 user-agent 등을 확인해서 봇을 차단하는 것은 아니네요.


참고로 파이썬에서 requests나 urllib을 사용할 때에는 별다른 옵션없이 바로 크롤링이 가능합니다.



2. 


페이스북 사이트는 자바스크립트가 작동되는 브라우저인지 확인을 하는군요 ㄷㄷ


이걸 우회하여 모든 내용에 접근하려면 m.facebook.com 또는 mobile.facebook.com으로 접속해야 되네요.


브라우저에서 자바스크립트를 끄고 바로 페북에 접속하면 막히지만,


모바일 페이지로 접속하면 뚫리는 것을 확인할 수 있어요.


다만 이 방법이 언제까지 가능할지는 모르겠네요.


작성자
이니스프리 119 Lv. (0%) 2185540/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 1039
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4709
253 오라클 DB 사용할 때 유용한 사이트 1 프요 17.09.06.09:22 378
252 모바일 환경 이용하시는 분들 팁...? 3 file title: 은메달도다 16.09.30.01:13 380
251 경험치에 관련해서 문의가 많군요. 조금 정리해봤습니다. 10 마스터 마스터 16.09.16.22:59 382
250 윈도우키 + L로 잠금화면 진입하기 1 이니스프리 이니스프리 19.04.13.23:56 385
249 [생활정보] 동동주 베이스의 안동 찹쌀 소주가 출시되었습니다 7 image 이니스프리 이니스프리 16.12.13.12:57 387
248 가상PC(vmware,virtualbox)에서 사용가능한 리눅스 배포본 해피보이 20.04.25.10:28 388
247 [Python] 이미지 파일을 다운받기 전에 가로&세로 사이즈를 확인하기 이니스프리 이니스프리 19.12.10.22:06 392
246 [Python] Youtube Data API를 이용하여 특정 채널의 모든 비디오 링크를 얻는 함수 이니스프리 이니스프리 21.03.12.22:05 392
245 아미나빌더 1.7.20 업데이트 5 이니스프리 이니스프리 17.11.10.16:01 394
244 이미지 누끼 자동으로 따 주는 사이트(백그라운드 제거) 2 마당쇠15 마당쇠15 20.05.24.07:02 396
243 꼭 한번 들러보자! 전국 휴게소 맛집 5 image Adam title: 대한민국 국기Adam 17.10.09.16:58 396
242 이북 무료 제공 - JavaScript: Novice to Ninja 4 이니스프리 이니스프리 17.11.09.13:35 400
241 [Gnuboard] DB 테이블 중 g5_board_file에 대하여 이니스프리 이니스프리 21.04.11.16:25 400
240 [SSH] php 파일에서만 원하는 문자열 검색 스크립트 image 연우빠 연우빠 17.10.02.01:59 402
239 아미나에서 Froala 에디터 사용이 가능해졌습니다 9 이니스프리 이니스프리 19.05.03.18:47 403
238 [롯데리아] 클래식 치즈버거 주문시 치즈스틱 무료 증정 이벤트 6 image 이니스프리 이니스프리 16.12.07.00:20 405
237 크롬 69 업데이트 전후로 자주가는 페이지가 안나오는 경우 8 image NoYeah NoYeah 18.09.08.00:04 405
236 [Python] COS Pro 1급 5-6 풀이 이니스프리 이니스프리 20.02.15.16:55 407
235 인증서 설치하신분들중 WoSign, StartSSL 인증서를 사용하시는분들은 봐주세요 3 YJSoft YJSoft 16.10.01.20:32 412
234 국가별 연말 휴무일 정보 이니스프리 이니스프리 18.12.25.09:28 413