• 목록
  • 아래로
  • 위로

저는 우분투와 파이썬에 대해 잘 모르기 때문에 이 글에 부족한 부분이 많을 것으로 생각됩니다.


부정확한 부분이 있으면 댓글로 말씀해주시면 감사하겠습니다.



PhantomJS가 다른 Headless browser와 비교할 때 설치 및 Webdriver API 사용법이 가장 간단하지만,


현재는 deprecated된 상태이고 실행은 되지만 크롬이나 파폭을 이용하라고 경고가 뜹니다.


또한 크롬이나 파폭에서 보이는 화면과 다르게 보이는 경우가 적지 않게 있어서 


일일이 스크린샷을 찍으며 확인을 해야 되고,


가장 큰 문제점은 자바스크립트와 관련하여 충돌이 발생하는 경우가 있습니다.



한편 Chromedriver는 윈도우에서는 chromedriver.exe만 있으면 잘 돌아가지만


현재 우분투에서 크로미움과 관련하여 여러 에러가 보고되고 있습니다.


제가 아직 이에 대한 확실한 솔루션을 제시한 글을 찾지 못해서 이 글에서는 다루지 않겠습니다.



설치를 시작하기에 앞서 시스템을 최신으로 업데이트하는 것을 권장합니다.


# sudo apt-get update -y
# sudo apt-get upgrade -y
# sudo shutdown -r now




1. PhantomJS


(1) 우선 PhantomJS에서 필요로 하는 패키지를 설치합니다.

# sudo apt-get install build-essential chrpath libssl-dev libxft-dev libfreetype6-dev libfreetype6 libfontconfig1-dev libfontconfig1 -y


(2) 현재 최신버전의 PhantomJS를 다운로드 받습니다.

# sudo wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2


(3) 압축을 해제합니다.

# sudo tar xvjf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/share/


(4) 심링크를 생성합니다.

# sudo ln -s /usr/local/share/phantomjs-2.1.1-linux-x86_64/bin/phantomjs /usr/local/bin/


(5) 설치된 PhantomJS의 버전을 확인해봅니다.

# phantomjs --version


(6) 파이썬에서는 webdriver API를 다음과 같은 방법으로 사용할 수 있습니다.


driver = webdriver.PhantomJS('/usr/local/bin/phantomjs')





2. Geckodriver (Firefox)


셀레니움 3.0 이전 버전에서는 geckodriver를 따로 설치할 필요가 없었지만 


현재는 설치를 하지 않으면 에러를 발생합니다.



우선 파이어폭스가 설치되어 있다는 전제하에 최신버전의 geckodriver를 다운받습니다.


# wget https://github.com/mozilla/geckodriver/releases/download/v0.18.0/geckodriver-v0.18.0-linux64.tar.gz



geckodriver 파일을 어느 폴더에 압축을 풀어야 하는지에 관하여 버전별로 조금씩 차이가 있고 이에 대한 논쟁이 있는데


현재는 /usr/local/bin/에 설치하고 퍼미션을 777로 주면 작동하는 것을 확인했습니다.

(주의: /usr/bin/이나 /usr/local/bin/geckodriver/가 아닙니다.)



기본적으로는 다음과 같은 방법으로 파이썬에서 Webdriver API를 사용할 수 있습니다.


-headless 등 옵션을 사용하려면 import 해줘야 합니다. (크롬과 차이점)



from selenium.webdriver.firefox.options import Options


options = webdriver.FirefoxOptions()

options.add_argument('-headless')

driver = webdriver.Firefox(executable_path="/usr/local/bin/geckodriver", firefox_options=options)



작성자
이니스프리 119 Lv. (1%) 2274070/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 1063
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4750
174 [할인정보] ESET 프로모션 9PC 또는 9년을 1년 1PC 가격에! 9 이니스프리 이니스프리 17.02.08.18:35 647
173 코스피 API에 대한 공공데이터포털의 답변 이니스프리 이니스프리 19.08.26.21:39 650
172 특정 사이트 접속이 느려질 때 해결방법 (Browser Helper Objects 관련) 3 이니스프리 이니스프리 19.03.28.13:17 651
171 [파이썬] .replace() 카운트하는 방법 이니스프리 이니스프리 19.12.24.11:25 658
170 특정사이트 접근제한 하는 방법 1 image 대전댁 title: 은메달대전댁 16.12.09.21:13 669
169 미디어위키 속도 조금이라도 높이기 1 title: 은메달도다 17.01.13.15:30 686
168 [IT정보] 도메인 등록비용 비교 1 이니스프리 이니스프리 17.02.03.00:48 689
167 xe 비밀번호/아이디 3 맛수타 17.06.12.06:04 690
166 [구루미] 지원 환경 6 이니스프리 이니스프리 20.05.25.22:27 692
165 소스파일 비교 홈페이지 슬기 슬기 18.10.06.09:55 701
164 크롬에서 스타벅스 와이파이 자동 로그인해주는 확장 프로그램 1 블루블루 17.06.06.01:36 704
163 크롬과 파이어폭스에서 마지막으로 닫았던 탭이나 창 다시 열기(Shift + Ctrl + T)의 차이 2 이니스프리 이니스프리 19.04.20.13:10 707
162 PHP로 페이스북을 크롤링할 때 유의할 점 이니스프리 이니스프리 19.08.18.01:29 713
161 대학생일 경우 윈도우10 무료로 받을 수 있습니다 5 image benjamin 17.07.30.08:51 715
160 유튜브 영상 다운로드 하는 요령 2 image 오후두시스토리 오후두시스토.. 17.04.08.09:55 734
159 [파이썬] 엔터를 치지 않아도 키 입력 받기 (윈도우) 이니스프리 이니스프리 20.01.01.12:28 734
158 CMS에 Selenium 봇이 글을 작성하는 것을 차단하는 방법 2 이니스프리 이니스프리 19.08.22.06:27 734
157 [Pillow] Animated GIF가 반복되지 않는 경우의 해결방법 이니스프리 이니스프리 20.03.09.01:44 735
156 [뻘글]CloudFlare를 사용했을 때와 그렇지 않았을 때 속도 차이는 얼마나 날까? 3 file title: 금메달 (30일)동방개념지국 17.01.13.02:03 742
155 유튜브에서 국내 캐시서버로 연결되었는지 확인하는 방법 image 이니스프리 이니스프리 18.11.09.22:41 750