• 목록
  • 아래로
  • 위로

1. 인코딩의 문제


https://stackoverflow.com/questions/31126831/beautifulsoup-with-xml-fails-to-parse-full-unicode-strings


위 글을 참조하시면 좋을 것 같습니다.




2. 파서의 문제

출처: https://brownbears.tistory.com/414


제가 테스트해보니 html.parser를 사용해서 짤리는 경우에 html5lib를 사용하면 제대로 나오는 경우가 있습니다.


tbody 안의 tr 태그가 몇 개인지 체크하는 스크립트를 통해 테스트했는데, 


전자를 사용하면 1개로 나오는 것이 후자를 사용하면 6개로 정확히 나오더군요.


위 표에는 html5lib는 별도의 설치가 필요하다고 설명되어 있는데, 아나콘다 또는 미니콘다 환경에서는 이미 설치되어 있습니다 ^^


그리고 제가 테스트한 환경에서는 html.text와 html.content의 차이는 없는 것 같네요.


작성자
이니스프리 119 Lv. (0%) 1913460/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 749
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4420
306 [Selenium] alert 창을 닫는 방법 및 alert 창이 뜨는 것을 차단하는 방법 1 이니스프리 이니스프리 19.12.26.23:01 4574
305 이베이에서 저렴하게 올라오는 보안 프로그램에 관하여 이니스프리 이니스프리 19.12.26.12:12 126
304 최근 KT 해외망 간단 리뷰 이니스프리 이니스프리 19.12.25.23:21 174
303 [파이썬] 폴더 및 하위 폴더 내의 파일에서 문자열을 일괄적으로 replace하는 스크립트 이니스프리 이니스프리 19.12.25.13:01 1240
302 [파이썬] 길어진 로그 파일을 100줄로 줄이는 스크립트 이니스프리 이니스프리 19.12.25.11:49 152
301 [파이썬] .replace() 카운트하는 방법 이니스프리 이니스프리 19.12.24.11:25 658
300 일본 아마존에서 MP3 음원 구입하는 방법 5 image 제르엘 제르엘 19.12.23.01:28 7368
BeautifulSoup에서 로딩한 html이 짤리는 경우에 해결방법 image 이니스프리 이니스프리 19.12.19.21:57 219
298 [펌] 전자사전 관련 정보 8 image 이니스프리 이니스프리 19.12.17.13:58 129
297 [Selenium] WebDriverWait에서 EC 대신 람다 함수를 활용하기 이니스프리 이니스프리 19.12.17.01:27 419
296 [Vimeo] 플레이어 단축키 image 이니스프리 이니스프리 19.12.11.22:19 796
295 [Python] 이미지 파일을 다운받기 전에 가로&세로 사이즈를 확인하기 이니스프리 이니스프리 19.12.10.22:06 391
294 Programmers에서 비메오 오류로 강의가 재생되지 않을 때 해결방법 이니스프리 이니스프리 19.12.10.19:22 1095
293 [파이썬] 리스트에서 중복되는 요소가 있는지 여부 판단 / 중복되는 요소만 뽑아서 리스트에 넣기 이니스프리 이니스프리 19.12.08.15:17 2152
292 [파이썬] 텔레그램 봇으로 이미지 보내기 이니스프리 이니스프리 19.12.06.14:12 2134
291 OpenCV를 이용한 face detection에서 parameter에 대하여 이니스프리 이니스프리 19.12.05.18:57 256
290 텔레그램 봇의 프로필 이미지를 변경하는 방법 이니스프리 이니스프리 19.11.28.16:33 3697
289 무료 온라인 스토리지 전송속도 비교 3 image 이니스프리 이니스프리 19.11.27.18:40 136
288 Vultr에 10% VAT가 가산되면... (한화 계산) 3 이니스프리 이니스프리 19.11.23.18:58 327
287 '20 TEPS 일정 image 이니스프리 이니스프리 19.11.23.15:26 135