• 목록
  • 아래로
  • 위로
  • 0
  • jin****
  • 조회 수 2092

흔히 가장 막기 어렵다고 알려진 공격 중 하나가 XSS(cross-site scripting)입니다. 
간단히 소개하자면 게시물의 제목, 내용 등에 <script> 태그를 넣거나 
또는 그와 비슷한 역할을 하는 onmouseover 이벤트 등을 사용하여 임의의 자바스크립트를 실행하는 공격이지요. 
그래서 대부분의 게시판 솔루션들이 정규식을 사용해서 의심스러운 태그를 걸러내고 있지만, 
그것마저 뚫렸다며 급히 패치를 바란다는 공지사항을 종종 보게 되지요. 

그러나 사실 XSS 필터링은 그렇게 어려운게 아닙니다. 발상이 잘못되었기 때문에 어렵게 보이는 것 뿐입니다. 
이 게시판에도 종종 올라오는 XSS 필터링 라이브러리들, 
그리고 대부분의 공개형 게시판 프로그램들이 사용하는 필터링 알고리듬에는 두 가지 치명적인 허점이 있습니다. 

1. 위험한 태그, 속성, 이벤트만 콕콕 찍어 막으려고 하는 blacklisting 기법을 사용한다. 
2. HTML에 오류가 있거나 웹표준에 어긋나는 태그를 사용한 경우를 감안하지 않는다. 



blacklisting은 수많은 태그, 속성, 이벤트들 중 "위험하다고 알려진" 것들만 블랙리스트에 등록해서 
블랙리스트에 등록된 태그, 속성, 이벤트만 지우고, 나머지는 모두 허용해주는 방법입니다. 
만약 HTML5처럼 새로운 태그나 속성이 생기면 블랙리스트에 아직 없으니 모두 허용해 버리게 됩니다. 
만약 사용하기에 따라 위험할 수도 있는 속성이 블랙리스트에서 빠졌다면 그것도 허용해 버리게 됩니다. 
무엇이 허용되는지조차 분명하지 않으니 자나깨나 땜빵하느라 고생이 많습니다. 

반면, "안전하다고 증명된" 태그, 속성, 이벤트만 화이트리스트(블랙리스트의 반댓말)에 등록해서 
리스트에 등록된 것들만 허용하고 나머지는 죄다 없애버리는 whitelisting 기법을 사용한다면 
새로운 태그나 속성이 추가되더라도 걱정이 없습니다. 



HTML 오류에 신경쓰지 않는 필터링 라이브러리도 문제입니다. 
대부분의 필터링 라이브러리들은 정규식을 사용해서 태그를 걸러내는데, 
중간에 널바이트 또는 공백이 끼어 정규식에 잡히지 않는 엉터리 HTML도 
대부분의 브라우저들은 아무 일 없다는 듯 실행해 주고 있는 것이 현실입니다. 
onmouseover 이벤트는 걸렀지만 on\0mouseover 이벤트는 거르지 못하고, 
javascript: 링크는 잡았지만 java  script: 링크는 잡지 못하는 거죠. 
심지어는 이런 것도 있습니다: <img """><script>alert("XSS")</script>"> 

위와 같은 문제를 해결하려면 태그가 잘못된 것도 걸러내줘야 합니다. 
예를 들어 <img> 태그에 src 속성 대신 스크립트가 들어가 있으면 막아야 하는 거죠. 
잘못된 태그를 다 걸러내주면 짝 없는 <div> 태그 때문에 홈페이지 레이아웃이 깨지는 것도 막을 수 있습니다. 



HTML Purifier는 해외의 보안 전문가들로부터 철저하게 검증받은 필터링 라이브러리입니다. 
whitelisting 기법을 사용하고, 잘못된 태그도 확실하게 걸러내줍니다. 
이걸 사용하면 앞으로 아주 오랫동안 XSS 취약점 걱정은 하지 않아도 됩니다. 
http://htmlpurifier.org/ 

아래의 참고소스 란에 사용방법 예제를 넣었더니 내용이 많아서 그런지, 잘려서 나오네요. 
다른 곳에 올려놓았으니 참고하세요. https://gist.github.com/kijin/5829736 

주의사항: 

1. HTML 소스를 완전히 분해한 후, 안전하다고 검증된 태그, 속성, 이벤트만 다시 조합하여 
안전하고 오류 없는 소스를 생성해 주는 라이브러리입니다. 그만큼 처리속도가 느리다는 점 기억하시고, 
게시물 컨텐츠처럼 반드시 HTML이 필요한 경우에만 사용하세요. 
게시물 제목이나 댓글처럼 HTML이 필요없는 경우 그냥 htmlspecialchars 또는 strip_tags 사용. 
또한 페이지 표시할 때마다 매번 필터링하지 말고, DB에 저장하기 전에 한 번만 필터링하세요. 

2. 문법에 어긋나는 태그는 가차없이 제거하므로, HTML 소스가 아주 심하게 망가져있는 경우 주의하세요. 

3. 첨부파일 업로드를 사용한 XSS 공격은 게시물 내용과 별도로 막아주셔야 합니다. 
    http://www.phpschool.com/link/tipntech/78863 

iframe 동영상 허용 리스트는 이 게시판에 얼마전 레어닉님이 올려주신 라이브러리를 참고했습니다. 
http://www.phpschool.com/gnuboard4/bbs/board.php?bo_table=tipntech&wr_id=76911 

 

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 754
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4428
486 [파이썬] 텔레그램 봇으로 이미지 보내기 이니스프리 이니스프리 19.12.06.14:12 2134
485 [Python] Selenium에서 팝업을 허용하는 방법 이니스프리 이니스프리 18.11.01.21:37 2125
484 메일수신이 안된다고...? mail.yandex.com mx 리코드를 이용해보자 2 image djdisodo 18.02.21.17:04 2124
xss 공격 방어 라이브러리 jin**** jin**** 17.07.18.20:30 2092
482 [Python] HWP 파일 읽기 6 이니스프리 이니스프리 20.10.18.12:19 2089
481 [Python] BeautifulSoup에서 class명에 공백이 있을 때 검색 방법 이니스프리 이니스프리 21.02.13.00:26 2028
480 ABBYY FineReader의 OCR 언어 세팅 - 한국어(한글) vs 한국어 등 관련 이니스프리 이니스프리 18.11.05.16:07 2028
479 [Python] 현재시각에 따라 오전/오후 반환 이니스프리 이니스프리 20.07.16.13:58 2014
478 단위 명사의 띄어쓰기 (한컴워드의 맞춤법 검사를 믿지 마세요) 8 이니스프리 이니스프리 20.03.23.20:02 1974
477 윈도우 탐색기의 새로 고침 기능 자동화하기 2 이니스프리 이니스프리 18.11.13.13:59 1971
476 .tk(freenom) 로 접속이 안되는 분들이 요즘 왕왕보이네요. 15 image 마스터 마스터 16.10.05.13:40 1937
475 Youtube-DLG에서 10014 소켓 에러가 뜨는 경우 해결 방법 (방화벽 관련) 2 image 이니스프리 이니스프리 18.10.16.06:44 1881
474 그누보드에서 우측 aside(로그인) 없애고 회원가입을 봉쇄하는 방법 1 이니스프리 이니스프리 18.10.06.17:34 1836
473 [Python] 디렉토리 내의 파일명을 시간순으로 정렬하기 이니스프리 이니스프리 20.07.13.15:57 1833
472 [정리] 그누보드 관련된 몇 가지 소식들 이니스프리 이니스프리 18.12.29.15:32 1828
471 나라배움터 에러 발생 대처방법 이니스프리 이니스프리 20.05.01.20:59 1815
470 현 시점에서 홈 서버로 가장 적절한 미니 PC 중 하나를 추천 드립니다 image 이니스프리 이니스프리 19.10.26.20:10 1750
469 구글 드라이브 API 사용시 파일 소유자 변경 5 image 네모 네모 18.07.08.21:41 1744
468 glob.glob()를 이용하여 recursive하게 하위 폴더까지 모든 파일과 디렉토리를 검색하기 이니스프리 이니스프리 20.08.12.16:22 1739
467 [Scipy] Wasserstein distance를 이용한 두 이미지 간 유사도 측정 1 이니스프리 이니스프리 20.05.29.19:36 1722