• 목록
  • 아래로
  • 위로
  • 0
  • jin****
  • 조회 수 2094

흔히 가장 막기 어렵다고 알려진 공격 중 하나가 XSS(cross-site scripting)입니다. 
간단히 소개하자면 게시물의 제목, 내용 등에 <script> 태그를 넣거나 
또는 그와 비슷한 역할을 하는 onmouseover 이벤트 등을 사용하여 임의의 자바스크립트를 실행하는 공격이지요. 
그래서 대부분의 게시판 솔루션들이 정규식을 사용해서 의심스러운 태그를 걸러내고 있지만, 
그것마저 뚫렸다며 급히 패치를 바란다는 공지사항을 종종 보게 되지요. 

그러나 사실 XSS 필터링은 그렇게 어려운게 아닙니다. 발상이 잘못되었기 때문에 어렵게 보이는 것 뿐입니다. 
이 게시판에도 종종 올라오는 XSS 필터링 라이브러리들, 
그리고 대부분의 공개형 게시판 프로그램들이 사용하는 필터링 알고리듬에는 두 가지 치명적인 허점이 있습니다. 

1. 위험한 태그, 속성, 이벤트만 콕콕 찍어 막으려고 하는 blacklisting 기법을 사용한다. 
2. HTML에 오류가 있거나 웹표준에 어긋나는 태그를 사용한 경우를 감안하지 않는다. 



blacklisting은 수많은 태그, 속성, 이벤트들 중 "위험하다고 알려진" 것들만 블랙리스트에 등록해서 
블랙리스트에 등록된 태그, 속성, 이벤트만 지우고, 나머지는 모두 허용해주는 방법입니다. 
만약 HTML5처럼 새로운 태그나 속성이 생기면 블랙리스트에 아직 없으니 모두 허용해 버리게 됩니다. 
만약 사용하기에 따라 위험할 수도 있는 속성이 블랙리스트에서 빠졌다면 그것도 허용해 버리게 됩니다. 
무엇이 허용되는지조차 분명하지 않으니 자나깨나 땜빵하느라 고생이 많습니다. 

반면, "안전하다고 증명된" 태그, 속성, 이벤트만 화이트리스트(블랙리스트의 반댓말)에 등록해서 
리스트에 등록된 것들만 허용하고 나머지는 죄다 없애버리는 whitelisting 기법을 사용한다면 
새로운 태그나 속성이 추가되더라도 걱정이 없습니다. 



HTML 오류에 신경쓰지 않는 필터링 라이브러리도 문제입니다. 
대부분의 필터링 라이브러리들은 정규식을 사용해서 태그를 걸러내는데, 
중간에 널바이트 또는 공백이 끼어 정규식에 잡히지 않는 엉터리 HTML도 
대부분의 브라우저들은 아무 일 없다는 듯 실행해 주고 있는 것이 현실입니다. 
onmouseover 이벤트는 걸렀지만 on\0mouseover 이벤트는 거르지 못하고, 
javascript: 링크는 잡았지만 java  script: 링크는 잡지 못하는 거죠. 
심지어는 이런 것도 있습니다: <img """><script>alert("XSS")</script>"> 

위와 같은 문제를 해결하려면 태그가 잘못된 것도 걸러내줘야 합니다. 
예를 들어 <img> 태그에 src 속성 대신 스크립트가 들어가 있으면 막아야 하는 거죠. 
잘못된 태그를 다 걸러내주면 짝 없는 <div> 태그 때문에 홈페이지 레이아웃이 깨지는 것도 막을 수 있습니다. 



HTML Purifier는 해외의 보안 전문가들로부터 철저하게 검증받은 필터링 라이브러리입니다. 
whitelisting 기법을 사용하고, 잘못된 태그도 확실하게 걸러내줍니다. 
이걸 사용하면 앞으로 아주 오랫동안 XSS 취약점 걱정은 하지 않아도 됩니다. 
http://htmlpurifier.org/ 

아래의 참고소스 란에 사용방법 예제를 넣었더니 내용이 많아서 그런지, 잘려서 나오네요. 
다른 곳에 올려놓았으니 참고하세요. https://gist.github.com/kijin/5829736 

주의사항: 

1. HTML 소스를 완전히 분해한 후, 안전하다고 검증된 태그, 속성, 이벤트만 다시 조합하여 
안전하고 오류 없는 소스를 생성해 주는 라이브러리입니다. 그만큼 처리속도가 느리다는 점 기억하시고, 
게시물 컨텐츠처럼 반드시 HTML이 필요한 경우에만 사용하세요. 
게시물 제목이나 댓글처럼 HTML이 필요없는 경우 그냥 htmlspecialchars 또는 strip_tags 사용. 
또한 페이지 표시할 때마다 매번 필터링하지 말고, DB에 저장하기 전에 한 번만 필터링하세요. 

2. 문법에 어긋나는 태그는 가차없이 제거하므로, HTML 소스가 아주 심하게 망가져있는 경우 주의하세요. 

3. 첨부파일 업로드를 사용한 XSS 공격은 게시물 내용과 별도로 막아주셔야 합니다. 
    http://www.phpschool.com/link/tipntech/78863 

iframe 동영상 허용 리스트는 이 게시판에 얼마전 레어닉님이 올려주신 라이브러리를 참고했습니다. 
http://www.phpschool.com/gnuboard4/bbs/board.php?bo_table=tipntech&wr_id=76911 

 

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 970
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 4646
551 [Python] random 함수가 계속하여 동일한 결과를 출력할 때 해결방법 이니스프리 이니스프리 2일 전19:32 57
550 색상선택 결정문제를 겪고 계신 분들 위한 사이트 OAUTH2 20.06.19.18:22 69
549 트래픽 절감 관련 모 커뮤니티 사이트의 회의 결과 이니스프리 이니스프리 3일 전16:51 69
548 database 백업 및 복원을 지원하는 site입니다. 해피보이 20.06.03.20:52 77
547 [펌] Chrome will soon be less of a memory hog in Windows 10 3 이니스프리 이니스프리 20.06.24.00:12 82
546 [Python] Ubuntu에서 파이썬이 설치된 디렉토리를 간단히 확인하는 방법 2 이니스프리 이니스프리 20.08.03.22:58 88
545 [Python] SSL: CERTIFICATE_VERIFY_FAILED에 대한 대처 방법 (2) 이니스프리 이니스프리 24.05.05.21:04 94
544 [Javascript] 값을 이용하여 배열의 요소를 삭제하는 방법 이니스프리 이니스프리 21.04.13.22:10 97
543 순수 React만으로 다이내믹 태그 네이밍하기 Seia Seia 20.01.20.19:18 104
542 React 그리고 Redux 쉽게 이해하기 image Seia Seia 20.09.12.06:31 104
541 [Python] 문자열에서 파일명 또는 폴더명으로 시스템상 지원되는 글자를 제외하고 삭제하기 이니스프리 이니스프리 20.11.01.14:37 105
540 [Python] Tabulate 모듈로 작성한 테이블을 파일로 저장할 때 에러가 발생하는 경우 이니스프리 이니스프리 24.04.20.23:45 105
539 나리야 익명보드 및 내 글 알림 관련 Q&A image 이니스프리 이니스프리 21.02.14.17:30 107
538 [Python] 크롤링한 bytes를 string으로 변환 이니스프리 이니스프리 21.02.14.15:32 109
537 [KT] 오피스넷 가정 설치 관련 이니스프리 이니스프리 24.05.05.00:28 111
536 중국 배대지 휴무 이니스프리 이니스프리 20.01.14.13:01 112
535 [Python] 3개의 list를 하나의 dictionary로 변환하기 이니스프리 이니스프리 20.06.10.21:47 114
534 IPVanish의 한국서버가 4개로 확충되었습니다. image 이니스프리 이니스프리 20.01.11.11:27 116
533 헷갈리는 출생지를 가진 인물들 1 이니스프리 이니스프리 20.06.26.21:09 116
532 MS Office 제품군 명칭 변경 image 이니스프리 이니스프리 20.07.02.18:05 116