• 목록
  • 아래로
  • 위로

저는 파이썬에 대해 아주 기초적인 내용만을 알고 있습니다 ㅠㅠ


나중에 수정해야 할 부분이나 새로 추가해야 할 부분을 발견하게 되면 보완하도록 하겠습니다.



1) 파이썬3은 파이썬2와 달리 UTF-8이 디폴트이기 때문에 #-*- coding:utf-8 -*- 이 구문은 불필요합니다.



2) 스트링의 인코딩과 관련해서는 파이썬 2.X와 표현이 조금 달라진 점이 있습니다.



s = "한글" 
u = str(s, "utf-8")



3) 변수에 담긴 문자열에 인코딩 문제가 발생하면 다음과 같이 해결하시면 됩니다 ^^



var_string = var_string.decode('cp949').encode('utf-8')




4) 외부 라이브러리의 인코딩을 설정하려면 다음과 같은 방식으로 하시면 됩니다.



import sys

reload(sys)

sys.setdefaultencoding('utf-8')




5) 입출력과 관련해서는 다음과 같은 방식으로 처리하시면 됩니다.



with open('euc_kr.txt', encoding='euc-kr') as f:

또는

f = open("utf8.txt", 'w', encoding='UTF-8')




6) 아톰 계열의 에디터에서 문제가 발생하면 다음과 같은 내용을 스크립트에 추가하시면 됩니다.



import sys

import io

sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding = 'utf-8')

sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding = 'utf-8')




추가) Beautifulsoup에서의 인코딩은 다음과 같이 처리합니다.



soup = BeautifulSoup(html, 'html.parser', from_encoding='euc-kr')



작성자
이니스프리 119 Lv. (1%) 2534330/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 3

NoYeah
profile image
cp949를 따로 지정하는 것을 보니 윈도우와 utf-8의 간극 때문에 설정해줘야 하는 현상 같군요.

2바이트 문자권인 한글로 인해 항상 문제가 생기는 것 같습니다. ㅠㅠ
comment menu
2018.11.06. 16:39

신고

"NoYeah님의 댓글"

이 댓글을 신고 하시겠습니까?

이니스프리 작성자 → NoYeah
profile image

현재 윈도우 커널에 유니코드가 적용되었음에도 불구하고

윈도우 95 시절의 CP949를 왜 아직도 윈도우의 디폴트 인코딩으로 사용하는지 모르겠어요.

그리고 일부 웹사이트에서 CP949를 아직도 사용하더군요 ㅠㅠ

심지어 인코딩으로 EUC-KR을 선언해 놓고서 CP949로 인코딩된 페이지를 보내는 웹사이트들도 있어서 헷갈리더군요.


여담이지만 인코딩 문제에 아주 민감하신 분들은 

커널에 직접 접근하는 보안프로그램은 2바이트 문자권의 언어가 아닌 영문판을 사용하길 권한다고 말씀하시기도 하더군요.

comment menu
2018.11.06. 16:45

신고

"이니스프리님의 댓글"

이 댓글을 신고 하시겠습니까?

NoYeah → 이니스프리
profile image
인코딩을 연구하다보면 왜 영어가 세계 표준으로 사용되는지 이해가 되긴 하더라구요.
comment menu
2018.11.06. 17:34

신고

"NoYeah님의 댓글"

이 댓글을 신고 하시겠습니까?

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [1차 해결 및 추가] 서버 접속 불가 문제 안내 12 updated 마스터 마스터 6일 전15:22 199
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 2254
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 5939
176 이제 Github에서 팀 Private 저장소가 무료! (GitHub is now free for teams) title: 은메달도다 20.04.16.02:10 1036
175 가상PC(vmware,virtualbox)에서 사용가능한 리눅스 배포본 해피보이 20.04.25.10:28 392
174 [어도비 프리미어] 2020년 4월 릴리즈(14.1)의 버그 이니스프리 이니스프리 20.04.27.23:42 222
173 [어도비 프리미어] MME device internal error의 해결방법 image 이니스프리 이니스프리 20.04.29.22:20 464
172 나라배움터 에러 발생 대처방법 이니스프리 이니스프리 20.05.01.20:59 1830
171 개인용 vs 기업용 라이선스에 대해 11 이니스프리 이니스프리 20.05.05.12:18 5446
170 [파이썬] 리스트 내 알파벳의 위치를 리스트로 반환하는 함수 5 이니스프리 이니스프리 20.05.05.20:56 1062
169 [링크] 그누보드/아미나에서의 추천/비추에 대한 취소 기능 2 이니스프리 이니스프리 20.05.09.11:59 231
168 나라배움터 임시 점검 이니스프리 이니스프리 20.05.12.11:16 241
167 [Openpyxl] 성명, 생년월일을 담은 리스트를 정렬하여 엑셀파일로 저장하는 함수 이니스프리 이니스프리 20.05.13.19:13 968
166 [Python] URL에서 파일을 다운받지 않고 파일용량를 알아내는 방법 3 이니스프리 이니스프리 20.05.13.21:01 297
165 [Python] 확장자를 지정할 수 있는 백업 스크립트 이니스프리 이니스프리 20.05.13.21:58 204
164 [Python] 윈도우에서 파이썬이 설치된 경로를 확인하는 방법 이니스프리 이니스프리 20.05.13.22:13 199
163 [CMD] 작업 스케줄러에서 Batch 파일을 최소화한 상태로 실행하기 1 이니스프리 이니스프리 20.05.13.23:15 4203
162 [CMD] 어제 날짜를 구하는 Batch 파일 - VBS를 이용하되 별도의 VBS 파일을 두지 않는 방법 이니스프리 이니스프리 20.05.14.11:48 934
161 이미지 사이즈 줄이는 대표 사이트3 7 마당쇠15 마당쇠15 20.05.14.18:08 268
160 [Python] 최적화된 윈도우용 Tensorflow가 있는 Github repository 이니스프리 이니스프리 20.05.20.18:47 154
159 [Autohotkey] 특정시간까지 매분 정각에 다른 스크립트 파일을 실행하기 3 이니스프리 이니스프리 20.05.21.21:57 1687
158 이미지 누끼 자동으로 따 주는 사이트(백그라운드 제거) 2 마당쇠15 마당쇠15 20.05.24.07:02 403
157 [Python] 스크린 캡쳐하는 모듈 이니스프리 이니스프리 20.05.25.21:30 2426