- 9
- 이니스프리
- 조회 수 1538
안녕하세요?
파이썬에 대한 질문이라기보다는 윈도우 NTFS에서 확장자의 대소문자가 구별되는지에 대해 궁금한 점이 있어서 질문 드립니다.
파이썬 3.4 이상에서 pathlib 라이브러리를 사용할 수 있다고 알고 있습니다.
pathlib.Path(file).suffix로 파일의 확장자를 알 수 있구요.
윈도우7 환경에서 이 라이브러리를 사용하는데 궁금한 점이 있네요.
import os, pathlib
target = '경로'
list = []
for path, subdirs, files in os.walk(target):
for name in files:
list.append(os.path.join(path, name))
ext_list = ['.TXT', '.MHT', '.URL'] # 1번
ext_list = ['.txt', '.mht', '.url'] # 2번
if any(ext in pathlib.Path(file).suffix for ext in ext_list):
print(file)
1번과 2번의 실행결과가 다른데요 ㄷㄷ
혹시나 해서 찾아봤는데 폴더명이나 파일명에 2바이트 문자는 없더군요.
윈도우 NTFS에서 확장자의 대소문자가 구별되나요??
구별이 된다면 원칙적인 형태는 대문자 vs 소문자 중 어느 것인가요??
만약 구별이 된다면... CMD에서 del 파일명.txt와 del 파일명.TXT의 결과가 달라지겠네요??
물론 위 스크립트에서 발생하는 문제는 .lower() 메서드를 if 문에 넣으면 해결할 수 있는 문제이겠죠.
이와 관련하여 pathlib의 github에 문의하려고 했으나, 아쉽게도 이런 페이지는 없는 것 같구요 ㅠㅠ
혹시 pathlib2를 사용해서 해결해야 되는 문제인가요??
그럼 내일부터 추워진다는데 감기 조심하세요~
스포어 회원님들께 항상 감사드립니다!
작성자
댓글 9
바쁘신데 테스트해주셔서 감사합니다!
저도 그렇게 알고 있었는데 어제는 저의 실수로 인해서 당황했네요 ㅠㅠ
그럼 저녁식사 맛있게 드세요 :)
밑에 humit 님이 설명해주신대로 윈도우의 경우 대소문자를 구분하지 않고, 리눅스는 구분을 합니다.
리눅스에서 실행파일이 StudyForUs 로 되어 있는 경우 studyforus 로 실행하면 실행이 되지않는 불상사가 발생합니다. ㅠㅠ
그렇군요~ 리눅스에서는 특히 주의를 해야겠네요!
감사합니다 ^-^
1. 윈도우의 경우에는 대소문자 구분이 없습니다. 반면 유닉스 계열의 경우에는 대소문자 구분이 있습니다.
그래서 pathlib 모듈에 대한 설명 페이지를 보시면, PosixPath와 WindowsPath로 나누어서 구현이 되어 있습니다.
2. 다만 해당 코드에서는 대소문자 구분이 되게 됩니다. 윈도우에서 대소문자가 구분되지 않는다는 것이 파일/폴더 경로나 이름에 해당하는 내용이기 때문입니다.
그래서 윈도우에서 pathlib.Path("abc.txt") == pathlib.Path("abc.TXT")를 실행했을 때의 결과가 같습니다.
다만 suffix의 반환 값은 문자열이며 이 문자열은 파일 경로를 기반으로 해서 생성을 하는 것이기 때문에 대소문자가 구분이 됩니다.
결론은 Path 객체로 비교하는 경우에는 대소문자를 구분하지 않지만 거기서 suffix와 같이 문자열을 추출하는 것은 입력된 문자열을 기준으로 별다른 처리 없이 뽑아내는 것이므로 대소문자가 구분됩니다.
1. 윈도우와 유닉스 계열이 다르군요! 앞으로 주의하겠습니다~
2. pathlib.Path() 객체의 경우와 .suffix 메서드를 사용하여 문자열을 반환받는 경우가 다르군요 ㅎㄷㄷ
제가 거기까지는 미처 생각하지 못했네요 ㅠㅠ
굳이 .suffix를 사용하려면 대소문자를 모두 처리해주는 로직을 사용해야 모든 파일이 포함되겠군요!
어제 이 문제로 밤 늦게까지 고민했는데 단칼에 정리해주셔서 감사합니다~
그럼 humit 님께서도 날씨가 추워졌는데 감기 조심하세요!
1. 윈도우찡은 대소문자 구분이 없습니당.
wInDoWs Xp miCroSoFt zZangZzangmAN :)
2. 유닉스 계열은 구분합니다.
Dennnis R itchie maketh Unix.
3. 다만 맥에서는 상황이 좀 다릅니다. 기본 옵션은 비구분이구요, 구분하는 볼륨으로 생성도 가능합니다.
MacoS HaS A caSe InSENsItiVe oPtiOn aS dEfauLt. But if you want, you can make case sensitive volume and use it as system volume.
4. 맥 엘캐피탄 부터는 Case Sensitive 볼륨 생성이 불가능하게 바뀌었습니다. 커맨드라인으로는 아직 가능하겠지만, 아무튼 공식적으로는요.
El CaPItan HATeS caSE senSiTive VolUmE.
+. 이전부터 맥에서는 대소문자 구분을 제대로 안하다보니 여러 충돌이 많았다고 하네요.
어도비 CC 같은 경우는 Case Sensitive 볼륨에서 설치 자체가 불가능 하기두 하구용.
윈도우찡은 구분이 없고, 유닉스 계열은 구분을 하는군요 ㄷㄷ
그리고 맥에서는 복잡하군요 ㅠㅠ
제가 맥북에어를 사놓고도 솔직히 많이 활용하지 않아서 미처 몰랐습니다.
그럼 네모 님께서도 바쁘시겠지만 점심식사 맛있게 드시고 좋은 오후 되세요!
네모 님께 항상 감사드립니다 ^-^
네모 님께서 XP쨩을 말씀하셔서 퍼왔습니다~
제가 알기로는 대소문자의 구분은 없을 것 같습니다.
커맨드 창을 이용해서
echo 123 > tes.txt 명령어를 이용해 만들어진 test.txt 파일을 확인해보면 123 이 들어있고,
echo 456 > test.TXT 명령어로 시도해보면 test.txt 파일에 456 으로 덧씌워지는 것을 볼 수 있네요~