- 5
- 마스터
- 조회 수 2950
안녕하세요.
지난번 접속 장애 건으로 면밀히 알아본 결과에 대해서 말씀드리고, 추가 작업에 대해 안내를 드립니다.
https://studyforus.com/notice/971686
지난 접속 장애 이슈를 검토하다보니, 주 디스크로 사용중인 SSD의 수명이 다 된 것을 발견하였습니다.
그로 인해, 서버의 경우 재 기동시 상태체크를 3분 정도로 굉장히 길게 하는데 그 과정에서 디스크 S.M.A.R.T 정보를 확인하는 중에 문제를 발견하여 재 부팅이 되지 않는 상황이 되어 부팅이 되지 않았습니다. (간만에 서버에 모니터 연결해서 작업했네요.)
감지된 디스크 문제는 SSD 제조사에서 보장하는 TBW 를 초과하게 되어 수명이 다 된 것으로 경고를 일으킨 것입니다.
어디까지나 제조사에서 보장하는 TBW 에 비례하여 수명을 측정하는 것이기 때문에 당장에 문제가 발생하는 것은 아닙니다. 그 계산상 수명이 0가 된 것 외에는 어떠한 문제도 발생하지 않고 있습니다.
서버용 SSD로 당시에도 수명이 길고, 조금 비싼 것으로 장착하였는데 생각보다 빨리 TBW에 도달하여 조금 놀랐습니다.
일단은 수명과 관련된 값은 단순 계산상의 수치이기 때문에 그냥 사용해도 큰 문제는 없지만 언제 문제가 발생할지 모르니 안정성을 우선순위로 하는 서버의 특성상 디스크 교체를 진행하려고 합니다.
디스크 교체를 진행하는 동안엔 작업 시간도 매우 길고 장시간 서버의 사용이 불가능 할 수도 있습니다.
다른 작업들과 달리, 디스크 교체 작업의 경우 원격으로 제어가 불가능기 때문에 직접 현장에 가서 작업을 해야 합니다. 때문에 평소처럼 새벽 시간대에 작업을 하지 못하는 점 양해 부탁드립니다.
작업 시간과 일정을 반드시 참고해주시고, 혹시나 해당 날짜에 절대로 작업하면 안되는 분이 계시면 댓글 남겨주세요.
스케쥴을 다시 조정하여 서버 작업을 진행하도록 하겠습니다.
- 작업 내용 : 서버의 디스크 교체 작업
- 작접 일시 : 2023년 10월 5일 (목요일)
- 작업 시간 : 15:00 ~ 21:00 (예정시간보다 일찍 작업이 끝날 수 있음)
- 주의 사항 : 디스크 교체 작업 전 개인적으로 백업을 꼭 진행해주시기 바랍니다.
서버를 일단 분해하여 다른 컴퓨터에서 디스크를 통째로 마이그레이션을 해야 하는 작업이기 때문에 쉽게 시간을 예측하기 어렵습니다.
최대한 빠르게 작업 후 작업 완료 공지를 작성하도록 하겠습니다.
감사합니다.