vSAN Cache disk 장애시 Disk Group 이 UI 상에서 보이지 않는 이슈

LAB 환경에 만들어 놓은 vSAN cluster 에서, 용량 문제로 인해서 Cache Tier SSD 에 문제가 생겼습니다. Nested 환경에서 불필요하게 Cache disk 를 크게 만들어놨더니 usage 문제가 생겼네요.

Nested 환경에서 Physical Disk 문제가 여러 호스트에서 동시다발적으로 문제를 야기했기 때문에, 어쩔 수 없이 강제로 Power off 를 하고 디스크 크기를 줄여서 다시 생성했습니다.

이것이 실제 Production 환경에서도 Cache 용 SSD disk 에 문제가 생기고, 하드웨어 레벨에서 offline 이 되버리면 이것과 동일한 현상이 발생합니다. 6.7 에서는 개선됬다고 하는데 확인해보지는 못했구요.

문제는 GUI 상에서 disk group 이 보이지 않기 때문에 기존 Disk group 를 삭제하는 작업이 UI 상에서는 불가능하다는 것입니다. CLI 로 확인해보면..

 

현재구성은 Cache Tier 1개, Capacity Tier 1개 구성입니다. Cache Tier 용 디스크가 이미 하드웨어적으로 제거된 상태이기 때문에, esxcli vsan storage list 커맨드에서도 보이지 않고 남아있는 Capacity Tier 디스크의 정보만 보입니다. 보시다시피, VSAN Disk Group Name 이 보이지 않습니다. 

아마 이게 GUI 상에서 보이지 않는 문제의 원인으로 생각됩니다. 정상적인 경우라면 Cache Tier 용 디스크의 UUID 과, vSAN Disk Group 의 UUID 가 동일한데, 해당 디스크가 빠졌기 때문에 보이지 않는 것 같습니다.

 

일단 이러한 상황에서는 esxcli 커맨드로 Disk group 을 제거해야 합니다.

SSD 디스크가 보이지 않는 상태이기때문에 -s 옵션은 사용할 수 없습니다. 현 상태에서는 uuid 로 지워야 합니다. esxcli vsan storage remove -u “VSAN Disk Group UUID”

 

지우고 나면 GUI 상에서 이렇게 claim 된 디스크가 없는것으로 나옵니다. 이제 다시 Disk Group 을 만들면 됩니다.

다만 위 작업을 수행하기 전에 resync 가 진행중인것이 없는지 꼭 확인하세요. 만약 진행중이라면 resync 끝나고 지우는걸 추천합니다.

 

 

 

 

Tags: # # #
댓글 없음

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

This site uses Akismet to reduce spam. Learn how your comment data is processed.