간만에 UCS 관련해서 썰을 풀어봅니다.
3세대 UCS 가 나오면서 시스코에서 강력하게 푸시하고 있다고 생각되는게 Stateless computing 입니다. 물론 이전세대에도 Stateless computing 이 가능했었죠. Blade 타입인 B-Series 에선 가능했습니다. 서비스 프로파일을 가지고 가능했었죠.
본격적인 썰을 풀기에 앞에 Stateless computing 이 어떤 것인지 용어정리부터 한번 하겠습니다. 이게 이해가 안되면 뒤에 내용도 이해가 안될꺼니까요..
일반적으로 서버내의 하드웨어 컴포넌트들은 고유의 속성값을 가지고 있습니다.
NIC 이라면 MAC address, HBA 라면 WWN 값 등과 같은 고유의 속성값을 가지고 있고 이 값들은 보통 유일합니다. 그외에 UUID 라던지 펌웨어나 BIOS 버전 등등.. 고유한 값들을 가지고 있습니다.
하드웨어가 바뀌면 이러한 주소들도 변경이 되지요. 똑같은 서버라 하더라도 Logical 하게는 동일하지 않다라고 볼 수 있겠습니다.
근데 보통 서버 하드웨어에 장애가 났는데 당장 복구가 불가능한 장애라면 다른 예비서버에서 보통 복구를 하게 마련입니다. 근데 Mac address 라던지 WWN 값이 바뀌면 해주어야 할일이 많죠.. 예를 들면 다음과 같은것들.. (출처 : 네이버 VMware Infrastructure 카페 임원석님 – Boot from SAN 환경에서 서버에 장애가 발생하였을 경우)
- 원본 서버의 케이스를 열고 FC-HBA 카드를 제거한다.
- 스페어 서버의 케이스를 열고 FC-HBA 카드를 장착한다.
- 스페어 서버에 새로 장착된 FC-HBA 에 케이블을 연결한다.
- 스페어 서버를 Power On 한다. 이때 원본 서버의 BIOS 값과 동일한 설정이 되어 있는지 확인한다.
- 설정 값 확인 후 FC SAN 스토리지 LUN 으로 부팅 완료
- 부팅 완료 후 VMware HA Cluster 로 다시 자동으로 Rejoin
이런 경우가 발생할 수 있는데 이런 경우는 동일한 FC-HBA 를 사용하니까 사실 그나마 좀 간단한 일이죠. 그런데 FC-HBA 카드 자체가 불량이 날 경우라면 추가적인 작업이 필요합니다. HBA 가 바뀌니까 WWN 값도 바뀌겠죠. 일차적으로 SAN 스위치에서 WWN 조닝 구성을 바꾸어 주어야 하고 FC-HBA 에서 제대로 LUN 이 인식되는지도 확인해야 합니다. 작업이 많아지니까 시간도 오래걸립니다.
그럼 이렇게 되면 어떨까요? wwn 이나 mac address 등이 가상화 되어 서버가 변경되더라도 동일한 bios, 펌웨어, mac address, uuid, wwn 값을 동일하게 가져갈 수 있다면? Hardware 에 independent 하다면? 아주 좋겠죠.
거기서 나오는 것이 바로 Stateless computing 입니다. UCS 에서는 Service Profile 이라는 것으로 Stateless Computing 을 구현합니다. Service Profile 은 서버의 논리적인 정보입니다. 다음과 같은 내용이 들어갑니다.
- Identity – UUID, MAC, WWN 등
- Configuration – Server requirements, 부팅 순서, 펌웨어 등
- Connectivity – VLAN, VSAN, QoS 등
물론 여러개의 Serivce Profile 을 만들 수 있고, 하나의 블레이드가 작동하기위해서는 반드시 하나의 Service Profile 에 연동되어야 합니다. 물론 Service Profile 간의 논리적인 정보들은 중복되지 않습니다.
이 서비스 프로파일이 UCS Blade 서버의 가장 큰 특징중 하나이고, 가장 중요한 내용이기도 하죠..
근데 오늘 쓰는 내용은 UCS Rack-mount 타입에서도 Service Profile 을 이용한 Stateless Computing 이 구현 가능하다 라는 내용입니다.
구성은 위와 같습니다. 위와 같은 구성을 하게 되면 onboard NIC 은 데이터 트래픽은 돌아다니지 않고, 매니지먼트 트래픽 용으로만 사용하게 됩니다. 데이터 트래픽은 CNA 카드나 VIC 카드를 통해 돌아다니게 됩니다.
별다른 특이한 점은 없지만, Nexus 2232PP 가 들어가있네요. 아시는 분은 알겠지만 Nexus 2232PP 는 Remote 라인카드 처럼 동작해서 단독으로는 사용할 수가 없습니다. 근데 상단의 6248 FI 에 연결이 되어있네요. 이게 어떻게 가능할까요? 그것은 6248 FI 가 Nexus 5000 시리즈와 동일한 하드웨어 아키텍처를 가지고 있기 때문입니다… 라고 저는 추정하고 있습니다.-_-;;
아무튼 UCS Manager 에서 Blade 뿐만 아니라 Rack-mount 관리(펌웨어등)도 같이 가능하고, 블레이드 장애시 동일한 내용으로 랙마운트서버에서 복구할 수 있다는 것. 그게 포인트인거죠.