[TechEdNA2011]Review : Failover Clustering: Pro Troubleshooting in Windows Server 2008 R2

https://channel9.msdn.com/Events/TechEd/NorthAmerica/2011/WSV309

TechEd 동영상을 MP4로 다운로드 받아서 출퇴근 하면서 듣고 있습니다. 너무나 좋은 내용들이 많은데 일부를 소개하고자 합니다.

2008은 모든 Software가 logo를 가지고 있고 Validate test를 통과하면 지원 대상이다.
Online 되어 있는 Disk는 Validate 대상이 아니다.
CSV는 Validate 하기전에 Offline 으로 변경해야 한다.
모든 node 에서 Validate를 해야 올바른 정보를 얻을 수 있다.
PowerShell "Test-Cluster"
cluster.exe는 더 이상 update 되지 않을 것이다. PowerShell을 사용해라.
Cluster.log 는 ETW 로 변경되었다.
문제 분석시에 Cluster 에 대한 Event log를 보고 System Event log, Application Event log를 살펴 본다.
최초 발생한 문제에 집중하고 이후 발생하는 문제들은 무시한다.
Cluster log는 ETL 파일로 저장되고 3개의 ETL 파일에 각각 100MB 의 크기를 가진다.
Cluster log 에서 [ERR], -->failed로 검색을 하며 net helpmsg로 에러 코드의 메시지를 확인한다.
CNO가 삭제 되었을 경우 CreatingDC와 GUID 값을 가지고 복원할 수 있다.
CSV 문제 해결 -
Network 이나 AD 이슈가 Event log에 있는지 확인
Server 와 Workstation service가 시작 되어 있는지 확인
Cluster network이 SMB를 사용하도록 설정되어 있는지 확인
Coordidator node 에서 파일 복사 시도
CSV를 가지지 않은 노드에서 net use 명령을 IP를 사용해서 정상적으로 공유가 보이는지 확인
NTLM이 disable 되어 있는지 확인
DC와 인증이 되는지 확인
Resource가 응답하지 않아서 RHS가 종료되고 다시 시장될 수 있다.
Cluster Service가 응답하지 않아서 BugCheck 0x9E 발생할 수 있다.
WMI 가 offline 되어 있으면 Cluster 생성, 노드 추가, Migration 문제들이 생길 수 있다.
WMI test 방법
wbemtest - select : root\mscluster - Use authentication level : Packet Privacy - query : select * from MSCLuster_Resource

감사합니다.