본문 바로가기

Failover Cluster

클러스터 장애조치 임계 값

장애 조치(FailOver)

서버 클러스터의 개별 응용 프로그램에서 오류가 발생하지만 노드에서는 발생하지 않을 경우 클러스터 서비스는 대개 동일한 노드에서 응용 프로그램을 다시 시작하려고 합니다. 이 시도가 실패하면 클러스터 서비스는 해당 응용 프로그램의 리소스를 서버 클러스터의 다른 노드로 이동하여 다시 시작합니다. 이 프로세스를 장애 조치라고 합니다

<2node의 windows server 2003 Failover Cluster 기본 임계 값>


<2node의 windows server 2008 R2 Failover Cluster 기본 임계 값>


그룹에 대한 장애 조치 정책은 그룹을 오프라인 상태로 만들기 전까지 지정한 시간(기간) 안에 그룹에 대해 수행할 수 있는 장애 조치 최대 횟수(임계 값)입니다. 그룹 장애 조치가 이 횟수보다 더 많이 수행될 경우 클러스터 서비스에서는 해당 그룹을 오프라인 상태로 놓아 둡니다. 예를 들어 그룹 장애 조치 임계값을 5로 설정하고 장애 조치 기간이 3으로 설정할 경우 클러스터 서비스에서는 그룹에 대해 3 시간 동안 5번까지 장애 조치를 수행합니다. 해당 그룹의 리소스에 6번째 오류가 발생할 경우 클러스터 서비스는 해당 그룹의 다른 모든 리소스도 오류로 처리하며 해당 그룹에 대한 장애 조치를 수행하는 대신 전체 그룹을 오프라인 상태로 둡니다.

Windows server 2008 R2의 클러스터 장애조치 임계 값이 n-1(노드 수 -1) 값으로 주어집니다. 이전 환경에서는 값이 맞지 않는 버그가 존재 하였습니다.

이와 같은 이유로 2node로 구성된 Windows server 2008 Failover cluster에서 클러스터 그룹 리소스에 대한 Failover Simuliate를 진행 할 경우 처음 한 번은 진행이 되지만 두번 째 시도 할 경우 해당 그룹이나 노드가 Failover 되지 않습니다.

자세한 내용은 아래의 KB를 참조 하시기 바랍니다.