클러스터 C3: 네트워크 및 보안
DNS 레코드가 가용성에 미치는 영향
DNS 는 정적인 인프라처럼 보이지만 TTL, 레코드 전환, 해석 경로의 작은 실수가 실제 장애를 크게 키웁니다.
가용성을 가장 자주 깨뜨리는 DNS 실수
TTL 이 너무 길면 오래된 캐시가 남고, A/AAAA 불일치는 네트워크별로 다른 결과를 만들며, 끊어진 CNAME 은 전환 후 요청 실패를 부릅니다.
문제는 이런 장애가 한 번에 터지지 않고 지역과 리졸버별로 천천히 나타난다는 점입니다.
전환 전후에 꼭 할 점검
- 변경 직전이 아니라 충분히 앞서 TTL 을 낮춥니다.
- 대상 레코드, 인증서 체인, 오리진 준비 상태를 사전 검증합니다.
- DNS 해석 결과와 애플리케이션 건강 상태를 함께 모니터링합니다.
실무 입력/출력 예시
입력
A 레코드 TTL: 3600 전환 시각: 10:00 UTC
출력
24시간 전에 TTL 300 으로 낮춤 전환 후 전파 리스크 감소