이번에는 여러 대의 서버 인스턴스로 운영하는 방법을 설명한다.
여러 대의 서버를 운영하는 이유 크게 2가지가 있다.
1. 많은 트래픽에 대응 하기 위해
2. 서버에 장애가 생겨도 서비스가 안전하게 돌아갈수 있게 하기 위해
※ 트래픽을 감당하기 위해 서버의 수를 늘려 대응(scale out) 하는 다중 서버 환경
※ 단순히 서버의 수를 늘리는 것 뿐만 아닌 트래픽에 따라 서버의 수를 자동으로 늘리고 줄이는 자동 조정(auto scaling)
※ 장애로 서버 중 한대가 서비스 불능 상태가 돼도 다른 서버들이 이를 대신 요청을 처리하는 장애 조치
에 대해서도 설명하겠다.
AWS Auto Scaling 그룹은 AWS에서 제공하는 자동 다중 서버 서비스다.
Auto Scaling 그룹은 같은사양, 같은환경, 같은코드를 가지고 있는 똑같은 EC2 인스턴스들이 묶음이다.
똑같은 인스턴스들이 여러 대 존재할 수 있는 이유는 같은 AMI를 이용해서 만들어진 인스턴스들이기 때문이다.
그리고 Auto Scaling 그룹이라는 이름에서 알수 있듯이, 이 서비스는 인스턴스들의 수를 자동으로 늘리고 줄여준다
ex) 사용자가 많이 몰리는 경우 서버의 수를 늘리고 사용자가 없으면 서버의 수를 자동으로 줄임
이것은 최대 사용자에 대비해서 모든 서버를 24시간 가동해두는 기존방식과 비교했을때
실시간 트래픽 등의 변수를 반영해서 인스턴스의 수를 조정하기 때문에
훨씬 안정적으로 서비스를 운영할수있으며 비용도 크게 절감할수있다.
또한 어떤 이유로 Auto Scaling 그룹 내 인스턴스의 수가 변했는지 이력을 조회하거나 이메일로 받아볼 수 있다.
물론 Auto Scaling 그룹 내 모든 서버 인스턴스들에 대한 정책을 걸어야한다
ex) 10분동안 CPU 90%넘어서면 Auto Scaling그룹에서 똑같은 인스턴스를 하나 더 생성
'👨🏻💻Infra > 🌎Cloud' 카테고리의 다른 글
[Cloud] Openstack Wiki Release Table (0) | 2021.03.16 |
---|---|
[Cloud] AWS 보안 그룹 (1) | 2020.04.10 |
[Cloud] AWS EC2 접속 (0) | 2020.04.10 |
[Cloud] AWS EC2 생성 (0) | 2020.04.10 |
[Cloud] AWS EC2 개념 (0) | 2020.04.10 |