IT 이야기/GCP

GCP Quotas

클톡(CloudTalk) 2022. 4. 20. 23:17

Quotas (할당량)

GCP의 할당량은 사용자의 사용량이 예기치 않게 급증하는 것을 방지하고, GCP IDC(Internet Data Center)의 물리 리소스를 사용자들의 사용량의 확장 추세에 따라 GCP IDC(Internet Data Center) 물리 리소스 증설 및 GCP IDC(Internet Data Center)의 확장을 고려하는 매우 중요한 GCP 관리도구 입니다.

프로젝트 생성 이후 기본 Quotas (2022.04.20(무료 체험판 계정))

Regions CPUs NVIDIA T4 GPUs Persistent Disk SSD (GB) VM Instances
asia-northeast1 (도쿄) 24 1 500 GB 24
asia-northeast3 (서울) 24 1 500 GB 24
us-west1 (오리건) 24 1 500 GB 24
europe-west2 (런던) 24 1 500 GB 24

무료 체험판 계정을 사용하여 플랫폼을 살펴보는 경우 결제 계정의 가장 낮은 할당량에 비해 일부 리소스의 할당량이 매우 낮을 수도 있습니다. 프로젝트에 결제를 사용 설정하면 대부분의 서비스에 대한 할당량이 늘어납니다. GCP 사용량이 점차 늘어나면 할당량도 증가할 수 있습니다.

Quotas 증설 요청

현재까지 Quotas 요청에 대한 프로세스는 사용자가 직접 GCP Console을 이용한 직접 요청을 해야 합니다, API를 이용하는 방법등을 현재 계획하고 있다고 합니다 다만, 블로그 글이 작성되는 시간 기준으로는 GCP Console을 통한 사용자의 직접 요청만 가능합니다.

  1. IAM > 할당량
  2. 확장이 필요한 항목 체크 > 할당량 수정 > 정보 입력 > 요청 제출

Quotas 모니터링

  1. 모니터링 > 알림
  2. +CREATE POLICY
  3. MQL
  4. 코드 업데이트 > "RUN QUERY" > 차트를 확인

# 특정 영역(asia-northeast3.*)에서 INSTANCES(INSTANCES-per-project-region) 수량이 50%를 넘는 경우

fetch consumer_quota
| filter resource.service == 'compute.googleapis.com'
| { metric serviceruntime.googleapis.com/quota/allocation/usage
    | align next_older(1d)
    | group_by [resource.project_id, metric.quota_metric, resource.location],
        max(val())
  ; metric serviceruntime.googleapis.com/quota/limit
    | filter metric.limit_name == 'INSTANCES-per-project-region' &&
             resource.location =~ 'asia-northeast3.*'
    | align next_older(1d)
    | group_by [resource.project_id, metric.quota_metric, resource.location],
        min(val())
  }
| ratio
| every 1m
| condition gt(val(), 0.5 '1')

(100%를 1로 표현하기 때문에, 쿼터 250중 1대만 구동중에 있어, 1/250*1 = 0.004)

위의 모니터링 방법 외에도 GCP Console, CLI, Service Usage API, Cloud Monitoring 대시보드 등을 통하여 확인이 가능합니다.

Quotas 상향 요청

대부분의 할당량 상향 조정 요청은 리소스 가용성, Google Cloud 사용 시간, 기타 요인 등 엄격한 기준에 따라 자동화 시스템에서 평가합니다. 특정 기준을 충족하지 않는 요청은 거부됩니다. 자동 검토 평가 기준은 모든 고객의 공정성을 보장하고 프로세스 조작 시도를 방지하기 위해 공개되지 않았습니다. 할당량 상향 조정 요청이 검토자에게 에스컬레이션되는 경우도 있습니다. 검토자는 엄격한 기준을 따르지만 고유한 상황을 고려할 수 있습니다.
할당량 상향 조정 요청은 일반적으로 2~3일(영업일 기준) 이내에 요청을 처리하는 클라우드 고객 관리에서 처리합니다.

클톡! 경험톡!

1. 프로젝트 생성시 자동 할당되는 수치를 GCP로 요청하여 조율해 볼수 있습니다.
2. 대부분의 서비스가 할당량의 제약을 받고 있다고 생각하고 구성 및 모니터링을 진행해야 합니다.
3. Quotas 증설을 막고, 비용 검토 프로세스를 만들기 위해서는 프로젝트 Owner 권한에서 Quotas 관련 권한을 제외한 Custom Roles을 생성한 이후 발급해야 합니다. 다만, Custom Roels의 업데이트 및 관리는 사용자 영역입니다
4. GPU 또는 특정인스턴스 타입을 수천코어 등의 예외적인 요청을 할 경우 수개월이 소요될수 있습니다.
5. 4번에 대한 내용으로 GCP IDC(Internet Data Center)에서도 물리적인 확장이 필요할 경우, 위와 같은 수천코어중 일부에 대한 약정 등을 제시할수 있습니다.
6. 글로벌 서비스를 고려할 경우 N/W환경에서의 차이가 크지 않은 서비스를 할 경우 GCP Regions의 Capa를 확인해 보는것도 좋다 (Capa의 차이에 따른 비용 절감 및 Quotas 승인 과정이 빠름)

참조

서비스 할당량 관리

리소스 할당량

할당량 작업

할당량 측정항목 차트 생성 및 모니터링

Google Cloud metrics

Monitoring API에서 MQL 사용