집계 쿼리는 데이터베이스에서 데이터를 요약하고 통계를 계산하는 데 사용되는 중요한 도구입니다. 이 챕터에서는 Google BigQuery에서 집계 쿼리를 수행하는 방법과 주요 집계 함수에 대해 살펴보겠습니다. 집계 함수는 데이터의 그룹화 및 요약에 사용되며, 데이터 분석 작업에서 매우 유용합니다.

5.1. LIMIT, DISTINCT

5.1.1. LIMIT

**LIMIT**은 조회하는 결과의 행 수를 제한합니다. 모든 데이터를 한 번에 불러온다면 로딩 속도가 저하될 수 있으므로, 이를 방지하거나 샘플 데이터를 검색할 때 유용하게 사용됩니다.

SELECT
			column1
FROM Table1
LIMIT limiting number

예시

“employees” 테이블에서 직원들의 “employee_id”와 “first_name”, “last_name”을 10개만 조회합니다.

SELECT 
      employee_id 
    , first_name 
    , last_name
FROM `HR.employees`
LIMIT 10;

스크린샷 2023-10-06 오후 2.51.24.png

5.1.2. DISTINCT

**DISTINCT**는 중복 값을 가지는 행을 제외하고 고윳값을 가진 행만을 반환합니다. 고윳값을 찾거나 중복 데이터를 처리할 때 유용하게 사용됩니다.

SELECT 
			DISTINCT column1
FROM Table1

예시 1

“employees” 테이블에서 직원들의 고유한 “job_id”를 조회합니다.

SELECT 
			DISTINCT job_id
FROM `HR.employees`;