Learning/SQL

[강의] BigQuery(SQL) 입문_인프런 (1)

테뉴 2024. 12. 26. 18:01

- 강의명 : 초보자를 위한 BigQuery(SQL) 입문

 

[今すぐ無料]初心者向け BigQuery (SQL) 入門 講座 | kyleschool - インフラン

kyleschool | , 最近必須のデータ分析ツール、BigQueryどうやって始めるのか悩みですか? 👀 Google Analytics4(GA4)、Firebase(ファイアベース)を使用する企業が増え、多くの企業がデータウェアハ

www.inflearn.com


데이터 관련 기초 지식

 

[데이터 저장 형태]

- Database : 데이터의 저장소

- Table : 데이터가 저장된 공간

- 저장된 데이터를 제품(앱, 웹)에서 사용 

 

SQL : DB에서 데이터를 가지고 올 때 사용하는 언어

- 데이터베이스의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어

 

OLTP(Online Transaction Processing)

- MySQL, Oracle, PostgreSQL 같은 DB

- 거래를 하기 위해 사용되는 데이터 베이스

- 보류, 중간 상태가 없음 - 주문을 완료하거나 안하거나 : 데이터가 무결하다

- 데이터의 추가(insert), 데이터의 변경(update)이 많이 발생 

- SQL을 사용해 데이터를 추출할 수 있으나 분석을 위해 만든 DB가 아니라, 쿼리 속도가 느릴 수 있음 

→ 데이터분석을 하다가 속도, 기능 부족의 이슈로 OLAP(Online Analytical Processing)의 등장

: 분석을 위한 기능 제공 

 

데이터 웨어하우스

- 데이터를 한 곳에 모아서 저장 

- 여러 곳에 저장된 데이터 예시 : DB, 웹(크롤링), 파일, API 결과 등 

 

▶ 구글 클라우드의 OLAP + 데이터 웨어하우스 → 빅쿼리(구글 클라우드의 데이터 웨어하우스)

 

[빅쿼리의 장점]

1. 난이도

- SQL을 사용해 쉽게 데이터 추출 가능

2. 속도

- OLAP 도구로, 속도가 빠름

3. 파이어베이스, GA4의 데이터를 쉽게 추출 

- 사용 기기, 위치, OS 버전, 이벤트 행동 획득 가능(별도 로깅 필요)

4. 데이터 웨어하우스를 사용하기 위해 서버(컴퓨터)를 띄울 필요 없음

- 구글에서 인프라 관리 

 

빅쿼리 사용 이유

- 회사에서 앱이나 웹에서 파이어베이스, GA4를 활용할 경우, 적은 운영 비용으로 진행하기 위해

- 쏘카, 당근, 컬리, 하이퍼커넥트, 마이리얼트립, 버드뷰 등 

 

[환경 구성 요소]

1) 프로젝트

- 하나의 큰 건물, 건물 안에는 여러 목적을 가진 창고가 존재

- 하나의 프로젝트에 여러 데이터셋이 존재할 수 있음

 

2) 데이터셋

- 프로젝트에 있는 창고, 각 창고 공간에 데이터 저장

- 판매 데이터, 고객 데이터 등 별도 데이터 저장

- 하나의 데이터셋에 다양한 테이블 존재 가능 

 

3) 테이블

- 창고에 있는 선반

- 테이블 안엔 상품의 세부 정보가 저장 

- 테이블 안엔 행과 열로 이루어진 데이터들이 저장