- 강의명 : 초보자를 위한 BigQuery(SQL) 입문
[今すぐ無料]初心者向け BigQuery (SQL) 入門 講座 | kyleschool - インフラン
kyleschool | , 最近必須のデータ分析ツール、BigQueryどうやって始めるのか悩みですか? 👀 Google Analytics4(GA4)、Firebase(ファイアベース)を使用する企業が増え、多くの企業がデータウェアハ
www.inflearn.com
데이터 관련 기초 지식
[데이터 저장 형태]
- Database : 데이터의 저장소
- Table : 데이터가 저장된 공간
- 저장된 데이터를 제품(앱, 웹)에서 사용
SQL : DB에서 데이터를 가지고 올 때 사용하는 언어
- 데이터베이스의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어
OLTP(Online Transaction Processing)
- MySQL, Oracle, PostgreSQL 같은 DB
- 거래를 하기 위해 사용되는 데이터 베이스
- 보류, 중간 상태가 없음 - 주문을 완료하거나 안하거나 : 데이터가 무결하다
- 데이터의 추가(insert), 데이터의 변경(update)이 많이 발생
- SQL을 사용해 데이터를 추출할 수 있으나 분석을 위해 만든 DB가 아니라, 쿼리 속도가 느릴 수 있음
→ 데이터분석을 하다가 속도, 기능 부족의 이슈로 OLAP(Online Analytical Processing)의 등장
: 분석을 위한 기능 제공
데이터 웨어하우스
- 데이터를 한 곳에 모아서 저장
- 여러 곳에 저장된 데이터 예시 : DB, 웹(크롤링), 파일, API 결과 등
▶ 구글 클라우드의 OLAP + 데이터 웨어하우스 → 빅쿼리(구글 클라우드의 데이터 웨어하우스)
[빅쿼리의 장점]
1. 난이도
- SQL을 사용해 쉽게 데이터 추출 가능
2. 속도
- OLAP 도구로, 속도가 빠름
3. 파이어베이스, GA4의 데이터를 쉽게 추출
- 사용 기기, 위치, OS 버전, 이벤트 행동 획득 가능(별도 로깅 필요)
4. 데이터 웨어하우스를 사용하기 위해 서버(컴퓨터)를 띄울 필요 없음
- 구글에서 인프라 관리
빅쿼리 사용 이유
- 회사에서 앱이나 웹에서 파이어베이스, GA4를 활용할 경우, 적은 운영 비용으로 진행하기 위해
- 쏘카, 당근, 컬리, 하이퍼커넥트, 마이리얼트립, 버드뷰 등
[환경 구성 요소]
1) 프로젝트
- 하나의 큰 건물, 건물 안에는 여러 목적을 가진 창고가 존재
- 하나의 프로젝트에 여러 데이터셋이 존재할 수 있음
2) 데이터셋
- 프로젝트에 있는 창고, 각 창고 공간에 데이터 저장
- 판매 데이터, 고객 데이터 등 별도 데이터 저장
- 하나의 데이터셋에 다양한 테이블 존재 가능
3) 테이블
- 창고에 있는 선반
- 테이블 안엔 상품의 세부 정보가 저장
- 테이블 안엔 행과 열로 이루어진 데이터들이 저장
'Learning > SQL' 카테고리의 다른 글
| [강의] BigQuery(SQL) 입문_인프런 (2) (0) | 2025.01.02 |
|---|---|
| [SQL] SQL로 하는 데이터 분석 (4)_코드잇 (0) | 2024.01.28 |
| [SQL] SQL로 하는 데이터 분석 (3)_코드잇 (0) | 2024.01.23 |
| [SQL] SQL로 하는 데이터 분석(2)_코드잇 (0) | 2024.01.16 |
| [SQL] SQL로 하는 데이터 분석(1)_코드잇 (0) | 2023.12.28 |