Hamutaro - Hamtaro 4

ETC.

[Big Query] Google Cloud ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค Big Query

carsumin 2025. 3. 9. 17:59
BigQuery๋ž€?
  • Google Cloud Platform(GCP)์—์„œ ์ œ๊ณตํ•˜๋Š” ์™„์ „๊ด€๋ฆฌํ˜• ์„œ๋ฒ„๋ฆฌ์Šค ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค
  • ์‚ฌ์šฉ์ž๊ฐ€ ์ง์ ‘ ์„œ๋ฒ„๋ฅผ ๊ด€๋ฆฌํ•˜๊ฑฐ๋‚˜ ์Šคํ† ๋ฆฌ์ง€๋ฅผ ํ™•์žฅํ•˜์ง€ ์•Š์•„๋„ ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ๋ฅผ ๋น ๋ฅด๊ฒŒ ์ €์žฅํ•˜๊ณ  ๋ถ„์„ํ•  ์ˆ˜ ์žˆ๋Š” ์„œ๋น„์Šค
  • ์„œ๋ฒ„๋ฆฌ์Šค(Serverless) : ์ธํ”„๋ผ ๊ตฌ์„ฑ, ๋…ธ๋“œ ๊ด€๋ฆฌ, ํ™•์žฅ ๋“ฑ์„ ์ „ํ˜€ ์‹ ๊ฒฝ ์“ธ ํ•„์š” ์—†์Œ
  • SQL ๊ธฐ๋ฐ˜ ๋ถ„์„ : ํ‘œ์ค€ SQL๋กœ ์ˆ˜์‹ญ์–ต ํ–‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ดˆ ๋‹จ์œ„๋กœ ๋ถ„์„ ๊ฐ€๋Šฅ
  • ์ž๋™ ํ™•์žฅ : ๋ฐ์ดํ„ฐ ์–‘์ด๋‚˜ ์ฟผ๋ฆฌ๋Ÿ‰์ด ๋Š˜์–ด๋‚˜๋ฉด ์ž๋™์œผ๋กœ ๋ฆฌ์†Œ์Šค ํ• ๋‹น
  • ๊ฒฐ์ œ ๋ฐฉ์‹ : ์ฟผ๋ฆฌ ์‹คํ–‰๋Ÿ‰(์Šค์บ”๋œ ๋ฐ์ดํ„ฐ ์šฉ๋Ÿ‰)๊ณผ ์ €์žฅ ์šฉ๋Ÿ‰ ๊ธฐ์ค€์œผ๋กœ ๊ณผ๊ธˆ

 

๊ตฌ์กฐ ๋ฐ ์ฃผ์š” ๊ตฌ์„ฑ์š”์†Œ
  • Project : GCP ๋ฆฌ์†Œ์Šค๋ฅผ ๊ด€๋ฆฌํ•˜๋Š” ์ตœ์ƒ์œ„ ๋‹จ์œ„
  • Dataset : ํ…Œ์ด๋ธ”์˜ ๋ฌถ์Œ (์Šคํ‚ค๋งˆ์˜ ๋…ผ๋ฆฌ ๋‹จ์œ„)
  • Table : ์‹ค์ œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ €์žฅ๋˜๋Š” ๋‹จ์œ„
  • View : SQL ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ƒ ํ…Œ์ด๋ธ” ํ˜•ํƒœ๋กœ ์ €์žฅ
  • Job : ์ฟผ๋ฆฌ, ๋กœ๋“œ, ์ต์ŠคํฌํŠธ ๋“ฑ์˜ ์‹คํ–‰ ๋‹จ์œ„
  • Storage : ๋‚ด๋ถ€์ ์œผ๋กœ Colossus ์Šคํ† ๋ฆฌ์ง€ ์‚ฌ์šฉ
  • Compute Engine : ์ฟผ๋ฆฌ ์‹คํ–‰ ์‹œ ๋‚ด๋ถ€์ ์œผ๋กœ Dremel ์—”์ง„์„ ํ†ตํ•ด ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ์ˆ˜ํ–‰

 

๋™์ž‘ ๋ฐฉ์‹
  • ๋ฐ์ดํ„ฐ ์ ์žฌ (Load)
    • Cloud Storage(GCS), Cloud Pub/Sub, Cloud SQL, Google Sheets ๋“ฑ ๋‹ค์–‘ํ•œ ์†Œ์Šค์—์„œ ๋กœ๋“œ ๊ฐ€๋Šฅ
  • ์ฟผ๋ฆฌ ์‹คํ–‰
    • ํ‘œ์ค€ SQL๋กœ ์ฟผ๋ฆฌ ์ž‘์„ฑ
    • BigQuery ์—”์ง„์ด ์ž๋™์œผ๋กœ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ -> ์ดˆ๊ณ ์† ๊ฒฐ๊ณผ ๋ฐ˜ํ™˜
  • ๊ฒฐ๊ณผ ์ €์žฅ / ์‹œ๊ฐํ™”
    • ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ Table๋กœ ์ €์žฅํ•˜๊ฑฐ๋‚˜ Data Studio, Looker Studio ๋“ฑ์œผ๋กœ ์‹œ๊ฐํ™” ๊ฐ€๋Šฅ

 

์‚ฌ์šฉ ์˜ˆ์‹œ
  • ๋Œ€๊ทœ๋ชจ ๋กœ๊ทธ ๋ถ„์„
SELECT
  user_id,
  COUNT(*) AS login_count
FROM
  `project_id.analytics.login_logs`
WHERE
  event_date BETWEEN '2025-10-01' AND '2025-10-14'
GROUP BY
  user_id
ORDER BY
  login_count DESC;

 

  • ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ŠคํŠธ๋ฆฌ๋ฐ (Pub/Sub)
    • ์›น ํŠธ๋ž˜ํ”ฝ ๋กœ๊ทธ, IoT ์„ผ์„œ ๋ฐ์ดํ„ฐ, ํด๋ฆญ ๋กœ๊ทธ ๋“ฑ์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ BigQuery์— ์ ์žฌ
    • ์‹ค์‹œ๊ฐ„ ๋Œ€์‹œ๋ณด๋“œ ๊ตฌ์ถ• ๊ฐ€๋Šฅ

 

BigQuery ์žฅ์ 
  • ๊ด€๋ฆฌ๊ฐ€ ๋ถˆํ•„์š”ํ•˜๋‹ค (์„œ๋ฒ„๊ด€๋ฆฌ, ํ™•์žฅ, ๋ฐฑ์—… ์ž๋™ํ™”)
  • Google Dremel ๊ธฐ๋ฐ˜์˜ ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ์ฒ˜๋ฆฌ๋กœ ๊ณ ์„ฑ๋Šฅ์ด๋‹ค
  • ์‚ฌ์šฉ๋Ÿ‰ ๊ธฐ๋ฐ˜ ๊ณผ๊ธˆ์œผ๋กœ ์ €๋น„์šฉ
  • PB ๋‹จ์œ„ ๋ฐ์ดํ„ฐ๋„ ์•ˆ์ •์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ •๋„๋กœ ํ™•์žฅ์„ฑ์ด ์ข‹์Œ
  • ML/AI ํ†ตํ•ฉ ๊ฐ€๋Šฅ

 

BigQuery ๋‹จ์ 
  • ๋น„์šฉ ์ œ์–ด ํ•„์š”
  • ์“ฐ๊ธฐ ์ง€์—ฐ
  • ์ œํ•œ๋œ ํŠธ๋žœ์žญ์…˜ ๊ธฐ๋Šฅ
  • ๋ณต์žกํ•œ ์กฐ์ธ ์‹œ ์„ฑ๋Šฅ ์ €ํ•˜ ๊ฐ€๋Šฅ