Hamutaro - Hamtaro 4

Database/Engineering

[DE] ๋ฐฐ์น˜ vs ์ŠคํŠธ๋ฆฌ๋ฐ

carsumin 2026. 5. 21. 17:17
๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ์„ ์„ค๊ณ„ํ•  ๋•Œ ๊ฐ€์žฅ ๋จผ์ € ๊ฒฐ์ •ํ•ด์•ผ ํ•˜๋Š” ๊ฒƒ์ด ์žˆ๋‹ค.
๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„์„œ ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ๊ฒƒ์ธ๊ฐ€?
์ƒ๊ธฐ๋Š” ์ฆ‰์‹œ ์ฒ˜๋ฆฌํ•  ๊ฒƒ์ธ๊ฐ€?

 

 

๋ฐฐ์น˜ (Batch)
  • ๋ฐ์ดํ„ฐ๋ฅผ ์ผ์ • ์ฃผ๊ธฐ๋กœ ๋ชจ์•„๋’€๋‹ค๊ฐ€ ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ์‹
์ž์ • 00:00  → ํ•˜๋ฃจ์น˜ ์ฃผ๋ฌธ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘
00:10       → ๋ณ€ํ™˜ (dbt run)
00:30       → ์›จ์–ดํ•˜์šฐ์Šค ์ ์žฌ ์™„๋ฃŒ
09:00       → ๋ถ„์„๊ฐ€๊ฐ€ ๋Œ€์‹œ๋ณด๋“œ ํ™•์ธ

 

ํ•ญ๋ชฉ ๋‚ด์šฉ
์ฒ˜๋ฆฌ ์ฃผ๊ธฐ ์‹œ๊ฐ„ / ์ผ / ์ฃผ ๋‹จ์œ„
์ง€์—ฐ ๋†’์Œ (๋ช‡ ์‹œ๊ฐ„ ~ ํ•˜๋ฃจ)
๊ตฌํ˜„ ๋‚œ์ด๋„ ๋‚ฎ์Œ
๋น„์šฉ ์ €๋ ด
๋Œ€ํ‘œ ๋„๊ตฌ Airflow + dbt, Spark

 

  • ๋ฐฐ์น˜๊ฐ€ ์ ํ•ฉํ•œ ๊ฒฝ์šฐ 
    • ์ผ๋ณ„ ๋งค์ถœ ๋ฆฌํฌํŠธ
    • ์›”๋ณ„ ์ •์‚ฐ
    • ๋จธ์‹ ๋Ÿฌ๋‹ ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค€๋น„
    • ๋Œ€๋ถ€๋ถ„์˜ BI ๋Œ€์‹œ๋ณด๋“œ

 

์ŠคํŠธ๋ฆฌ๋ฐ (Streaming)
  • ๋ฐ์ดํ„ฐ๊ฐ€ ์ƒ๊ธฐ๋Š” ์ฆ‰์‹œ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ์‹
์ฃผ๋ฌธ ๋ฐœ์ƒ → 0.1์ดˆ ์•ˆ์— ์ฒ˜๋ฆฌ → ์‹ค์‹œ๊ฐ„ ๋Œ€์‹œ๋ณด๋“œ ๋ฐ˜์˜

 

ํ•ญ๋ชฉ ๋‚ด์šฉ
์ฒ˜๋ฆฌ ์ฃผ๊ธฐ ์‹ค์‹œ๊ฐ„ (๋ฐ€๋ฆฌ์ดˆ ~ ์ดˆ ๋‹จ์œ„)
์ง€์—ฐ ๋‚ฎ์Œ
๊ตฌํ˜„ ๋‚œ์ด๋„ ๋†’์Œ
๋น„์šฉ  ๋น„์Œˆ
๋Œ€ํ‘œ ๋„๊ตฌ Kafka, Spark Straming, Flink

 

  • ์ŠคํŠธ๋ฆฌ๋ฐ์ด ์ ํ•ฉํ•œ ๊ฒฝ์šฐ
    • ์‹ค์‹œ๊ฐ„ ์‚ฌ๊ธฐ ํƒ์ง€ (๊ฒฐ์ œ ์งํ›„ ์ด์ƒ ๊ฐ์ง€)
    • ์‹ค์‹œ๊ฐ„ ์žฌ๊ณ  ํ˜„ํ™ฉ
    • ๋ผ์ด๋ธŒ ์ด๋ฒคํŠธ ๋ชจ๋‹ˆํ„ฐ๋ง
    • ๋ฐฐ๋‹ฌ ์•ฑ ์‹ค์‹œ๊ฐ„ ์œ„์น˜ ์ถ”์ 

 

์„ ํƒ ๊ธฐ์ค€
"๋ฐ์ดํ„ฐ๊ฐ€ ๋ช‡ ๋ถ„ ~ ๋ช‡ ์‹œ๊ฐ„ ๋Šฆ์–ด๋„ ๊ดœ์ฐฎ์€๊ฐ€?"
        ↓ YES                    ↓ NO
      ๋ฐฐ์น˜๋กœ ์ถฉ๋ถ„            ์ŠคํŠธ๋ฆฌ๋ฐ ๊ณ ๋ ค

"๊ตฌํ˜„ ๋ณต์žก๋„์™€ ๋น„์šฉ์„ ๊ฐ๋‹นํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?"
        ↓ YES                    ↓ NO
    ์ŠคํŠธ๋ฆฌ๋ฐ ๊ฐ€๋Šฅ             ๋ฐฐ์น˜๋กœ ํƒ€ํ˜‘