← Blog · · 4 dk okuma · ikitech Ekibi

Modern Data Stack Nedir ve Startup'ınız Ne Zaman İhtiyaç Duyar?

dbt, data warehouse, BI araçları ve modern veri altyapısının bileşenleri. Startup'lar için ne zaman 'çok erken', ne zaman 'gerekli'?

modern-data-stackdbtdata-warehouseanalyticsveri-altyapısı

“Modern data stack” terimi son birkaç yılda SaaS dünyasında sıkça geçer oldu. Data mühendisleri bundan heyecanla bahsediyor, konferans sunumlarında slaytlar bunu gösteriyor ve her analitik aracın pazarlama metni bir şekilde bu kavrama değiniyor. Peki bu gerçekten ne anlama geliyor? Ve daha önemlisi — startup’ınız için bu sistemi ne zaman kurmanız gerekiyor, ne zaman henüz erkendir?

Modern Data Stack’in Bileşenleri

Modern data stack, dört temel katmandan oluşur. Her katmanın belirli bir işlevi var ve her biri için farklı araç alternatifleri mevcut.

1. Veri Toplama (Ingestion)

Farklı kaynaklardan (üretim veritabanları, SaaS araçlar, reklam platformları, müşteri destek sistemleri) verinizi merkezi bir yere taşıyan katmandır.

Yaygın araçlar: Airbyte (açık kaynak, self-hosted veya cloud), Fivetran (managed, kapsamlı konnektör listesi), Stitch.

Bu katmanın görevi ETL (Extract, Transform, Load) sürecinin “extract” kısmını otomatize etmektir. Airbyte ile Shopify siparişlerinizi, Stripe ödemelerinizi ve Intercom destek biletlerinizi tek bir yerden çekebilirsiniz.

2. Veri Ambarı (Data Warehouse)

Ham verinizi depoladığınız ve sorgular çalıştırdığınız katmandır. Üretim veritabanınızdan farklıdır — buradaki veri analitik sorgular için optimize edilmiştir, yazma hızı için değil.

Yaygın araçlar: BigQuery (Google Cloud, kullandıkça öde), Snowflake (cloud-agnostic, güçlü paylaşım özellikleri), Redshift (AWS ekosistemi), DuckDB (yerel geliştirme ve küçük ölçek için mükemmel, ücretsiz).

Startup’lar için BigQuery genellikle iyi bir başlangıç noktasıdır: yönetim yükü düşük, ölçeklenebilir ve ücretsiz katmanı erken aşama için fazlasıyla yeterlidir.

3. Dönüşüm (Transformation)

Ham veriyi analitik için anlamlı modellere dönüştüren katmandır. SQL tabanlı transformasyonları kod olarak yönetmenizi sağlar.

Baskın araç: dbt (data build tool). dbt ile SQL modellerinizi Git’te versiyonlayabilir, testler yazabilir ve veri akışınızı dokümante edebilirsiniz. “Aktif müşteri” tanımını tek bir yerde tutup her raporun aynı tanımı kullanmasını sağlamak — bu dbt’nin çözdüğü temel problemdir.

4. Business Intelligence (BI) ve Görselleştirme

Son kullanıcıların veriyle etkileşime geçtiği katmandır. Dashboardlar, raporlar, ad hoc sorgular.

Yaygın araçlar: Metabase (açık kaynak, kullanımı kolay, teknik olmayan ekipler için ideal), Looker (kurumsal, güçlü ama pahalı), Tableau, Redash.

Metabase, çoğu erken aşama startup için başlamak için doğru araçtır: hem self-hosted hem de cloud seçeneği var, SQL bilmeden de temel analizler yapılabiliyor.

Bu Sistemin Birlikte Çalışma Şekli

Tipik bir akış şöyle görünür:

Kaynak sistemler (Stripe, Shopify, üretim DB)
         ↓ Airbyte / Fivetran
    Data Warehouse (BigQuery)
         ↓ dbt
    Dönüştürülmüş modeller (mart tabloları)
         ↓ Metabase / Looker
    Dashboard ve raporlar

Bu yapının güzelliği şurada: her katman değiştirilebilir. Metabase’den Looker’a geçerseniz, alt katmanlar değişmez. BI aracınız verinin nasıl toplandığından habersizdir.

Startup’ınız Gerçekten Buna İhtiyaç Duyuyor mu?

Şimdi asıl soruya gelelim: Bu sistemi ne zaman kurmalısınız?

Kısa cevap: Product-Market Fit’i kanıtlamadan önce büyük ihtimalle kurmamalısınız.

Modern data stack’in değeri, farklı kaynaklardan gelen verileri birleştirip analiz etmeniz gerektiğinde ortaya çıkar. Tek bir üretim veritabanınız varsa ve verileriniz orada yaşıyorsa, doğrudan SQL sorguları veya Metabase gibi basit bir araç çoğu zaman yeterlidir.

Erken aşama için yeterli alternatifler

  • Doğrudan veritabanı sorguları + Metabase veya Redash: Üretim DB’nize read replica ekleyin, Metabase bağlayın. Dakikalar içinde çalışır.
  • Google Sheets + Apps Script: Küçük hacimler ve hızlı prototipler için düşündüğünüzden daha etkili.
  • Mixpanel veya Amplitude: Ürün analitiklerini kendi başlarına iyi yönetirler; veri ambarı gerektirmezler.

Modern data stack’e ihtiyaç duyduğunuzun işaretleri

Şu durumlar varsa sistemi kurmayı ciddi olarak değerlendirme vakti gelmiştir:

1. Birden fazla veri kaynağını birleştirmeniz gerekiyor. CRM, ödeme sistemi ve üretim veritabanınızdaki veriyi bir arada analiz etmeniz gerekiyorsa ve bunu manuel olarak yapmak saatlerinizi alıyorsa — ingestion katmanına ihtiyacınız var.

2. “Aktif müşteri” herkes için farklı anlam taşıyor. Satış ekibi bir tanımla, ürün ekibi başka bir tanımla çalışıyorsa ve bu fark önemli kararlara yansıyorsa — dbt ile merkezi bir model katmanı kurmak bu sorunu kökten çözer.

3. Analistleriniz (veya siz) veriyi hazırlamakla analiz etmekten daha fazla zaman harcıyor. Veriyi temizlemek ve birleştirmek, içgörü üretmekten fazla zaman alıyorsa — bu, transformation katmanının otomatize etmesi gereken bir iş.

4. Veri kalitesi sorunları iş kararlarını etkiliyor. “Bu rakam doğru mu?” sorusu haftalık toplantılarda düzenli olarak çıkıyorsa — test edilebilir, versiyonlanmış bir transformation katmanına ihtiyacınız var.

5. Ekibiniz 15-20 kişiyi geçti ve farklı departmanlar farklı verilere ihtiyaç duyuyor. Bu noktada veri demokratizasyonu bir zorunluluk haline gelir; self-serve BI olmadan her sorgu için mühendise gidilmesi verimlilik kaybına yol açar.

Maliyeti Doğru Değerlendirin

Modern data stack “ücretsiz araçlarla” kurulabilir — Airbyte açık kaynak, dbt Core ücretsiz, BigQuery küçük hacimler için neredeyse bedava, Metabase self-hosted ücretsiz. Ama bu araçların kurulumuyla ilgilenecek birine ihtiyacınız var.

Gerçek maliyet, araçların lisansından değil, mühendislik zamanından gelir. Bir data mühendisi veya bu konuda deneyimli bir danışman olmadan bu sistemi kurmak hem zaman alır hem de öngörülemeyen teknik borçlara yol açar.

Pratik Karar Ağacı

Şu soruları sırayla sorun:

  1. Birden fazla veri kaynağını düzenli olarak birleştiriyor musunuz? → Hayır ise, bir data warehouse’a henüz ihtiyacınız yok.
  2. Veriyi hazırlamak, analiz etmekten fazla zaman alıyor mu? → Hayır ise, mevcut araçlarla devam edin.
  3. Farklı departmanlar aynı metrikleri farklı hesaplıyor mu? → Evet ise, dbt ile merkezi modeller faydalı olur.
  4. Self-serve analiz ihtiyacınız var mı? → Evet ise, Metabase ile başlamak mantıklıdır.

Veri altyapınızı ne zaman ve nasıl kurmanız gerektiğini değerlendirmek ister misiniz? Mevcut durumunuzu birlikte analiz etmek ve size özgü bir yol haritası oluşturmak için ücretsiz bir keşif görüşmesi ayarlayabiliriz.

Bu yazı işe yaradı mı?

Teknoloji kararlarınızda somut adımlar atmak istiyorsanız görüşelim. İlk görüşme ücretsiz.

Ücretsiz Görüşme Ayarla