Artık istatistik, onu temel alan veri bilimi alanı içinde anılmaya başlandı. Bilgi teknolojilerinde gerçekleşen hızlı gelişmeler, istatistiğin kapsamını da genişletti. Bu yazıda istatistik ile veri bilimi arasındaki ilişki değerlendiriliyor.

1980’li yılların başında lisans öğreniminde istatistik dersine giren hocamız, aritmetik ortalama, standart sapma, korelasyon, varyans analizi… kısacası hemen tüm istatistiksel işlemleri kâğıt ve kalemle yapmayı öğrenmiş. Bir ayrıcalık olarak bize, “Hesap makinesi kullanabilirsiniz!” demişti. Kendisi de derslerde kullanmaya başlamıştı. Yine de istatistiği kâğıt–kalem temelinde öğretiyordu. O günlerde temel istatistiği sağlam bir biçimde öğrenmiştik.

Zamanla önce Excel, ardından SPSS geldi. Daha sonra R ve Python ortaya çıktı… ve bugünlere, yapay zekâ çağına geldik. Günümüzde, istatistiği tüm derinliğiyle pratiğe döken ve onu temel alan veri bilimi, çok daha geniş bir disiplin olarak bilgisayar bilimi, yazılım mühendisliği, veri tabanı yönetimi ve yapay zekâ yöntemlerini de kapsayan bir alan olarak belirdi…

flowchart LR A((İSTATİSTİK)) --> B(Excel, SPSS) B --> I A --> C(R, Python) C --> I A --> D(Bilgisayar Bilimi) D --> I A --> F(Yazılım Mühendisliği) F --> I A --> G(Veri Tabanı Yönetimi) G --> I A --> H(Yapay Zekâ) H --> I((VERİ BİLİMİ)) %% Renk stilleri style A fill:#ddffdd,stroke:#008000,stroke-width:2px,color:#000 style I fill:#ffdddd,stroke:#cc0000,stroke-width:2px,color:#000 %% Ortak sınıf tanımı classDef tools fill:#ddeeff,stroke:#003366,stroke-width:1px,color:#000; %% Ortak sınıfı atama class B,C,D,F,G,H tools;

İstatistiğin Kapsamı

İstatistik, Verilerin toplanması, düzenlenmesi, analiz edilmesi, yorumlanması ve sonuçların çıkarılmasıyla ilgilenen bilim dalıdır. Özetle şunları içine alır:

  • Betimsel istatistik (ortalama, varyans, tablolar, grafikler)
  • Çıkarımsal istatistik (hipotez testleri, güven aralıkları, regresyon)
  • Olasılık teorisi
  • Deney tasarımı, örnekleme yöntemleri

İstatistiğin amacı, belirsizlik karşısında karar vermeyi kolaylaştırmak, örneklemlerden yola çıkarak evren hakkında çıkarımlar yapmaktır.

Veri Bilimi’nin Kapsamı

Veri bilimi, çok daha geniş bir disiplin olup istatistiği temel alır. Bununla birlikte bilgisayar bilimi, yazılım mühendisliği, veri tabanı yönetimi ve yapay zekâ yöntemlerini de içerir:

  • Veri toplama ve temizleme (big data, sensörler, web scraping, log verileri)
  • Veri depolama ve yönetimi (SQL, NoSQL, Hadoop, bulut sistemleri)
  • İleri istatistiksel modelleme
  • Makine öğrenmesi ve derin öğrenme
  • Veri görselleştirme, raporlama, dashboardlar
  • Karar destek sistemleri

Veri biliminin amacı, büyük ve karmaşık veri kümelerinden anlamlı bilgi çıkarmak, tahmin ve sınıflandırmalar yapmak, veri odaklı çözümler geliştirmektir.

istatistik-veri bilimi karşılaştırması

Özet

İstatistik, veri biliminin temel omurgasıdır.

Veri bilimi, istatistiği yazılım, algoritmalar ve büyük veri teknolojileriyle birleştirerek daha geniş bir uygulama alanı sunar.

Yani istatistik ≠ veri bilimi, ama veri bilimi istatistik olmadan düşünülemez.

Karşılaştırma Tablosu

Boyut İstatistik Veri Bilimi
Tanım Verilerin toplanması, analizi ve yorumlanması Büyük ve karmaşık veri kümelerinden anlamlı bilgi çıkarma, tahmin ve model geliştirme
Kapsam Betimsel istatistik, çıkarımsal istatistik, olasılık, hipotez testleri İstatistik + programlama, veri tabanları, makine öğrenmesi, yapay zekâ, veri görselleştirme
Amaç Belirsizlik altında karar vermeye yardımcı olmak, örnekten evrene genelleme yapmak Veri odaklı çözümler üretmek, tahmin yapmak, karar destek sistemleri geliştirmek
Araçlar SPSS, R, SAS, Excel Python, R, SQL, Hadoop, TensorFlow, Spark, Tableau
Veri Ölçeği Küçük ve orta ölçekli veri setleri Büyük veri (big data), çok boyutlu ve farklı kaynaklardan gelen veri
Temel Rol Çıkarım yapmak, doğrulama, hipotez testleri Uygulama geliştirme, tahmin ve sınıflandırma, otomatik öğrenme
İlişki Veri biliminin temel taşlarından biri İstatistiği, bilgisayar bilimi ve mühendislik ile birleştirir