İstatistiğin Evrimi
Artık istatistik, onu temel alan veri bilimi alanı içinde anılmaya başlandı. Bilgi teknolojilerinde gerçekleşen hızlı gelişmeler, istatistiğin kapsamını da genişletti. Bu yazıda istatistik ile veri bilimi arasındaki ilişki değerlendiriliyor.
1980’li yılların başında lisans öğreniminde istatistik dersine giren hocamız, aritmetik ortalama, standart sapma, korelasyon, varyans analizi… kısacası hemen tüm istatistiksel işlemleri kâğıt ve kalemle yapmayı öğrenmiş. Bir ayrıcalık olarak bize, “Hesap makinesi kullanabilirsiniz!” demişti. Kendisi de derslerde kullanmaya başlamıştı. Yine de istatistiği kâğıt–kalem temelinde öğretiyordu. O günlerde temel istatistiği sağlam bir biçimde öğrenmiştik.
Zamanla önce Excel, ardından SPSS geldi. Daha sonra R ve Python ortaya çıktı… ve bugünlere, yapay zekâ çağına geldik. Günümüzde, istatistiği tüm derinliğiyle pratiğe döken ve onu temel alan veri bilimi, çok daha geniş bir disiplin olarak bilgisayar bilimi, yazılım mühendisliği, veri tabanı yönetimi ve yapay zekâ yöntemlerini de kapsayan bir alan olarak belirdi…
İstatistiğin Kapsamı
İstatistik, Verilerin toplanması, düzenlenmesi, analiz edilmesi, yorumlanması ve sonuçların çıkarılmasıyla ilgilenen bilim dalıdır. Özetle şunları içine alır:
- Betimsel istatistik (ortalama, varyans, tablolar, grafikler)
- Çıkarımsal istatistik (hipotez testleri, güven aralıkları, regresyon)
- Olasılık teorisi
- Deney tasarımı, örnekleme yöntemleri
İstatistiğin amacı, belirsizlik karşısında karar vermeyi kolaylaştırmak, örneklemlerden yola çıkarak evren hakkında çıkarımlar yapmaktır.
Veri Bilimi’nin Kapsamı
Veri bilimi, çok daha geniş bir disiplin olup istatistiği temel alır. Bununla birlikte bilgisayar bilimi, yazılım mühendisliği, veri tabanı yönetimi ve yapay zekâ yöntemlerini de içerir:
- Veri toplama ve temizleme (big data, sensörler, web scraping, log verileri)
- Veri depolama ve yönetimi (SQL, NoSQL, Hadoop, bulut sistemleri)
- İleri istatistiksel modelleme
- Makine öğrenmesi ve derin öğrenme
- Veri görselleştirme, raporlama, dashboardlar
- Karar destek sistemleri
Veri biliminin amacı, büyük ve karmaşık veri kümelerinden anlamlı bilgi çıkarmak, tahmin ve sınıflandırmalar yapmak, veri odaklı çözümler geliştirmektir.
Özet
İstatistik, veri biliminin temel omurgasıdır.
Veri bilimi, istatistiği yazılım, algoritmalar ve büyük veri teknolojileriyle birleştirerek daha geniş bir uygulama alanı sunar.
Yani istatistik ≠ veri bilimi, ama veri bilimi istatistik olmadan düşünülemez.
Karşılaştırma Tablosu
Boyut | İstatistik | Veri Bilimi |
---|---|---|
Tanım | Verilerin toplanması, analizi ve yorumlanması | Büyük ve karmaşık veri kümelerinden anlamlı bilgi çıkarma, tahmin ve model geliştirme |
Kapsam | Betimsel istatistik, çıkarımsal istatistik, olasılık, hipotez testleri | İstatistik + programlama, veri tabanları, makine öğrenmesi, yapay zekâ, veri görselleştirme |
Amaç | Belirsizlik altında karar vermeye yardımcı olmak, örnekten evrene genelleme yapmak | Veri odaklı çözümler üretmek, tahmin yapmak, karar destek sistemleri geliştirmek |
Araçlar | SPSS, R, SAS, Excel | Python, R, SQL, Hadoop, TensorFlow, Spark, Tableau |
Veri Ölçeği | Küçük ve orta ölçekli veri setleri | Büyük veri (big data), çok boyutlu ve farklı kaynaklardan gelen veri |
Temel Rol | Çıkarım yapmak, doğrulama, hipotez testleri | Uygulama geliştirme, tahmin ve sınıflandırma, otomatik öğrenme |
İlişki | Veri biliminin temel taşlarından biri | İstatistiği, bilgisayar bilimi ve mühendislik ile birleştirir |