
Veri Kaynakları ve Toplama Süreçleri
Yazan: TOLGA AKAGÜN
Yayın: EulePage / Mayıs 2025
Günümüzün dijitalleşen dünyasında bilgi, her zamankinden daha değerli bir hale geldi. Ancak bilginin değeri, sadece varlığıyla değil; doğru zamanda, doğru biçimde ve doğru kaynaktan elde edilmesiyle ölçülür. Büyük veri analitiğinin temel yapı taşlarından biri olan veri kaynakları ve bu kaynaklardan verinin nasıl toplandığı, işletmelerin rekabet gücünden kamu yönetiminin etkinliğine kadar birçok alanda belirleyici olmaktadır.
Veri Kaynaklarının Evrimi
Veri kaynakları, geleneksel yapılardan modern dijital platformlara doğru önemli bir evrim geçirmiştir. Önceleri yalnızca yapılandırılmış veriler (örneğin, veritabanlarındaki müşteri kayıtları, fatura bilgileri) analiz edilirken, bugün artık yapılandırılmamış (görüntüler, ses kayıtları, sosyal medya içerikleri) ve yarı yapılandırılmış veriler (örneğin XML, JSON belgeleri) de veri analizine dâhil edilmektedir. Bu dönüşüm, yalnızca teknolojik değil; aynı zamanda düşünsel bir devrimin de habercisidir.
Örneğin bir e-ticaret platformu, kullanıcıların tıkladığı ürünleri, sepete eklediklerini, hatta uzun süre baktıkları ancak satın almadıkları ürünleri dahi takip edebilmektedir. Bu iz veriler, yapılandırılmamış olmalarına rağmen, doğru şekilde işlendiğinde müşteri davranışlarını öngörme konusunda ciddi avantajlar sağlar. Yani veri sadece olanı değil, olacak olanı da fısıldayabilir.
Modern Veri Kaynakları
- Günümüzde veri kaynaklarını sınıflandırmak gerekirse, şu başlıklar altında toplayabiliriz:
- İşletme içi kaynaklar: CRM sistemleri, ERP uygulamaları, kurumsal veri tabanları.
- Web tabanlı kaynaklar: Web siteleri, sosyal medya platformları, bloglar, forumlar.
- Mobil uygulamalar: Kullanıcı etkileşimleri, konum verileri, uygulama içi davranışlar.
- Nesnelerin İnterneti (IoT): Akıllı cihazlardan gelen sensör verileri, üretim makineleri, giyilebilir teknolojiler.
- Kamuya açık veri setleri: Resmi istatistik kurumları, meteorolojik veriler, ulaşım ve trafik bilgileri.
Bu çeşitlilik, analistlerin aynı soruya farklı kaynaklardan yanıt arayabilmesine olanak tanır. Ancak bu çeşitlilik aynı zamanda ciddi bir entegrasyon ve standardizasyon sorunu da yaratmaktadır. Verilerin anlamlı bir bütün haline getirilebilmesi için hem teknik hem de mantıksal düzeyde bir uyum gereklidir.
Veri Toplama Süreçleri
Veri toplama süreci, sadece bir kayıt alma işlemi değildir. Bu süreç; hedefin belirlenmesi, doğru kaynağın seçilmesi, toplama yönteminin tanımlanması ve güvenilirliğin sağlanması gibi adımları içerir.
- Otomatik veri toplama: API’ler, log dosyaları, sensör sistemleri ile yapılan kesintisiz ve gerçek zamanlı veri akışıdır. Örneğin, hava durumu uygulamaları her saat başı meteoroloji istasyonlarından veri çeker.
- Yarı otomatik veri toplama: Web kazıyıcılar (web scraping) veya belirli aralıklarla çalışan veri çekme robotları kullanılır. Bu yöntem, haber sitelerinden veri toplamak gibi durumlarda tercih edilir.
- Manuel veri toplama: Anket, gözlem ya da doğrudan giriş yoluyla yapılan veri toplama yöntemidir. Özellikle sosyal bilimlerde hâlen geçerliliğini korur.
Ancak burada kritik olan husus, sadece verinin çokluğu değil, kalitesidir. Düşük kaliteli veriyle yapılan analiz, sizi doğru gibi görünen yanlış sonuçlara götürebilir. Bu nedenle, veri toplama sürecinde doğruluk, güncellik ve bağlamsal uygunluk kriterleri mutlaka gözetilmelidir.
Veri Toplamanın Etik Boyutu
Veri toplarken en sık göz ardı edilen konulardan biri de etik ilkelerdir. Kullanıcının izni olmadan elde edilen veriler, hem hukuki sorunlara yol açabilir hem de kurumların itibarını zedeleyebilir. Kişisel verilerin korunması, yalnızca bir yükümlülük değil; aynı zamanda kullanıcıya duyulan saygının da ifadesidir.
Örneğin, GDPR (General Data Protection Regulation) gibi düzenlemeler, kullanıcı verisinin nasıl toplanacağı, saklanacağı ve işleneceği konularında açık kurallar getirmiştir. Bu tür yasal çerçeveler, büyük veri analitiği için yalnızca sınır değil, aynı zamanda güven zeminidir.
Sonuç
Veri kaynakları ve bu verilerin toplanma biçimleri, büyük veri analitiğinin başarısını doğrudan etkileyen unsurlardır. Gelişen teknolojiyle birlikte hem veri kaynakları hem de toplama yöntemleri giderek çeşitlenmekte, bu da veriye dayalı karar alma süreçlerini daha karmaşık ancak aynı zamanda daha güçlü hale getirmektedir. Etik, güvenilirlik ve kalite gibi ilkelerden taviz verilmeden yapılan veri toplama süreçleri, büyük veri analitiğinin sunduğu potansiyeli en verimli şekilde ortaya çıkaracaktır.
Kaynakça
- Kitchin, R. (2014). The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. SAGE.
- Mayer-Schönberger, V., & Cukier, K. (2013). Big Data: A Revolution That Will Transform How We Live, Work, and Think. Houghton Mifflin Harcourt.

Yorum yazabilmek için oturum açmalısınız.