Veri Madenciliği: İyi, Kötü, Gerçek

Veri madenciliği kavramı internette sörf deneyimini geliştirme adına gerekli görülmesine ve gerçekten de internet kullanıcısının online aktivitelerini kolaylaştırmasına rağmen, internet kullanıcılarının kişisel verilerin incelendiği ve kullanıldığı gerçeğini maalesef değiştirmiyor. İşte bu dilemanın içinde iyi ve kötü taraflarıyla veri madenciliği ve aktif internet kullanıcılarının veri madenciliği hakkında nelere dikkat etmeleri gerektiğinden biraz bahsetmek istiyoruz.

Veri madenciliği nedir?

Daha da önemlisi veri madenciliği günlük yaşamamızı nasıl etkiliyor?

Aslında veri madenciliği tanımı olduka basit, database Türkçe ismiyle veri tabanındaki verileri kullanarak daha detaylı veriler ortaya çıkarmak, değerlendirmek ve bu verileri karar aşamasında kullanma süreci olarak açıklanabilir. Veri madenciliği sayesinde birçok şirket dünya genelinde verileri inceleme ve analiz etme ve böylece kullanıcı deneyimini iyileştirme konusunda faaliyetlerini geliştirme şansı yakalıyor. Burdan bakınca veri madenciliği biz internet kullanıcıları için mükemmel gibi duruyor. Peki internet kullanıcıları hakkında birçok veriye ulaşabilen firmalar bu verileri kullandıktan sonra ne yapıyor? Maalesef satıyor ve bunu birçok kez senin iznin olmadan yapıyor. Bu da veri madenciliğinin kara yüzü denilebilir.

Veri depolayan firmaların genelde iki amacı oluyor; toplanan verileri inceleyerek kullanıcı deneyimini geliştirmek veyahutta bu verilerle ilgilenen diğer bir şirkete satmak. Satışı yapan şirket verilerin üzerinden kolay yollu gelir sağlıyor. Verilere erişim sağlayan diğer şirket ne yapıyor dersin? E-posta adresin, Facebook, Twitter veya Instagram hesapların üzerinden şirket promosyonu yapabilir, tarayıcına adware ve benzeri reklam programları ekleyebilir ve hatta biraz daha ileri gitmek isterse izleme çerezleri sayesinde web tarfiğini gözetleyebilir. Sence de ürkütücü değil mi? Bu arada veri madenciliği alanında işinin uzmanı şirketler sayesinde çok para kazanıyorsun ama haberin yok!

Veri madenciliği ve online kimlik

Örneklerle başlayalım…

Bu güne kadar hesap açtığın kaç platformun veya hangi ürünün “Hizmet Koşullarını” okudun. Twitter mesela… Twitter Hizmet Koşullarında diyor ki “ Twitter hesabınızda yayınladığınız her tweet anında tüm dünyada görüntülenebilir”. Gizlilik politikasındaki bu açıklama sayesinden Twitter senin kişisel verilerini (e-posta vb.) çeşitli pazarlama şirketlerine satarak yılda yaklaşık 70 Milyon $ gelir sağlıyor. Bilgileri satın alan şirketlerde kendi ürün ve hizmetlerini ilgili kişilere pazarlama şansı yakalıyor. Nasıl mı?

Mesela bu sabah saatlerinde sevgilinden mükemmel bir haber aldın, baba oluyorsuuuun… Heyecanla bir tweet atıyorsun, “Hey gençler baba oluyorum babaa…”. İşte bu haberi Twitter bebek ürünleri satan bir pararlama şirketine satabiliyor. Bu tip veri madenciliği “text mining” Türkçe deyişle “metin madenciliği” olarak geçiyor. Metin madenciliği sosyal medya profillerinin her geçen gün biraz daha kişiselleştirilmesiyle birlikte direkt veya dolaylı yollardan pazarlama şirketleri ve veri depolayan şirketler arasında oldukça popülerleşiyor.

Veri madenciliği ne kadar ileriye götürülebilir?

Buraya kadar anlattıklarımız buz dağının görünen kısmı. Veri madenciliği tekniklerinin günlük ve iş yaşamımızdaki etkisini açıklamak için tez yazmamız gerekir. Orta büyüklükte bir online alışveriş sayfasından aklına gelebilecek çok daha büyük ve hakkında daha detay bilgiye ulaşan birçok firma veri madenciliği yapıyor. Küçük ve orta büyüklükteki firmaların hakkında o kadar bilgiye ulaşması tabi ki çok kolay değil. Zaten bu oyunun Facebook, Twitter, Google, Yahoo, Amazon gib daha büyük oyuncuları var. Bu bahsettiğimiz platformların nereden para kazandıklarını hiç düşündün mü? Google, Facebook ve Yahoo’nun gelirinin neredeyse büyük bir kısmı reklamlardan geliyor. Amazon bir alışveriş platformu fakat stratejileri tamamen reklam verilerine bağlı. Reklam stratejilerini belirleyecek verilerin dışında bu bahsettiğimiz firmalar yaşadığın şehir, IP adresin, arama motorlarında arattığın kelimeler, e-posta adresin, kullandığın tarayıcı gibi bilgileri de depoluyor ve analiz ediyorlar.

Ne, Nasıl, Neden?

Veri madenciliği özellikle son yıllarda irili ufaklı birçok şirket için gelir kaynağı oldu.

Hakkında ne biliyorlar?

İnternette sörf yaparken kişisel verilerinin depolanıp, incelenmesini istemiyorsan önce veri madencilerinin hangi veriye erişebildiklerini bilmende fayda var. Sosyal medya platformlarında paylaştığın her bilgi veri madencileri tarafından kullanılabilir. Bu nedenle Facebook, Twitter ve benzeri platformlarda derinlemesine kişiselleştirilmiş bir profil oluşturmamakta fayda var diyebiliriz. Bzilerin sağladığı kişisel bilgiler dışında veri madencileri internet kullanıcılarının, hangi tarayıcıyı kullandılarını, IP adreslerini, neleri arattıklarını, hangi reklamlara tıkladıklarını, internette aktif oldukları gün ve saati, hangi işletim sistemini kullandıklarını , e-posta adresleri, yaşadıkları şehir ve telefon numaralarını depolayabilirler.

Bu bilgilere nasıl ulaşıyorlar?

Çok da zor değil. Aslında hakkındaki bilgileri dolaylı yollardan da olsa senden temin ediyorlar. Sosyal medya hesabındaki bilgiler, arama motorlarında aradığın kelimeler, double click çerezler, tıkladığın reklamlar seninle ilgili bilgilere ulaşmak için yeterli.

Neden?

Sebep çok açık, gelir. Kullanıcı verilerini satan şirket satıştan, alan şirketse doğru reklam stratejisi üzerinden gelirini arttırma şansı yakalıyor.

Tıklamadan önce...

Gizlilik politikalarını okumaya ne dersin! Facebook, Twitter, Google veya diğer irili ufaklı tüm platformlar senden veri çalmıyor aslında. Bilgileri direkt birinci elden yani senden alıyor. Web sayfalarına vermiş olduğun tüm bilgilerin nasıl, nerede, hangi şartlarda kullanılacağı bu platformların ve burada isminden bahsetmediğimiz diğer platformların gizlilik politikalarında açıkça belirtiliyor. İşte bu yüzden;

  • İnternette bir sayfaya üye olmadan veya hesap açmadan önce mutlaka gizlilik politikasını okuyun.
  • Eğer kişisel verilerinin kullanılması seni rahatsız ediyorsa, sosyal medya profillerinde daha az bilgi ve fotoğraf paylaşmaya dikkat edebilirsin.
  • Ve gizli ve güvenli internet deneyimi için bir VPN kullanmayı deneyebilirsin.

Veri madenciliğinin avantajları ve dezavantajları var. Bir taraftan internet deneyimini geliştirirken diğer taraftan mahremiyet kavramını tehlikeye atıyor. Ama burada dengeyi bulmak, yani internetin keyfini sürerken reklam veya farklı sebeplerle hedef olmamak biz bilinçli internet kullanıcılarına düşüyor.

Verilerinin Gizliliği İçin

Sevdiklerinle paylaş