Big Data veya Büyük Veri hakkında merak edip de soramadığınız 12 soru
TURKISHTIME YENİ EKONOMİ OKULU
Fatma Akman
fatmaakman@turkishtimedergi.com
Big Data nedir, ne değildir? Ne işe yarar, kimler faydalanabilir? İşte Big Data'nın 12 soruda büyük resmi...
Ne menem şeydir bu "Big Data"?
Karanlık odadaki bir fil!
Pardon!
Şaka şaka! "Benimle, sizinle, kız/erkek arkadaşınızla, anne-babanızla varsa çocuklarınız ya da evcil hayvanlarınızla ilgili tüm irili ufaklı detaylar" diye özetleyebiliriz.
Nasıl yani? Açabilir miyiz biraz?
Yaşınız, evli olup olmadığınız ya da çocuk sahibi olup olmadığınız, kaç çocuğunuz olduğu, şehrin neresinde yaşadığınız, alışverişe gitmek için ne süreyle araba kullandığınız, en son ne zaman taşındığınız, cüzdanınızda taşıdığınız kredi kartları, hangi web sitelerini takip ettiğiniz... Keza yine etnik kökeniniz, iş geçmişiniz, okuduğunuz dergi ya da gazeteler, daha önce iflas verip vermediğiniz, ya da boşanıp boşanmadığınız, evinizi aldığınız ya da sattığınız yıl, liseyi nerede okuduğunuz, internette hangi konularda konuştuğunuz, paylaştığınız sosyal medya içerikleri, kullandığınız tuvalet kağıdı, kahve, kola, kahvaltılık gevrek markası, politik duruşunuz, okuma alışkanlıklarınız, hayırsever olup olmadığınız, bağış yapıyorsanız bi yerlere onun miktarı, sahip olduğunuz araba sayısı ve markası... Bilinçli bir şekilde ya da bilinçsizce sergilediğimiz tüm sahip olma, alışveriş davranışları, alışkanlıklarımız gibi... Büyük şirketler bizimle ilgili tüm bu detaylara bayılıyor ve onları topluyor.
Ne zamandan beri bilgilerimizi topluyorlar?
Büyük şirketlerin bizimle ilgili bilgileri toplamaya duyduğu aşk yeni değil. Neredeyse son yirmi yıldır böyle bir çaba mevcut. Ancak mobil ve online sistemlerin gelişmesiyle veri toplama ve depolamanın kolaylaşması buna mukabil ucuzlaması da tabii, bizi bugün geldiğimiz noktaya getirdi. Sadece tüm bu verileri toplamak, o verileri analiz edip okumayı beceremedikten sonra yeterli olmuyordu.
Şimdi anlaşıldı fil metaforunun ne olduğu!
Aynen... Çünkü tıpkı big data'nın niteliği de ilgilendiğin alanla yaptığın işle ilgili olarak farklılık gösterir. Yani bir bakıma sen "bu bir kuyruk" ya da "bu bir hortumdur" dersen görece doğru ama eksik açıklamış olursun. Olay şu aslında; insanlar mağara duvarlarına yazmaya başladığından beri "data" üretiyorlar, hiyerogliflerden yazıtlara, kitaplardan çekilen videolara kadar hepsi bu kapsamda ele alınabilir. İlginç olanı, son 20 yılda internet ve teknolojik gelişmeler sonucunda data üretim hızımızın artmış olması... Yapılan araştırmalar insanlık var olduğundan beri üretilen datanın yüzde 90'ının son birkaç yıl içinde üretildiğini gösteriyor! Işte aslında insanlığın başından beri var olan datayı büyük yapan da bu. Yani, o datanın hacmi (volume), hızı (velocity) ve çeşitliliği (variety) onu "büyük" kılan unsurlar. Ünlü Amerikan perakende zinciri Wal-mart'ın bir saatte 14 yıl HD kalitesinde videoya eşit miktarda data ürettiğini biliyor muydun?
Hayır! Peki o halde, başa dönmek istiyorum. Neden büyük şirketler bizimle ilgili bu bilgileri istifliyor?
İşte yine file dönüyoruz. Filin kuyruğuyla mı ilgilisin, hortumuyla mı? Buna verdiğin yanıta göre bu soruya verilecek yanıt da değişir. Perakende zincirleri, bir müşterinin diş fırçasından taze meyve sebze alışverişine, oyuncak alışverişinden kedi kumuna kadar tüm ihtiyaçlarını oradan gidermelerini sağlamak istiyor. Pazarlamacılar ve reklamcılar müşterilerinin reklamlarını hedef kitleye doğru zamanda, doğru sayıda ve en etkili içerikle göstermeyi istiyor. Sağlık sektöründe bir bulaşıcı hastalığın yayılma ve kimleri potansiyel tehdit ettiği öğrenilmeye çalışılıyor olabilir. Ama yine de şunu söylemek mümkün, big data konusunda en hızlı meyve veren sektörlerin başında pazarlama geliyor.
Ama nasıl? Bir şirket bunca datayı kendisi için nasıl faydalı hale getirebilir ki? Evcil hayvanım var ya da yok, bu bir hastanenin ne işine yarayabilir?
Doğru! İşte bu noktada kimin hangi bilgiye ihtiyacı olduğu, o bilgilerin belli bir istatistik çalışma sonucunda işlenmesi ve çıkan sonuçları okuyabilecek veri okur-yazarları ve analistleri önem kazanıyor. Tüm bu bilgiler ışığında tıpkı eskiden mahallenizdeki çarşı gibi markalarla aranızda bir aşinalık olacak ve ne onlar size ihtiyacınız olmayan ne de bütçenizi aşan bir ürün pazarlamaya çalışacak. Yani bir bakıma big data internet pazarlamasını çarşı pazarlamasına dönüştürüyor. Tıpkı eskiden anne-babanızı iyi tanıyan mahallenizdeki esnafın sizin haftanın hangi günü, neyi, ne miktarda alacağınızı, sizin ekonomik profilinizi çok iyi bilmesi gibi... Örneğin internette Turkishtime'ı tıkladınız, marka sizin takip ettiğiniz e-ticaret sitesinde hangi kazağı almak isteyebileceğinizi tahmin etmeye çalışıyor ya da Alldecor'u tıkladınız, diğer Alldecor okurlarının da tercihlerinden yola çıkarak sizin alışveriş, internet kullanımı alışkanlıklarınızı öngörmeye çalışıyor. Sonrasında da ne sizi meşgul ediyor gereksiz ürün ve içeriklerle ne de kendi verimliliğini azaltıyor.
Bir ara "veri okur-yazarlığı"ndan söz ettin. O nedir, yeni bir iş kolu filan mı?
Denebilir. Ama şimdilik! Çünkü tüm bu verilerin toplanıp analiz edilmesi bilgisayarların yaptığı bir iş. Tüm bu teknolojiyi üretmek ayrıca önemli olsa da bu teknolojinin önümüze getirdiği istatistik değerleri okuyup anlayabilmek ve bizim için "odaklı", "faydalı" bir hale getirmek başka bir beceri... Veri okur-yazarlığı dediğimiz şey bu. Şimdilik bir iş kolu ama önümüzdeki 5-10 yıllık süre zarfında tıpkı okur-yazarlık gibi ülkelerin refah seviyelerinin ölçülmesinde kıstas alınabilecek bir zaruret haline gelmesini öngörüyor bilim insanları.
Big Data'nın yarattığı başka iş kolları, meslekler var mı?
Elbette var. Çok kısa bir süre içinde CDO (chief data officer), data scientist, data analyst, big data visualizer, big data solutions architect, big data engineer, big data researcher, data warehouse manager, data architect, database manager, business intelligence analyst, data warehouse analyst, data modeler gibi title'larla çok daha sık karşılaşmaya başlayacağız. 20 yıl sonra belki çöpçüler olmayacak hayatımızda. Çöp toplamak otomasyona oldukça yatkın bir iş, çöplerimizi robotlar toplayacak ama otomasyonla temizleyemediğimiz data'lar için manuel temizlik yapacak data çöpçüleri olacak. Bilmem anlatabiliyor muyum!?
İyi de kim bu insanlar? Şapkadan mı çıkıyorlar?
İşte bu da big data ekseninde gelişen bir başka büyük değişim olacak. McKenzie'nin araştırmasına göre önümüzdeki 10 yıl içinde Amerika'da 1.5 milyon veri okur-yazarı yönetici ihtiyacı oluşması bekleniyor. Bu rakamdan yola çıkarak Türkiye'de de takriben 15 bin veri okur-yazarı ihtiyacı oluşacağını öngörebiliriz. O halde bu yeni kalifikasyonlara sahip yöneticilerimiz olabilmesi için eğitimin de değişmesi gerekiyor. Aslında yine bir erken örnek Amerika'dan verilebilir, mesela Amerika'da artık ilkokul düzeyinde "coding hour" saatleri eklendi müfredata. Yakında üniversitelerde zorunlu temel calculus eğitiminin yanında istatistik dersleri eklenecek belki. Nöroloji ve psikoloji, davranış bilimleri gibi alanlarda verilen temel derslerin mühendislik eğitiminin bir parçası olması gibi güncellemeler olması kaçınılmaz hale geliyor. Hatta artık doktorların, avukatların değil matematikçilerin, istatistikçilerin seksi olduğunu düşünenler bile var.
Geleceğin meslekleri değişiyor yani. Böyle bir hikayede yine de sürekli izlenme hissi kimsenin hoşuna gitmeyecektir. Özel alan ihlali nasıl çözümlenecek peki?
İşte bu da big data'nın beraberinde getirdiği avantajlar kadar önümüzdeki süreçte büyük tartışmalara konu olması beklenen bir mesele. Bu konuda bir takım çalışmalar, test düzeyinde uygulamalar var. Bu bilgilerin belli yasal çerçeveler ışığında insanların özlük haklarına saldırı halini almadan, birey olmalarını engellemeden toplanaıp işlenebilmesi önem kazanıyor. Mahallenizde insanların sizi tanıması hoş olabilir belki ama hiç arzu etmediğiniz bir yerde hiç tanımadığınız insanların sizi tanıması pek tatsız bir şey olurdu muhtemelen.
Son bir soru... Hep büyük şirketlerden söz ettin, KOBİ'ler girişimciler nasıl yararlanabilir Big Data'dan?
Şimdilik yararlanamaz. Çünkü az önce de söylediğim gibi henüz big data'yı toplamak her ne kadar kolay olsa da onu tasnif etmek, analiz etmek, okumak ve uygun stratejiler geliştirmek için gereken teknik altyapı ve kalifiye çalışan ihtiyacı giderilebilmiş değil. Ancak tabii ki big data ve beraberinde getirdiği rüzgar başlı başına birçok yeni girişim alanı açıyor ilgilisine.
Kızınızın hamile olduğunu sizden önce fark eder
Doç Dr. Özgür Özlük
Veri Analitiği ve Yönetimi
Bahçeşehir Üniversitesi
Amerika'nın ünlü perakende zincilerinden Target, big data analizine uzun zamandır hayli kıymet veren ve bu alana yatırım yapan bir şirket. Mesela yaptıkları bu analizler sonucunda bir kadının hamileyken girdiği bir mağazadan memnun kalması halinde doğacak bebeğin üniversite çağına gelene kadar oradan alışveriş yapmaya devam edeceğini, anne karnında bir sadakat yaratmanın mümkün olduğunu ortaya koyuyor. Bu tespit sonrasında hamile olduğundan şüphelendikleri müşterilere yeni doğan endüstrisine yönelik indirim çekleri vs hediye etmeye başlıyorlar. Bir gün öfkeli bir adam mağaza müdürüyle görüşmek istediğini ve eşinin hamile olmadığını söyleyip tepki gösteriyor. 14 yaşında bir kızı olduğunu, kızının ergenlikte olması nedeniyle kafasının karışık olduğunu bir de üstüne onların gönderdiği hediye çeklerinin iyice olumsuz etki ettiğini anlatıyor, şikayetini iletiyor. Bunun üzerine müşteri memnuniyeti esasınca birkaç gün sonra özür dilemek için aradıklarında aldıkları yanıt "Ben özür dilerim, aslında kızım hamileymiş" oluyor. Demem o ki big data ile alışveriş merkezleri, perakendeciler, pazarlamacılar kızınızın hamile olduğunu sizden önce fark edebilir.
* * *
Hedef kitleye ulaşmak doğru big data analizinden geçiyor
Berk Tatlıses
CTO
Mobilike
IAB Türkiye'nin geçen sene yayınlanan raporuna göre 2013 mobil reklam pazarı büyüklüğü 44.8 milyon TL. 2014'ün ilk yarısında ise bu rakam 25 milyon TL olarak hesaplandı. Yani bu trendin yüzde 25.1 olduğu belirlendi. Biz bir mobil reklam satış evi olarak bu ivmeyle büyüyen mobil reklam pazarının yüzde 70'ine sahibiz, pasta sürekli büyüdüğü için bizim pazar payımız da azalmak şöyle dursun her geçen gün büyüyor. Yönettiğimiz bir network var ve burada yayıncılarımız var. Milliyet, Fox TV Türkiye, Acunn tv 8 gibi ulusal gazeteler, tv kanalları, e-commerce kanalları var bu yayıncılar arasında. Tek odağımız mobil ve ve yayıncılarımızın mobil web sitelerindeki reklamların satışını ve teknolojisini gerçekleştiriyoruz. Facebook'un reklam ve öneri uygulamalarına benzer bir işleyişi var sistemimizin. O reklamları gösterirken kullanıcının hangi uygulamayla daha çok ilgileneceğini tahmin etmeye çalışıyoruz, big datayı o projeksiyonla işliyor ve kimlikten arındırdığımız kullanıcı bilgilerini ona göre tasnif ediyoruz. Çünkü hedefli reklam yapmak çok önemli, "real time bidding" deniyor. Mesela Milliyet'teki bir reklam alanını dünyaya açıyoruz. Reklamverenler o reklam alanında reklamını göstermek için yarışmaya başlıyor ve en yüksek bidi veren o alanın sahibi oluyor o anlık, o gösterim için. Orada tabii ki firmalar ve ajanslar hedefli reklam yapmak istiyor ve cinsiyet ve yaş aralığını doğru hedeflemek istiyorlar. Bu da o kampanyanın ne kadar başarılı olduğuyla ilgili bir ölçeğe dönüşüyor sonrasında.