Trump'ın seçim zaferi, Facebook ve Büyük Veri

Çok değil, bundan 10-15 yıl önce kapitalizm öyle bir araç/medya geliştirecek ki, insanlar en kişisel bilgilerini, en mahrem yanlarını, en özel anlarını ortalık yerde seve seve paylaşacak denseydi, herhalde bu kuruntuya öncelikle istihbarat şefleri gülerdi

12 Nisan 2018 14:08

Dünya Facebook’un milyonlarca insanın kişisel verilerini Trump’a peşkeş çekip bu grotesk şaklabanı ABD’nin dümen koltuğuna oturtması skandalıyla sarsıldı. Dünyanın en müreffeh, en eğitimli ve en güçlü demokrasi geleneklerinden birine sahip ülkesinde ciddi sayıda seçmenin Trump gibi bir zavallıya oy vermeye ikna ettirilebilmesindeki trajikomiklik bir tarafa, durumdan ders çıkaran yüz binlerce insan Facebook hesabını kapattı. Kişisel verilerin gizliliği ve internetin hayatlarımızı idame ettirme şeklimizde yarattığı dönüşümler hiç beklenmedik bir anda, hatta bilakis sosyal medyanın iyiden iyiye yaygınlaştığı bir süreçte (2016 Google verilerine göre insanların müptelalık listesinde Facebook ilk 10’da yer alıyor, seks ve aşkla hemen yan yana) ciddi bir sorgulamaya konu olmuşa benziyor.

Tüm bunlar olup biterken, Koç Üniversitesi Yayınları’na tam da hayatımızda ve özel olarak da ABD başkanlık seçimlerinde internetin rolünü konu alan bir kitap çeviriyordum: New York Times yazarlarından veri bilimcisi Seth Stephens-Davidowitz’in Bana Yalan Söylediler kitabı bu hafta raflardaki yerini aldı.1 Kitapta anlatılanlar, Facebook manipülasyonunun hiç de bugün keşfedilmiş bir şey olmadığını, sadece gündemimize yeni girdiğini gösteriyor.

***

Çok değil bundan 10-15 yıl önce kapitalizm öyle bir araç/medya geliştirecek ki, insanlar en kişisel bilgilerini, en mahrem yanlarını, en özel anlarını ortalık yerde seve seve paylaşacak denseydi, herhalde bu kuruntuya öncelikle istihbarat şefleri gülerdi. Ama kapitalizmin özelliği bu: Kendisinden önceki toplumsal şekillenmelerden farklı olarak ekonomik bekasını ve siyasî istikbalini esasen ekonomi-dışı zora dayandırmıyor, başka bir deyişle havuç-sopa dinamiğinde iki sopa vuruyorsa üç havuç veriyor. Toplumsal hegemonyasını rızaya dayandırıyor. Bu ilişkide korkutup sindirmek, Kautsky anlamak istememiş olsa da, vazgeçilmez bir yer tutuyor, ama özellikle de ekonomideki artının muazzam boyutlara ulaşmasıyla birlikte, dağıtılabilecek sus paylarının çoğalması sonucu ikna ve kabullendirme daha ağırlıklı bir rol oynuyor.

Bana Yalan Söylediler, Seth Stephens-Davidowitz, Çev.: Ferit Burak Aydar, Koç Üniversitesi Yayınları

Facebook, Twitter, Instagram gibi araçlar bu açıdan kapitalizmin yoğunlaşmış bir ifadesi gibidir. İnsanları toplumsal hayatlarını en ince ayrıntısına kadar paylaşmaya iterek sermayeye elindeki malzemeyi çok daha iyi tanıyabilme fırsatı sunuyor. Ama diğer yandan, tıpkı Mısır’da Tahrir eylemlerinde veya bizde Gezi isyanında ve daha başka yerlerde olduğu gibi, kapitalizmi kendi silahıyla vurabilecek potansiyeli de barındırıyor. Marx’ın başka bir yerde kullandığı benzetmeyle ifade edersek, kapitalizm bir yandan kendi kârını azamileştirmenin yollarını bulurken aynı anda kendi mezarkazıcılarını da yaratıyor.

Her halükârda, sosyal medya hesaplarının bu şekilde mahremimize dalıyor ya da buyur ediliyor olması ciddi bir tartışma konusu ve Stephens-Davidowitz’in kitabında ele aldığı temel başlıklardan biri de bu olgunun etik içerimleridir. Tristran Harris’in özlü ifadesiyle söylersek: Ekranın diğer tarafında, işleri sizin kendi kendinizi denetleme çabanızı baltalamak olan yüzlerce insan bulunuyorken, ne kadar güvendesiniz? Stephens-Davidowitz kullanılan A/B testlerinin deneme yanılma yöntemiyle insanların belli bir siteye en çok hangi koşullarda geri döneceklerinin hesaplanabildiğini, bu sayede elde edilen ciddi bir veritabanı (“Büyük Veri”) ile bireylerin rahatlıkla çözülebileceğini anlatıyor. Örneğin patronların iş adaylarını değerlendirirken sosyal medya profillerine artık daha fazla baktığına vurgu yaparak şu soruyu soruyor: Eğer patronlar müstakbel çalışanlarının önceki patronlarını kötülediğine ya da önceki patronlarının sırlarını afişe ettiğine dair kanıtlar arıyorlarsa buradan etik sorular doğmaz. Peki, ya o kişinin sosyal medya hesabında önem verdikleri bir şeyle bağıntısı olan görünüşte zararsız bir işaret bulurlarsa?

Bu konuda sayısız deney ve girişim söz konusu. Örneğin yakın zaman önce, Indiana Üniversitesi ile Manchester Üniversitesi’nden bir grup bilgisayar mühendisi insanların hangi tweet’leri attığına bakarak piyasaların seyrini doğru tahmin edebilecekleri iddiasıyla ciddi bir çalışma için kolları sıvamışlardı. Dünyanın günlük ruh hâlini tweet’ler temelinde şifreleyecek bir algoritma geliştirmişlerdi. Gelgelelim sadece tek bir ruh hâlini değil, birçok ruh hâlini kodlamışlardı: Mutluluk, öfke, nezaket ve daha fazlası. Sakinlik ifade eden tweet’lerin ağır basmasının (“Sakin hissediyorum” gibi) Dow Jones Sınai Ortalaması’nın altı gün sonra yükseleceğinin habercisi olduğunu tespit etmişlerdi. Bulgularından yararlanmak üzere bir hedge fon oluşturuldu.

Fakat bu girişim başarısız oldu. Neden? Stephens-Davidowitz’in tabiriyle, “boyutluluk laneti”nden ötürü! Başka bir deyişle, temel sorun çok fazla şeyi test etmiş olmalarıydı. Eğer yeterince şeyi test ederseniz, bunlardan biri, tamamen şans eseri, istatistiksel değer taşıyabilirdi.

Gelgelelim bu bilgisayar mühendislerinin başarısız olmaları, ileride yeni girişimlerin de akamete uğrayacağı anlamına gelmiyor. Yazar, “Tehlikenin farkında mısınız” diyor! Büyük Veri, işletmelere müşterilerin ne fiyat ödemeye hazır olduğunu çok daha iyi öğrenmelerinde ve dolayısıyla belli grup insanları değerlendirmelerinde yardımcı olabiliyor. Sözgelimi Optimal Kararlar Grubu veri biliminden yararlanarak müşterilerin sigorta için ne kadar ödemeye hazır olduklarını tahmin etme konusunda öncü bir kuruluştu. Nitekim Trump’ın –sadece Trump’ın da değil– ve aynı zamanda Obama’nın seçim başarıları bu felaketin bir ön habercisi mahiyetindedir.

***

2016’daki Cumhuriyetçi başkan adayı seçimlerinde, anket şirketleri Donald Trump’a hiç şans vermiyorlardı. Keza birçok anket şirketi Trump’ın genel seçimlerde kaybedeceğini düşünüyordu. Benzer bir yanılgı Brexit ve başka seçimlerde de görülmüştü. Geleneksel anket şirketleri ve kamuoyu yoklamaları neden yanılıyordu? Stephens-Davidowitz, “Trump’ın hem ön seçimleri hem de genel seçimi kazanabileceğine dair bazı ipuçları vardı, ama bu ipuçları internetteydi” diyor. Veri uzmanlarının, başka bir adla veri bilimcilerinin bu ipuçlarını yakalayabildiklerini ve yakalayabileceklerini iddia ediyor.

İnternet veri bilimi insanların internette dolaşırken bıraktıkları dijital izlerin, gerçekte ne istediğimizi, gerçekten ne yapacağımızı ve gerçekte kim olduğumuzu anlatabileceği varsayımına dayalıdır. Bu açıdan Google Trends (Google Trendleri) uygulaması can alıcı bir öneme sahiptir. Şöyle diyor yazar:

İnsanların bilgi arayışı kendi içinde bir bilgidir. Görünen o ki, nerede ve ne zaman olgu, alıntı, şaka, yer, insan, şey ya da yardım aradıkları bize gerçekte ne düşündükleri, gerçekte ne istedikleri, gerçekte nelerden korktukları ve gerçekte ne yaptıkları hakkında kimsenin tahmin edemeyeceği kadar çok şey anlatabilir. Bu tespit bilhassa doğrudur, zira insanlar bazen Google’da bir şey aramaktan ziyade Google’la sırlarını paylaşıyorlar: “Patronumdan nefret ediyorum.” “Sarhoşum.” “Babam bana vurdu.”

Her gün dikdörtgen şeklindeki beyaz bir kutucuğun içine bir kelime ya da cümlecik yazmak, milyonlarla çarpıldığında nihayetinde derin gerçeklikleri açığa seren küçük bir hakikat parçası doğurur. … Google verilerinin gücü insanların başka birilerine söylemek istemeyebilecekleri şeyleri dev arama motoruna yazmalarından geliyor.

Nitekim Trump’ın seçim başarısında ırkçı eğilimlerin ve bunun internetteki yansıması olarak ırkçı aramaların doğru konumlandırılmış olması önemli bir yer tutuyor. ABD’de anketler ve geleneksel düşünce, ırkçılığı ağırlıklı olarak Güney’de ve çoğunlukla da Cumhuriyetçiler arasında tezahür eden bir olgu olarak görüyordu. “Ama ırkçı aramaların en yüksek olduğu yerler arasında New York’un kuzeyi, doğu Ohio, sanayi merkezi Michigan ve kırsal Illinois ile Batı Virginia, güney Louisiana ve Mississippi vardı. Başka bir deyişle, Google arama verilerinin söylediğine göre, gerçek bölünme Güney-Kuzey şeklinde değil, Doğu-Batı şeklindeydi.” En önemlisi, ırkçılık Cumhuriyetçi seçmenlerle sınırlı kalmıyordu. Öyle ki ırkçı aramalar Cumhuriyetçilerin sayıca güçlü olduğu yerlerde Demokratların sayıca güçlü olduğu yerlerden daha fazla değildi. Stephens-Davidowitz’in iddiasına göre, Trump’ın ekibi –sadece Facebook manipülasyonu sayesinde değil– bu ırkçılık haritasını doğru okuyarak da seçmene istediğini verip seçimlerden zaferle ayrılmıştı.

İnternet verileri sadece ırkçılık konusunda değil, insanların neyi ve hangi sırayla, hangi kelimelerle aradıklarına bakarak da doğru çıkarımlarda bulunabiliyor. “Oy vermeyen yurttaşların yarısından çoğu seçimden hemen önceki anketlerde, sandığa gitme niyetinde olduğunu söylüyor ve dolayısıyla seçim tahminimizi yanıltıyorlar, oysa Google’da seçimlerden bir hafta önceki ‘nasıl oy verilir?’ ya da ‘nerede oy verilir?’ aramaları ülkenin hangi kısımlarının seçimlere daha büyük katılım sağlayacağını kesinkes söyleyebilir” diyor Stephens-Davidowitz. Örneğin ABD’deki siyahlar Trump’ı durdurmak adına akın akın sandığa gideceklerini söylüyorlardı. Ama siyahların yoğun olarak yaşadığı bölgelerde oy verme konusunda bilgi almak için yapılan Google aramaları çok düşüktü. Nitekim seçimlerde Clinton siyahların düşük katılımından ötürü ağır yara aldı.

Keza görünüşte anlam ifade etmeyen bazı aramalar bile hangi adayın desteklendiğine dair bazı ipuçları sunuyordu. Stephens-Davidowitz meslektaşı Stuart Gabriel ile yaptığı araştırmada, seçimle alakalı aramaların büyük bir kısmının her iki adayın da adlarını içerdiğini, ama bir insanın arama yaparken desteklediği insanın ismini diğer adayınkinden önce yazma ihtimalinin çok daha yüksek olduğunu tespit etmişlerdi:

Önceki üç seçimde, ismi ilk sırada en çok yazılan aday en fazla oyu almıştı. İşin daha da ilginç yanı, adayların Google’da hangi sırayla arandığı o eyaletin hangi yöne gideceğinin de habercisiydi. … Gabriel ile ben Clinton’ın kazanması beklenen Ortabatı’daki kilit eyaletlerde “Trump Clinton” aramalarının “Clinton Trump” aramalarından daha fazla olduğunu tespit ettik. Öyle ki Trump zaferini bu eyaletlerde anketlere kıyasla çok büyük başarı elde etmiş olmasına borçluydu.

***

Stephens-Davidowitz’in kitabı, anlaşılacağı üzere, sadece seçimler ve internet üzerine kurulu değildir. Yazar, internetin sosyoloji bilimini kesinkes dönüştürdüğünü, ama sosyologların henüz bunu tam anlamıyla idrak edemediklerini savunuyor. Tam da bu nedenle, kitabını “Bugün hemen her konuda elimizde bu kadar çok veri varken insan olmanın ne anlama geldiği sorusunun özüne inen büyük, derin soruların peşine düşmek anlamlıdır. Veri analizinin geleceği parlaktır. Bir sonraki Kinsey, hiç şüphem yok, bir veri bilimcisi olacak. Bir sonraki Foucault bir veri bilimcisi olacak. Bir sonraki Freud bir veri bilimcisi olacak. Bir sonraki Marx bir veri bilimcisi olacak. Bir sonraki Salk da pekâlâ bir veri bilimcisi olabilir” gibi iddialı bir beyanla bitiriyor. Özellikle de cinsellik ve porno ile ilgili açıklamalarına bakarak, bu iddiasını hiç de yabana atmamak gerektiğini söyleyebiliriz.

Yazarın kalkış noktası şudur: Porno verileri ve genel olarak Google’daki cinsellikle ilgili arama verileri hem yeni bir olgudur hem de dürüsttür. İnsanlar dün olduğu gibi bugün de utanç verici düşüncelerini diğer insanlardan çoğunlukla saklıyorlar. Oysa internete girdiklerinde diğer insanlardan saklamaya devam ettikleri şeyleri internetten ve özellikle de anonim kalmalarını sağlayan Google ve PornHub gibi sitelerden saklamıyorlar ve birçok veri ortaya koyuyorlar. Nasıl olmasın ki? Erkekler Google’a vücutlarındaki hiçbir organı penislerini sordukları kadar çok sormuyorlar: Akciğerleri, karaciğerleri, ayakları, kulakları, burunları, boğazları ve beyinleri hakkında sordukları soruların toplamından daha fazladır. Oysa aynı veriler, kadınların penis büyüklüğünü o kadar da umursamadığını gösteriyor.2

Hâl böyle olunca, çabuk genellemelere kaymadan ve tek yönlü okumalar yapmadan, yani sadece internet üzerinden yapılan araştırmalarda değil her türlü sosyolojik araştırmada uzak durulması gereken yöntemlerle bakıldığında, büyük veri havuzu muazzam bir kaynaktır.

Sözgelimi veriler Amerikalıların her yıl satılan kondom sayısından çok daha fazla kondom kullandıklarını iddia ettiklerini ortaya koyuyor. Keza kanıtlar ne kadar sık seks yaptıklarını da abarttıklarını gösteriyor.

On beş ila kırk dört yaş arasındaki kadınların yaklaşık yüzde 11’i cinsel açıdan aktif olduğunu, şu an hamile olmadığını ve doğum kontrol hapı kullanmadığını söylüyor. Bilimciler çiftlerin kaç defa seks yaptıklarına dair görece tutucu varsayımlarda bulunulduğunda bile, her ay yüzde 10’unun hamile kalması gerektiğini düşünüyor. Oysa bu sayı ABD’deki toplam hamilelik sayısını aşacaktır (çocuk doğurma yaşına gelmiş kadınlarda 113’te 1). Seks takıntılı kültürümüzde o kadar da seks yapmadığınızı kabullenmek zor olabilir.

Keza porno sitelerinde insanların hangi tür videoları izlemek istedikleri de cinsellik konusundaki eğilimlerin sanıldığından çok farklı olduğunu gösteriyor. Yazar PornHub sitesinden bu verileri aldığını ve örneğin ensest aramalarının tıpkı Google’da olduğu gibi PornHub’ta da çok ciddi boyutta olduğunu söylüyor; burada muazzam bir maden varken, araştırmacıların ezici çoğunluğunun dijital çağın getirdiği veri patlamasını görmezden gelmelerine anlam veremediğini belirtiyor. Dünyanın en ünlü seks araştırmacıları denenmiş ve doğru olana tutunmakta ısrar ediyorlar. Birkaç yüz deneğe arzularını sormakla yetiniyorlar ve PornHub gibi sitelerden verilerle ilgilenmiyorlar. Psikolojide, siyaset biliminde ve sosyolojide lisans öğrencilerine öğretilen metodolojiler, genel itibariyle, dijital devrimden etkilenmemiştir. Veri patlamasının açtığı ve büyük oranda hâlâ bakir olan alan, az sayıdaki ileri görüşlü profesöre, dikkafalı lisans öğrencisine ve amatöre terk edilmiştir. Halbuki, diyor, Büyük Veri’den yararlanılsa, aylarını az sayıda lisans öğrencisinin tek bir testi yapmalarını beklemekle geçiren akademisyenlerin cefası bitecektir, zira akademisyenler birkaç yüz ya da birkaç bin fikri sadece birkaç saniyede test etmek için dijital verilerden yararlanabilirler. Böylece çok daha az sürede çok daha fazla şey öğrenebiliriz.

Seth Stephens-Davidowitz’in iddiası bu direncin er geç kırılacağı ve veri biliminin kabul edileceği yönünde. Haksız da sayılmaz.

1 Seth Stephens-Davidowitz, Bana Yalan Söylediler: İnternet ve Gerçek Yüzümüz [Everybody Lies…], çev. Ferit Burak Aydar, Koç Üniversitesi Yayınları, Nisan 2018, 256 sayfa.
2 Stephens-Davidowitz bu noktada ufak bir not da düşüyor: Erkeklerin cinsel organıyla ilgili Google’a en çok sorulan sorulardan biri, “Penisim ne kadar büyük?”tür. Erkeklerin cetvele değil de Google’a başvurmaları, kanaatimce, yaşadığımız dijital çağın özsel bir ifadesidir!