ChatGPT4o: Geleceğin önizlemesi

OpenAI’ın geçen hafta içinde duyurusunu yaptığı yeni yapay zekâ modeli ChatGPT 4o

Bugün sizlere OpenAI’ın geçen hafta içinde duyurusunu yaptığı yeni yapay zekâ modeli ChatGPT 4o’dan söz etmek istiyorum. Lakin endişe etmeyin, teknik konularla halihazırda herkes gibi karışmış olma ihtimali olan kafanızı daha fazla karıştırmayacağım. Sadece 4o’nun bize sunduğu yeni pencereden geleceğin nasıl göründüğünü anlatmaya çalışacağım.

Önce şunu belirteyim, biz yapay zekâ deyince ChatGPT gibi Geniş Dil Modelleri’ni (LLM) anlıyoruz sıklıkla. Yapay zekâya sözcüklerle dert anlattığımız, bunu da yazarak yaptığımız bir modelden söz etmiş oluyoruz. Aslında biz kendi dilimizde, kendi sözcüklerimizle yapay zekâya ne yapmasını istediğimizi söylemiş oluyoruz. O da bunu anlıyor ve isteğimizi yerine getirip çıktısını da bize yine metin veya görüntü olarak iletiyor.

Yani aslında biz makinelerle konuşabilmek için kod yazmayı öğrenmedik de makinelere kendi dilimizi öğrettik gibi düşünün. Yoksa aynı istekleri birtakım karmaşık kodlarla anlatabilirdik. Ama artık isteğimizi kendi dilimizde yaptığımızda makine bunu anlıyor. Bu sayede onların nasıl çalışmasını istediğimizi rahatlıkla anlatabiliyoruz.

Bir de Çok Modlu Geniş Dil Modelleri var (MLLM). Aradaki fark basit: Bu kez işin içine ses, görüntü, video da giriyor. Yani artık yazarak anlatmamız da gerekmiyor. “Çok modlu” oldukları için makinelere konuşarak ve video aracılığıyla da dert anlatabileceğimiz yeni bir döneme giriyoruz.

Çok eskiden mektup yazardık haberleşmek için. Sonra telefonlaşmaya başladık. Daha sonra görüntülü konuşmaya… Aynısı oluyor şu anda. İşte ChatGPT4o tam da bu noktada yeni bir geleceğin demo’sunu sunuyor bize.

Buradaki en büyük sorun zamanlamaydı. Yani biz konuşacağız ve makine bunu aynı anda hem anlayacak hem de anında bize cevap verecek. Bunu ses ve videoda yapabilen ve iyi çalışan -Google’ın Gemini’ı bu iddiadaydı ama böyle bir performans gösteremiyordu- bir dil modeli daha önce olmamıştı. ChatGPT4o ise neredeyse eşzamanlı bir şekilde bizimle konuşuyor, videoda gördüklerini algılıyor ve bu sesler & görüntüler ile ne yapmasını istersek onu aynı anda yapıyor.

İşte bu yüzden 4o’nun pazarlama videolarını görünce şapkamız uçtu. Simultane tercüme yapabiliyor, bizi iş görüşmelerine hazırlayabiliyor, kameradan gördüğü bir köpeğin köpek olduğunu anlayabiliyor ve hatta iki ChatGPT4o birlikte şarkı söylüyor.

Peki bu nasıl bir gelecek demek?

Buradan sonra gelin işin biraz spekülatif ve fütürist kısmına girelim: Bir kere klavyelere veda edeceğimizi söyleyebiliriz. Makinelerimize dert anlatmak için klavyeler aracılığıyla cümleler kurmamıza gerek kalmayacak. Yazı yazarken bile biz konuşacağız, yapay zekâ not alacak. Devlet başkanları gibi…

Yine aynı şekilde ekranlarımızı da görecekleri için ekranları da bugünkü kadar sık kullanmak zorunda kalmayacağız. Mesela bir yemek uygulamasından yemek siparişi verirken yapay zekâya “Bana bir kilometre yakınımda ev yemekleri yapan restoranlardan puanı en yüksek olan beş tanesini söyler misin” diye sorabileceğiz. Yahut “Instagram’a son girişimden bu yana son fotoğrafımı kaç kişi beğendi ve bunların hangileri benim arkadaşlarım” gibi bir soruyla bugün merakla açtığımız uygulamayı artık sadece başkalarının içeriklerine bakmak için açacağız. Onda da yapay zekâdan telefonu evdeki televizyona yansıtmasını isteyeceğiz belki de…

Bunlar için çok uzun süre bekleyeceğimizi de sanmıyorum. Zira OpenAI geçen hafta sadece 4o’yu duyurmakla kalmadı, rüzgârı arkasına alarak Apple ile anlaştıklarını da açıkladı. Apple dünyanın en “nakit zengini” şirketlerinden biri… O kadar ki, 110 milyar dolarlık hisselerini geri alma planlarını birkaç hafta önce açıkladılar. Benzeri bir geri alma girişimine kapitalizm tarihinde daha önce rastlanmadı. Şimdi o milyar dolarların bir kısmı OpenAI’a akacak.

Dolayısıyla kısa bir süre içinde telefonlarımıza bir türlü dert anlatamadığımız Siri yerine ChatGPT’nin Apple’a özel bir versiyonu güncelleme olarak gelecek. Ve biz başlayacağız telefonumuzla konuşmaya…

Buradaki tek sorun tüm bu işlemlerin maliyeti. Sizi teknik bilgiye boğmamak için detaylara girmiyorum ama yapay zekâyı bu “çok modlu” versiyonda çalıştırmak hiç kolay iş değil. Fakat orada da imdada çip teknolojisinde yaşanan gelişmeler yetişiyor. Çok daha az elektrik tüketen ve buna karşın çok daha hızlı işlem yapabilen çipleri daha önce anlatmıştım. Yine de bugün yapay zekânın bu yeni fonksiyonlarını sınırsız tüketemiyoruz. ChatGPTPlus üyeliğinde de GPT4 ve GPT4o’ya getirilen bazı günlük sınırlar var. Bir sonraki aşamada bu sınırların da yavaş yavaş kalktığına ve süreklilik kazandığına şahit olacağız.

Peki, sırada ne var?

OpenAI açısından bakarsak asıl sıçramanın ChatGPT’nin bir sonraki sürümünde yapılacağı söyleniyor. Yani hem “çok modlu” çalışan hem de daha gelişmiş bir zekâyla karşılaşmamızın beklendiği ChatGPT5 (belki de ismi farklı olur) sürümünde… Google, Meta ve OpenAI’da devam eden çalışmaların nihai amacı ise bir genel yapay zekâya ulaşmak. Yani her şeyi yapabilen, her işte kullanılabilecek tek bir modele. “Böyle bir model artık bilinç kazanmış olacaktır” diyen de var, “Saçmalamayın ChatGPT4o gibi usul usul işini yapan bir yazılımdan söz ediyoruz nihayetinde” diyen de… Yaşayıp göreceğiz.

Son olarak şunu belirtmek isterim: Henüz yolun başındayız. Lakin gördüğünüz gibi her şey çok hızlı gerçekleşiyor. Tüm bu anlattıklarımın insanın iş yapış süreçlerini baştan aşağı değiştireceğini biliyoruz. Mesela ChatGPT4o’nun duyurulmasıyla birlikte sesi metne çeviren (voice to text) onlarca girişim bir gecede ortada kaldı, hisseleri düştü, bazıları iflasa sürüklendi.

Tam da bu yüzden kendini teknoloji tüketirken “boomer”lığa daha yakın hisseden birisi olarak olup biteni elimden geldiğince anlamaya çalışıyorum. Siz sevgili okurların da böyle bir teknolojiden ürkmek yerine -ki bu çok anlaşılabilir bir duygu- bu koskocaman okyanusa atlayıp bir yerden yüzmeye başlamanızı dilerim.

Çünkü gelecek bu… İstesek de istemesek de…

NOT: ChatGPT4o’ya dair daha kapsamlı düşüncelerimi hazırladığım podcast’in yeni bölümünde de anlattım. Buradan dinleyebilirsiniz.

Eray Özer kimdir?

Eray Özer ODTÜ'de psikoloji okudu, sosyoloji hatmetti. Akabinde Bilgi Üniversitesi'nde yüksek lisans, Anadolu Üniversitesi'nde ise tez aşamasına takılan bir doktora ile akademik hayattan bir türlü elini eteğini çekemedi. Hatta iki yıl boyunca Kadir Has Üniversitesi'nde sosyoloji dersleri verdi.

Meslek hayatına Radikal Gazetesi'nde başladı, kısa süreli televizyon haberciliği deneyiminin ardından Doğuş Dergi Grubu'nda devam etti.

Son olarak ise Cumhuriyet hafta sonu eki Sokak'ı çıkaran ekipte yer aldı. Radikal, Birgün, Cumhuriyet ve Diken'de yazdı.

Yaklaşık dört sezondur devam eden bir podcast içeriği hazırlıyor. Buzdolabının tarihinden Yapay Zekâ'ya, Roman halkının hikâyesinden Kayıp Kıta Mu'ya birbirinden farklı konular hakkında hiç bilinmeyenlerin anlatıldığı "Yeni Haller" ismindeki podcast yayınına Spotify'dan veya tüm podcast uygulamalarından ulaşabilirsiniz.