Sanırım fıkrayı bilirsiniz. Dünyanın en güçlü bilgisayarı yapılmış ve bu bilgisayarı test etmek için biri Amerikalı biri Alman diğeri de Türk 3 kişi seçilmiş. Bunlardan bilgisayara çok zor bir sorması istenmiş. Amerikalı profesör bilgisayara bir soru girmiş ışık hızıyla cevabı almış. Keza Alman bilim insanı da... Sonra sıra Türk'e gelmiş. Temel oturmuş bilgisayarın başına ve sorusunu yazmış. 10 saniye geçmiş bilgisayardan ses yok. Bir dakika olmuş, yine cevap yok. Herkes merakla beklerken bilgisayardan dumanlar yükselmeye başlamış. Herkes kaçışırken Amerikalı profesör Temel'e dönmüş, "Ne soru sordun yahu?" demiş. Temel "hiçç" diye cevap vermiş. "Ne var ne yok" dedim.
Bu fıkra geçenlerde ABD ve Çin Sohbet Robot (Chatbot)'larını inceleyen bir yazı vesilesiyle aklıma geldi. Microsoft'un finansmanıyla OpenAI tarafından geliştirilen ChatGPT ile Çin'in en büyük arama motoru Baidu'nun Ernie (文心一言)'sinin [1] karşılaştırıldığı yazıda [2] değerlendirmeyi yapan kişi Ernie'ye "4 Haziran 1989'da ne oldu?" diye soruyor. Malum, demokratik taleplerle Pekin'de Tiananmen Meydanı'na toplanmış olan gençlere karşı 4 Haziran 1989'da güç kullanılmaya başlanmış ve binlerce genç hayatını kaybetmişti. Bu konu bugün Çin'de hâlâ bir tabu niteliğinde. Tiananmen'de yaşananlar konusunda ülkede online ya da basılı bir bilgiye hatta görsele rastlamak mümkün değil. Yeni kuşaklar bu olaydan tamamen habersiz. Sosyal medyada bu konuyu ima eden bir kelime ya da görsel paylaşmak bile sakıncalı.
Baidu CEO'su 16 Martta Pekin'de yapılan Ernie Bot'un tanıtım toplantısında konuşurken
Ernie bu soru karşısında ilkin Temel tarafından beyni yakılan bilgisayar davranışı göstermiş, kapanıp kendini yeniden başlatmış. Ama belli ki ondan daha kıvrak zekâlı. Yeniden yüklenen arayüzde şöyle bir mesaj belirmiş: "Farklı bir konuya geçelim mi?"
İki sistemin karşılaştırılması sonucu Ernie'nin Çince de ChatGPT'nin ise İngilizce'de daha başarılı olduğu gibi bir değerlendirme yapılıyor ana hatlarıyla.
* * *
Çin, yapay zekâ konusuna özel bir önem veriyor. Bu alandaki yatırımlar teşvik ediliyor. IDC'ye göre Çin'in yapay zekâ alanındaki yatırımlarının 2026'da 26.7 milyar dolara ulaşması bekleniyor. Bu küresel düzeydeki yapay zekâ yatırımlarının yüzde 8.9'una denk geliyor.
Geçmişte bu yatırımların önemli bölümü yüz tanıma sistemleri gibi alanlara yöneldi. Sohbet robotu (Chatbot) yakın zamana kadar öncelikli bir konu değildi. Bu durum ChatGPT ile değişti denebilir.
Çin'de yapay zekâ yatırımları (tahmin, milyar dolar)
Kaynak: IDC
Parametre sayısı 175 milyar gibi muazzam bir düzeyde olan ChatGPT bu sektörde olan herkesi etkiledi kuşkusuz. Büyük bir meydan okumaydı bir anlamda.
Çin'deki ulusal arama motoru Baidu'(百度)'nun CEO'su Robin Li (李彦宏) şirketinin ChatGPT ile eşleşebilecek kendi büyük dil modelini (LLM) oluşturmasının gerekli olduğu düşüncesinden hareketle çalışmaları başlattığını söylüyor. Ernie geçen mart ayında Çin'de piyasa çıkan ilk sohbet robotu oldu.
Yapay zekâ eskiden beri Baidu'nun öncelik verdiği alanlardan biri durumunda.
Çin Bilgi ve İletişim Teknolojileri Akademisi (中国信息通信研究院) tarafından yayımlanan rapora göre Baidu, büyük dil modelleri (LLM) alanında yaklaşık 700 patent başvurusunda bulunmuş ve 160'tan fazla patent almış.
Baidu geçen haziranda yaptığı açıklamada, Ernie'nin en son sürümü olan Ernie 3.5'in "kapsamlı yetenek puanlarında ChatGPT'yi" geçtiğini ve "Çince olarak gerçekleştirilen birçok fonksiyonda GPT-4'ü" geride bıraktığını söyledi.
Ernie 4 Temmuz'tan itibaren de Çin'deki Apple uygulama mağazasına yüklendi, genel kullanıma açıldı.
* * *
Baidu bu alanda yalnız değil. Alibaba Baidu'nun duyurusunun hemen ardından nisan ayında "Tongyi Qianwen (通义千问)" adlı sohbet robotunun test sürümünün hazır olduğunu ilan etti. "Tongyi Qianwen" yaklaşık olarak "binlerce soru sormak" anlamına geliyor.
Şirket, uygulamanın öncelikle Alibaba'nın farklı iş kollarındaki işletmelere entegre edileceğini açıkladı.
"Üretken yapay zekâ ve bulut bilgi işlemin yönlendirdiği teknolojik bir dönüm noktasındayız ve tüm sektörlerdeki işletmeler, oyunda bir adım önde olmak için zekâ dönüşümünü benimsemeye başladı" diyen Alibaba Grup Başkanı ve CEO'su Daniel Zhang (张勇) "Tongyi Qianwen"in üretim, çalışma ve hayatlarımızı yaşama şeklimizde büyük değişiklikler getireceğini iddia ediyor.
TikTok'un yaratıcısı ByteDance (字节跳动) ise farklı bir yol tercih etmişe benziyor. Şirket, kendi sohbet robotunu oluşturmak yerine bulut yan kuruluşu Volcano Engine aracılığıyla büyük dil modeli (LLM) geliştirenlere hizmet sunmayı seçti. Volcano Engine yapay zekâ uzmanlarının büyük ölçekli modelleri eğitmesine yardımcı olmak için tasarlanmış olan güncellenmiş bir makine öğrenimi platformu hizmeti sağlıyor.
Şu anda Çin'de düzinelerce büyük model geliştiricisi var ve bunların yüzde 70'inden fazlası Volcano Engine'in bulut hizmetlerini kullanıyor.
Evet sadece yapay zekânın en güncel alanında çalışma yapana şirket sayısı bile düzinelerce.
Çin ile ABD arasında yapay zekâ alanındaki yarışma Musk ile Zuckerberg arasındaki kafes döğüşünden daha heyecanlı olacağa benzer…
YAPAY zekâ TERİMLERİ SÖZLÜĞÜYapay zekâ (Artificial intelligence -AI) İlk kez bilgisayar bilimcisi John McCarthy, tarafından 1950'lerde ortaya atıldı. Oldukça geniş anlamlı bir terimdir. Teknolojinin insan zekâsını modellemek için kullanımını ifade eder. Yapay zekâ, daha ucuz, daha hızlı ve insan hatasından arınmış hem de kişiselleştirilmiş ürünler, hizmetler ve haberler vaat eder. Halihazırda yapay zekâ, veri işlemede veya konuşmada insana benzer yetenekler gösterebilse de, aslında makineler henüz ne yaptıklarını veya ne söylediklerini "anlamıyor". Hâlâ esas olarak algoritmalara marifetiyle bunları gerçekleştirebiliyor. Algoritma Bir sorunu çözmek, belirli bir sonuca ulaşmak için oluşturulan adım adım gerçekleştirilen talimatlar (instructions) dizisidir. Önce bir girdi söz konusudur, buna mantık uygulanır ve bir çıktı elde edilir. İnsanlar aslında yüzyıllardır sorunları çözmek için algoritmalar kullanıyor. Örneğin bazı finansal analistler, on yıllardır gelecekteki gelişmeleri tahmin edebilen ve böylece para kazanmalarını sağlayacak algoritmalar geliştirmeye çalışırlar. Bu gibi "geleneksel" algoritmalar artık yerlerini, "makine öğrenimine" bırakıyor Makine öğrenimi (Machine learning) Bu, algoritmaları verilerle besleme sürecidir, böylece algoritmalar zamanla daha rafine ve karmaşık hale gelirler. Bir bilgisayarın, çok sayıda "girdi" ve "çıktıyı" gözden geçirerek, eldeki işin ayrıntıları konusunda eğitim alması gerekmeden "öğrenmesine" olanak tanır. Örneğin iPhone fotoğraf uygulamasını (app) düşünün. Başlangıçta, yüzünüzün neye benzediğinizi bilmez. Ancak, uzun süre boyunca ve çeşitli ortamlarda çekilmiş fotoğrafları kendi yüzünüz olarak etiketlemeye başladığınızda, makine yüzünüzü tanımayı "öğrenir". Ne kadar çok veri ile beslenirse o kadar etkili ve verimli olur. Algoritma ve makine öğrenimine iyi bir örnek Toutiao (头条) uygulamasıdır. "Haber başlıkları" anlamına gelen bu uygulamanın hedefi her kullanıcının her an kendi haberler ön sayfasını görmesiydi. Toutiao, Twitter, Facebook gibi pek çok platformun aksine kullanıcının arkadaşları, bağlantıları vb. ile ilgilenmiyordu. Kullanıcının bir hesap oluşturmasına, tercihlerini ve beğenilerini belirtmesine, tanımlamasına gerek yoktu. Uygulamayı yükledikten sonra kullanıcılara bazı haberler sunuluyordu. Kullanıcının bunlara gösterdiği tepkiler (okumadan geçmek, kısaca bakıp geçmek, tümüyle okumak, yorum yazmak vb) algoritmanın kullanıcıyı tanıyıp tercihlerini bilmesine yetiyordu. Ama daha iyisi bu öneri motorunun her kullanımla daha gelişip daha iyi hale gelmesiydi. Daha fazla kullanıcı daha fazla veri demekti, daha fazla veri daha akıllı bir algoritma anlamına geliyordu. Kısacası verimli bir döngü söz konusuydu. Toutiao piyasaya çıktıktan sadece dört ay sonra günlük 2 milyon kullanıcıya ulaştı. 2017'de 2.5 milyar dolar gelir elde etmiş ve internet tarihinin kısa zamanda en fazla gelir yaratan uygulamalarından biri haline gelmişti. ByteDance'ın bu uygulaması daha sonra TikTok mucizesinin gerçekleşmesini de sağlayacaktı. ByteDance 2018'de Tiktok'u ABD'de kullanıma sunduğunda işe Facebook, Instagram, Snap ve diğer sosyal medya uygulamalarında yoğun tanıtımlarla başladı. Sadece 2018'de yaklaşık 1 milyar dolarlık reklam harcaması yaptı. 2019'da reklam harcamalarını biraz daha artırdı, günden yaklaşık 3 milyon dolar harcıyordu. Ama buna rağmen TikTok yükleyen kullanıcıların sadece yüzde 10 kadarı 30 gün ve üzeri süreyle uygulamayı kullanıyordu. Genel kanı TikTok'un er geç pes edeceğiydi. Oysa TikTok'un algoritması Amerikalı kullanıcılar için neyin "cool" olduğunu öğrenme sürecindeydi. 2019 ortalarından itibaren ilk TikTok yıldızları ortaya çıkmaya başladı. 2020'de pandemiyle birlikte uygulamanın yıldızı iyice parladı. Bugün ABD'de 100 milyonun üzerinde kullanıcısı olan bir platforma dönüştü. Doğal Dil İşleme (Natural Language Processing – NLP) Doğal Dil İşleme, bilgisayarların konuşmayı ve metni bir insanın yaptığı gibi anlamasına, işlemesine ve üretmesine yardımcı olan bir yapay zekâ dalıdır. NLP, yazılı metinden veri çıkarmak, dilleri çevirmek, el yazısı kelimeleri tanımak ve anlam ve bağlamı ayırt etmek için makine öğrenimi algoritmalarına dayanır. Bu, Siri veya Alexa gibi sanal asistanlara yetke veren ve onların yalnızca istekleri anlamalarına değil, aynı zamanda doğal dilde yanıt vermelerine olanak tanıyan temel teknolojidir. NLP metindeki duyguyu da ölçebilir, bu yüzden Siri'ye "üzgünüm" derseniz, bir arkadaşınızı veya sevdiğiniz birini aramanızı önerir. NLP'nin kullanıldığı diğer günlük uygulamalar arasında e-posta spam filtreleme, web arama, yazım denetimi ve metin tahmini sayılabilir. Sohbet robotu (Chatbot) 1990'larda geveze robotlar (chatterbots) olarak adlandırılan bu ürünler, insanlarla 2. Dünya Savaşı'ndan kavunla yapılacak tatlı tariflerine kadar pek çok şey hakkında sohbetler yapabilen ChatGPT gibi gelişmiş araçlardır. Bunların "ata"larından biri şirketlerin "Bize Ulaşın" sayfalarında kullandıkları araçlardır. Bunlar sesle etkinleştirilen sanal asistanlar gibidir, nispeten basit ve diyalog becerileri sınırlıydı. Ancak yapay zekâdaki hızlı ilerlemelerin sonucu olarak sohbet robotlarının hızla gelişmesi bekleniyor. Bilgisayar görüşü (Computer Vision) Bilgisayarların resim ve video gibi görsel bilgileri taramasına, nesneleri ve insanları tanımlamasına ve sınıflandırmasına olanak tanıyan bir yapay zekâ alanıdır. Bu sistemler gördükleri şeylere tepki verebilir ve belirli bir eylemi gerçekleştirebilir veya önerebilir. Bu teknoloji, koruma amacıyla vahşi yaşamı izlemek ve insansız araçları yönlendirmek için kullanılıyor. Zaman zaman ırksal önyargılar göstermesi ve belli bir kişiyi tanımlama konusunda zaafiyetleri olması nedeniyle askeri ve polisiye amaçlı kullanımıyla ilgili endişeler var. Derin Öğrenme (Deep learning) Bilgisayarlara verileri insan beyninden esinlenerek işlemeyi öğreten bir yapay zekâ yöntemidir. En yaygın yapay zekâ biçimi olduğu söylenebilir. Derin öğrenme, bilgisayarların daha karmaşık sorunları çözmesini sağlayan bir makine öğrenimi altkümesidir. Derin öğrenme modelleri kendi kendilerine yeni özellikler de oluşturabilir. Derin öğrenme modelleri, doğru öngörü ve tahminler üretmek için resimler, metinler, sesler ve diğer verilerdeki karmaşık modelleri tanıyabilir. Görüntüleri tasvir etmek veya bir ses dosyasını metne dönüştürmek gibi tipik olarak insan zekâsı gerektiren görevleri otomatikleştirmek için derin öğrenme yöntemleri kullanılır. Ancak öğrenmesi amacıyla kullanılan veriler gerçek dünyayı yansıtmıyorsa ya da insani önyargıları barındırıyorsa yapay zekâ da bunları "içselleştirir". Örneğin kefalet, ceza ve şartlı tahliye kararlarının alınmasına yardımcı olmak için kullanılan bir yazılımın, siyahi sanıkları benzer durumdaki beyaz sanıklara göre gelecekte suç işlemeye daha yatkın olarak değerlendirmesi gibi. Üretken yapay zekâ (Generative AI) En kestirmeden ifadesiyle yeni bir görüntü veya ses oluşturmak için yapay zekânın kullanılmasıdır. Üretken yapay zekâ öğrenirken edindiği bilgilere dayalı olarak içerik oluşturur. Bu teknoloji, insan yaratıcılığını taklit etmek için gelişmiş algoritmalar, büyük veri kümelerine dayalı Büyük Dil Modelleri (LLM) gibi üretken modeller kullanır. Örneğin, metin veya kod yazmak, görsel içerik geliştirmek ya da müzik bestelemek. Deeepfake /derin sahtecilik) gibi kötüye kullanımı da söz konusu olduğundan "taklitçi (imitative) yapay zekâ" olarak da nitelenir. Yapay sinir ağları (Neural networks) İnsanın merkezi sinir sisteminden esinlenerek tasarlanmış yapılardır. Tıpkı insan beyninin yaptığı gibi deneme yanılma yoluyla öğrenmeye programlanmış bir yapay zekâ türüdür. Her başarı veya başarısızlık, gelecekteki girişimleri ve uyarlamaları güçlendirir. Tıpkı bir çocuğun beyninin kendisine öğretilenlere dayalı olarak nöral yolları haritalandırmayı öğrenmesi gibi, sanal "nöronlar" da kendilerine verilen bilgilere ve kendilerine söylenenlerin doğru olmasına dayalı olarak tepkiler üretmeyi öğrenirler. Bu nöronların bir araya getirilmesiyle çok katmanlı derin bir ağ elde edilebilir. Bu nedenle, özellikle büyük miktarda veriden öğrenmek için sinir ağlarını kullanan bu yaklaşım, derin öğrenme olarak da bilinir. Büyük Dil Modelleri (Large Language Models -LLM) Bunlar, belirli bir dilde büyük miktarda metin kullanılarak eğitilen çok büyük sinir ağlarıdır. E-kitaplardan, haber makalelerine, Wikipedia sayfalarına kadar İnternet'te bulunan hemen hemen ne varsa kullanırlar. Onlardan öğrendikleri milyarlarca parametreyle metni tanıyabilir, özetleyebilir, tercüme edebilir, tahmin yürütebilir ve yeni metin oluşturabilir, kısacası doğal dil işlemlenmesinin (processing) bel kemiğidir. En iyi bilinen LLM, ChatGPT'yi çalıştıran motor olan GPT-3 ve bunun yeni versiyonu olan GPT-4'tür. Diğer örnekler Meta'nın geliştirdiği LLaMA ile Google'ın, LaMDA'sıdır. GPT (Generative Pre-trained Transformer) Türkçeye "Üretken Önceden Eğitilmiş Dönüştürücü" olarak çevrilebilecek GTP aslında bir tür "Büyük Dil Modeli"dir. "Dönüştürücü" girdi dizilerini alıp tek başına değil hepsini birlikte işleyebilen bir sistemi ifade eder, böylece bağlam ve kelime sırası yakalanabilir. Bu, dil çevirisinde önemlidir. Örneğin: "Köpeği Daisy mutfakta yemek yedi" cümlesi eğer sözdizimi ve anlama dikkat edilmeden başka bir dile çevrilirse " Daisy köpeğini mutfakta yedi" gibi bir şeye dönüşebilir. OpenAI ChatGPT'yi ortaya çıkaran San Francisco merkezli laboratuvar. Programcı ve girişimci Sam Altman tarafından "tüm insanlığa fayda sağlayan" yapay zekâ teknolojisi geliştirmek için kâr amacı gütmeyen bir kuruluş olarak ortaklaşa oluşturuldu. İlk yatırımcılar arasında Linkedin'in kurucu ortağı Reid Hoffman ve Elon Musk vardı. Musk 2018'de kurumla ilişkisini kesti. OpenAI, Microsoft'un 1 milyar dolar yatırımıyla 2019'da kâr amaçlı bir kuruluş oluşturmaya yöneldi. Microsoft, daha sonra 10 milyar dolar daha yatırım yaptı, ardından onun teknolojisini kullanan Bing arama motorunun ve Edge tarayıcısının yeni sürümlerini çıkardı. Rakipleri arasında Amazon.com ile çalışan Hugging Face ve Ernie Bot (文心一言)'u kullanıma sunan OpenAI ile doğrudan rekabet içindeki Çin'in arama motoru Baidu yer alıyor. Halüsinasyon (Hallucination) ChatGPT gibi bir yapay zekâ, kulağa inandırıcı gelen ancak tamamen uydurma olan bir şey ortaya attığında buna halüsinasyon denir. Bu, bir soruya verecek doğru cevabı olmayan ancak yine de iyi bir cevabın kulağa nasıl geleceğini bilen ve bunu gerçekmiş gibi sunan bir sistemin sonucudur. Yapay zekânın bir şey sorulduğunda "bilmiyorum" diyememesinin maliyetli hatalara, tehlikeli yanlış anlamalara ve yanlış bilgilerin çoğalmasına yol açacağı endişesini yaratıyor bu durum. Duyarlı Yapay Zekâ (Sentient AI) Çoğu araştırmacı, etrafındaki dünyayı algılayabilen ve yansıtabilen duyarlı, bilinçli bir yapay zekânın gerçeğe dönüşmesine yıllar olduğu konusunda hemfikir. Yapay zekâ insan benzeri yetenekler sergilerken, makineler ne yaptıklarını veya söylediklerini henüz "anlamıyor". Sadece insanlar tarafından üretilen çok miktarda bilgide kalıplar (pattern) buluyorlar ve uyarılara nasıl tepki vereceklerini belirleyen matematiksel formüller üretiyorlar. Ansızın ortaya çıkan davranışlar (Emergent Behaviors) Büyük dil modelleri belli bir ölçeğe ulaştıkça, durup dururken ortaya çıkan, eğitmenleri tarafından istenmiş olmayan ve beklenmedik yetenekler sergilemeye başladılar. Bunlara örnek olarak, gerçekleştirilebilir bilgisayar kodu oluşturmak, garip hikayeler anlatmak ve bir dizi emojiyi ipucu olarak kullanıp filmleri tanımlamak sayılabilir. Komut/girdi mühendisliği (Prompt engineering) Büyük bir dil modelinin yanıtlarının doğruluğu ve kullanışlılığı önemli ölçüde kendisine verilen/girilen komutların kalitesine bağlıdır. Komut/girdi (prompt) mühendisleri, minimum bilgisayar gücü kullanarak tutarlı, yüksek kaliteli çıktılar üretmek için doğal dil talimatlarında ince ayarlar gerçekleştirebilirler. Derin sahtecilik (Deeepfake) Derin Öğrenme (Deep Learning) kavramından esinle ortaya atılan bu terim gerçek kişi ve durumların genelde kötü amaçlı olarak değiştirilmesi, tahrif edilmesi için kullanılır. |
[1] "Ernie"nin açılımı "Enhanced Representation Through Knowledge Integration (bilgi entegrasyonu yoluyla gelişmiş temsil)". Çince ismi Wénxīn yīyán.
[2] What Happens When You Ask a Chinese Chatbot About Taiwan?, The New York Times, 14 Temmuz 2023
Cevdet Kadri Kırımlı kimdir?İzmir'de doğdu. Yurt içinde ve yurt dışında farklı şirketlerde yöneticilik yaptı. Çin'de ve Hong Kong'da yaşadı. “Çin Mucizesinin Sonu mu? Uyuyan Arslan Kağıttan Kaplan” adlı bir kitabı (İletişim Yayınları) vardır. |


