Bilim / Teknoloji

OpenAI'ın yeni yapay zekâsı 'GPT-4o': Yüz ifadesinden duyguları okuyabiliyor, Simultane çeviri yapıyor

14 Mayıs 2024 01:20

ChatGPT'nin geliştiricisi OpenAI, ses, görüntü ve metin üzerinden gerçek zamanlı mantık yürütebilen yeni yapay zekâ modeli "GPT-4o"yu duyurdu.

Yapay zekâ sohbet robotu ChatGPT'nin geliştiricisi OpenAI, yeni modeli "GPT-4o"yu modelini piyasaya sürüyor.

OpenAI'dan yapılan açıklamada, GPT-4o'nun daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adım olduğu belirtilerek; modelin herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çıktı ürettiği aktarıldı.

Modelin ses girişlerine verdiği yanıt süresinin, herhangi bir konuşmadaki insan tepki süresine benzer olduğuna işaret edilen açıklamada GPT-4o'nun, mevcut modellerle karşılaştırıldığında özellikle görüntü ve ses anlama konusunda daha iyi olduğu vurgulandı.

GPT-4o ile metin, görüntü ve ses genelinde uçtan uca tek bir yeni modelin eğitildiğinin bilgisi verilerek, yeni modelin, tüm girdi ve çıktıların aynı sinir ağı tarafından işlendiği ilk model olduğu ifade edildi.

Ayrıca hem ücretsiz hem de ücretli kullanıcılar için, bilgisayarda yapılan işlemlere entegre olacak şekilde tasarlanmış, Mac işletim sistemi için yeni bir ChatGPT masaüstü uygulamasının da kullanıma sunulduğu bildirildi.

Öte yandan OpenAI'nın bugün düzenlediği tanıtım etkinliğinde, modelin önceki modellere göre daha uygun maliyetli olması nedeniyle ücretsiz olarak da sunulacağı, ücretli GPT-4o kullanıcılarının ise daha fazla kapasiteye sahip olacağı kaydedildi.

Yeni modelin birkaç hafta içinde ChatGPT'de sunulacağı belirtildi.

Şirket, GPT-4o'ın özelliklerini tanıtan bir dizi video da yayınladı.