Yapay zekânın İngilizce dilinde uzmanlaştığını biliyorduk fakat henüz bilgisayar dilinde uzmanlığı yok.
Bu hafta düzenlenen "Think" konferansında IBM, CodeNet Projesi'ni açıkladı. Şimdiye kadar açık kaynak en büyük veri seti ile modelin eğitileceği iddia ediliyor.
Yapay zekâ destekli projede amaç yazılımcıların daha yaratıcı, daha az tekrarlayan görevlere odaklanmasını sağlarken geliştirme maliyetlerini önemli ölçüde azaltmak. Proje başarılı olursa programlama dillerini de birbirine çevirebiliyor olacak.
Cambridge Üniversitesi Judge Business School araştırmasına göre yazılımcılar zamanlarının yüzde 50,1'ini debug etmeye (hata ayıklamaya) ayırıyorlar. Hata ayıklamanın yıllık tahmini maliyeti ise 312 milyon dolar!
Proje başarılı olursa şirketlerin yazılım maliyetleri oldukça düşecek gibi görünüyor. Yazılımcıların ise daha yaratıcı olmaya vakit ayırabilmeleri; saatleri hatta bazen günleri alan, saç baş yolduran hata ayıklama (debug) derdinden hızlıca kurtulabilmeleri oldukça muhtemel.
CodeNet veri seti kod arama dâhil olmak üzere bir çok programlama görevini tamamlamak üzere yapay zekâyı eğitmek için örnekler içeriyor.
Projedeki veri seti, her biri 4000 adet kodlama probleminden bir tanesine çözüm olarak sunulan 14 milyon kod örneği, 500 milyon satırdan oluşuyor. 55 adet kodlama dili örneğine sahip olan veri seti (yüzde 95'lik kısmı C++, Python, Java, C, Ruby, C# kod örneklerinden oluşuyor.), kod boyutu, cpu çalışma süresi, hata türleri, kullanılan bellek boyutu gibi bilgiler de içeriyor.
Veri setine buradan ulaşabilirsiniz.
İletişim: https://www.linkedin.com/in/nehir-gunce-dasci/
Kaynak:
https://venturebeat.com/tag/ibm-think/
https://venturebeat.com/2021/05/10/ibms-codenet-dataset-aims-to-train-ai-to-tackle-programming-challenges/
https://www.engadget.com/ibm-codenet-dataset-can-teach-ai-to-translate-computer-languages-020052618.html
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.370.9611&rep=rep1&type=pdf
https://www.behance.net/collection/184254141/24