Aylarca süren söylentiler ve spekülasyonlardan sonra OpenAI, ChatGPT ve yeni Bing gibi uygulamaları destekleyen AI dil modelleri serisinin en yenisi olan GPT-4’ü duyurdu.
Şirket, modelin “her zamankinden daha yaratıcı ve işbirlikçi” olduğunu ve “zor sorunları daha büyük bir doğrulukla çözebileceğini” iddia ediyor. Yalnızca metin yoluyla yanıt verebilmesine rağmen, hem metin hem de görüntü girişini ayrıştırabilir. OpenAI ayrıca, sistemlerin bilgi uydurma (veya “halüsinasyon”) eğilimi ve şiddetli ve zararlı metinler üretme kapasitesi dahil olmak üzere önceki dil modelleriyle aynı sorunların çoğunu barındırdığına da dikkat çekiyor.
GPT-4’te Ünlü Şirketlerle Ortaklıklar Var
OpenAI, GPT-4’ü ürünlerine entegre etmek için Duolingo, Stripe ve Khan Academy dahil olmak üzere bir dizi şirketle zaten ortaklık kurduğunu söylüyor. Yeni model, OpenAI’nin aylık 20 ABD doları tutarındaki ChatGPT aboneliği olan ChatGPT Plus aracılığıyla genel kullanıma sunuldu ve Microsoft’un Bing sohbet robotuna güç veriyor. Geliştiricilerin geliştirmesi için bir API olarak da erişilebilir olacak. (Burada, OpenAI’nin bugün kullanıcıları kabul etmeye başlayacağını söylediği bir bekleme listesi var.)
Bir araştırma blog gönderisinde OpenAI, GPT-4 ile selefi GPT-3.5 arasındaki farkın gündelik konuşmada “incelikli” olduğunu söyledi (GPT-3.5, ChatGPT’ye güç veren modeldir). OpenAI CEO’su Sam Altman, GPT-4’ün “hala kusurlu, hâlâ sınırlı” olduğunu ancak aynı zamanda “ilk kullanımda, onunla daha fazla zaman geçirdikten sonra olduğundan daha etkileyici göründüğünü” tweetledi.
GPT-4 Önemli Testlerden 88 Not Aldı
Şirket, GPT-4’teki iyileştirmelerin, Tekdüzen Çubuk Sınavı, LSAT, SAT Math ve SAT Kanıta Dayalı Okuma ve Yazma sınavları dahil olmak üzere bir dizi test ve kıyaslamada sistemin performansında açıkça görüldüğünü söylüyor. Bahsi geçen sınavlarda GPT-4 88. persentil ve üzerinde puan almakta olup, sınavların tam listesi ve sistemin puanları buradan görülebilmektedir.
GPT-4 ve yetenekleri hakkındaki spekülasyonlar geçen yıl çok yaygındı ve birçoğu bunun önceki sistemlere göre büyük bir sıçrama olacağını öne sürüyordu. Ancak, OpenAI’nin duyurusuna bakılırsa, şirketin daha önce uyardığı gibi, iyileştirme daha yinelemeli.
Ocak ayında GPT-4 ile ilgili bir röportajda Altman, “İnsanlar hayal kırıklığına uğramak için yalvarıyorlar ve olacaklar” dedi. “Abartma aynen şöyle… Gerçek bir AGI’miz yok ve bizden beklenen de bu.”
Microsoft’un GPT-4’ü Kullanacağı Geçen Hafta Sızmıştı
Söylenti değirmeni, geçen hafta bir Microsoft yöneticisinin Alman basınına verdiği bir röportajda sistemin bu hafta başlayacağını ağzından kaçırmasının ardından daha da güçlendi. Yönetici ayrıca sistemin çok modlu olacağını, yani yalnızca metin değil diğer ortamları da üretebileceğini öne sürdü. Birçok AI araştırmacısı, metin, ses ve videoyu entegre eden çok modlu sistemlerin, daha yetenekli AI sistemleri oluşturmaya yönelik en iyi yolu sunduğuna inanıyor.
GPT-4 gerçekten çok modlu, ancak bazılarının tahmin ettiğinden daha az ortamda. OpenAI, sistemin hem metin hem de görüntü girişlerini kabul edebileceğini ve metin çıktıları gönderebileceğini söylüyor. Şirket, modelin metin ve görüntüyü aynı anda ayrıştırma yeteneğinin, daha karmaşık girdileri yorumlamasına izin verdiğini söylüyor. Aşağıdaki örneklerde, memleri ve sıra dışı görüntüleri açıklayan sistemi görebilirsiniz:
OpenAI ve genel olarak AI dil modelleri ile GPT-4’e ulaşmak uzun bir yolculuktu ve son aylarda ana akım haline gelmeden önce birkaç yıl içinde yavaş yavaş ivme kazandı.
GPT’nin Geçmişi
GPT’yi açıklayan orijinal araştırma makalesi 2018’de yayınlandı, GPT-2 2019’da ve GPT-3 2020’de duyuruldu. Bu modeller, çoğu internetten kazınmış ve istatistiksel modeller için çıkarılan devasa metin veri kümeleri üzerinde eğitilmiştir. Bu modeller daha sonra hangi kelimenin diğerini takip ettiğini tahmin etmek için kullanılır. Açıklamak için nispeten basit bir mekanizmadır, ancak nihai sonuç, çeviri veya kod oluşturma gibi diğer metin tabanlı görevleri gerçekleştirmenin yanı sıra yazmayı oluşturabilen, özetleyebilen ve yeniden ifade edebilen esnek sistemlerdir.
OpenAI başlangıçta GPT modellerinin piyasaya sürülmesini, spam ve yanlış bilgi oluşturmak gibi kötü amaçlarla kullanılacaklarından korktuğu için erteledi. Ancak 2022’nin sonlarında şirket, herkesin erişebileceği GPT-3.5 tabanlı bir sohbet robotu olan ChatGPT’yi piyasaya sürdü. ChatGPT’nin lansmanı, teknoloji dünyasında bir çılgınlığı tetikledi ve Microsoft kısa süre sonra kendi yapay zeka sohbet robotu Bing (Bing arama motorunun bir parçası) ile onu takip etti ve Google yetişmek için çabaladı.
Tahmin edildiği gibi, bu AI dil modellerinin daha geniş kullanılabilirliği, sorunlar ve zorluklar yaratmıştır. Eğitim sistemi, saygın üniversite makaleleri yazan yazılımların varlığına hâlâ uyum sağlıyor; Stack Overflow ve bilim kurgu dergisi Clarkesworld gibi çevrimiçi siteler, yapay zeka tarafından üretilen içerik akışı nedeniyle başvuruları kapatmak zorunda kaldı; ve AI yazma araçlarının gazetecilikte ilk kullanımları en iyi ihtimalle zorlu olmuştur. Ancak bazı uzmanlar, zararlı etkilerin hala beklenenden daha az olduğunu savundu.
OpenAI, GPT-4 duyurusunda, sistemin altı aylık güvenlik eğitiminden geçtiğini ve dahili testlerde “izin verilmeyen içerik taleplerine yanıt verme olasılığının yüzde 82 daha az olduğunu ve gerçeğe dayalı üretme olasılığının yüzde 40 daha yüksek olduğunu” vurguladı. GPT-3.5’ten daha yüksek yanıtlar.”
Ancak bu, sistemin hata yapmadığı veya zararlı içerik çıkarmadığı anlamına gelmez. Örneğin Microsoft, Bing sohbet robotunun en başından beri GPT-4 tarafından desteklendiğini ve birçok kullanıcının Bing’in korkuluklarını her türlü yaratıcı yoldan kırabildiğini, botun tehlikeli tavsiyeler vermesini, kullanıcıları tehdit etmesini ve bilgi uydurmasını sağladığını açıkladı. . GPT-4 ayrıca, Eylül 2021’de “verilerinin büyük çoğunluğunun kesilmesinden sonra meydana gelen” olaylar hakkında hâlâ bilgi sahibi değil.