Yapay zekâ yarışında önde gelen şirketlerden biri olan Google, OpenAI GPT’ye rakip olacak Gemini dil modelini tanıtmıştır. Gemini, metin, görüntü, video, ses ve kod arasında sorunsuz bir şekilde mantık yürüterek çok modluluk üzerine inşa edilmiştir. Google’un en büyük ve en yetenekli yapay zekâ modeli olan Gemini metin, kod, ses, görüntü ve video dahil olmak üzere farklı veri türlerini genelleştirebilmekte ve sorunsuz bir şekilde anlayabilmektedir.
Gemini aynı zamanda Google’un şimdiye kadarki en esnek dil modelidir. Model veri merkezlerinden mobil cihazlara kadar her şeyi verimli bir şekilde çalıştırabilir. İlk sürümü olan Gemini 1.0 üç farklı kategoride optimize edilmiştir:
- Gemini Ultra: Son derece karmaşık görevlerde en gelişmiş modeldir.
- Gemini Pro: Çok çeşitli görevleri ölçeklendirmekte en iyi modeldir.
- Gemini Nano: Cihaz içi görevlerde en verimli modeldir.
Gemini, yapay zekâ modellerinin bilgi ve problem çözme yeteneklerini test etmek için kullanılan en popüler yöntemlerden biri olan MMLU’da (Massive Multitask Language Understanding: Devasa Çok Görevli Dil Anlama) insan uzmanlardan daha iyi performans gösteren ilk modeldir. Gemini Ultra %90,0’lık skoruyla, hem dünya bilgisini hem de problem çözme yeteneklerini test etmek için matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konuyu bir arada kullanan MMLU’da insan uzmanlardan daha iyi performans gösteren ilk modeldir. Tablo 1’de metin görevlerinde yeteneklere göre Gemini Ultra ve GPT-4 performans düzeyleri karşılaştırmalı olarak verilmiştir.
Tablo 1: Metin Görevlerinde Yeteneklere Göre Gemini Ultra ve GPT-4 Performans Düzeyleri
*STEM, bilim, teknoloji, mühendislik ve matematik alanlarını bütünleştiren bir öğrenme ve gelişim yaklaşımıdır.
**F1 Score, precision ve recall değerlerinin harmonik ortalamasıdır.
Gemini, metin ve kodlama dahil olmak üzere metin görevlerindeki kıyaslamada en son teknoloji ürünü GPT-4’ün üzerinde performans göstermektedir. Tablo 2’de çok modlu görevlerde yeteneklere göre Gemini ve GPT-4 performans düzeyleri karşılaştırmalı olarak sunulmuştur. Gemini, bilinçli muhakeme gerektiren farklı alanları kapsayan çok modlu görevlerden oluşan kıyaslama ölçütünde %59,4 puan elde etmiştir. Gemini, tüm çok modlu görevlerde SOTA performansını geride bırakmaktadır.
SOTA nedir?
SOTA, State-Of-The-Art ifadesinin kısaltmasıdır. Yapay zekâ bağlamında, bir görevdeki sonuçlara ulaşmak için kullanılabilecek en iyi modelleri ifade eder. Bu görevler yalnızca yapay zekâya özgü bir görev olmalıdır. SOTA modelleri yapay zekâda birçok şekilde uygulanabilir:
- Makine Öğrenimi (ML) görevleri
- Derin Sinir Ağları (DNN’ler) görevleri
- Doğal Dil İşleme (NLP) görevleri
- Genel görevler
SOTA yapay zekâya nasıl yardımcı olur?
Yapay zekâda SOTA modellerini kullanmanın kendine özgü birçok faydası vardır. Başlıca faydalar şöyle özetlenebilir:
- Görev hassasiyetini artırır.
- Güvenilirliği artırır.
- Tekrarlanabilirliği sağlar.
- Üretim süresini azaltır.
Tablo 2: Çok Modlu Görevlerde Yeteneklere Göre Gemini ve GPT-4 Performans Düzeyleri
Gemini 1.0’ın gelişmiş çok modlu akıl yürütme yetenekleri, karmaşık yazılı ve görsel bilgilerin anlamlandırılmasına yardımcı olabilmektedir. Bu sayede çok büyük miktarda veri arasında ayırt edilmesi zor olabilecek bilgileri ortaya çıkarma konusunda benzersiz bir beceriye sahiptir.
Bilgiyi okuma, filtreleme ve anlama yoluyla yüz binlerce belgeden içgörü çıkarma konusundaki olağanüstü yeteneği, bilimden finansa kadar birçok alanda dijital hızlarda yeni atılımlar yapılmasına yardımcı olacaktır.
Gemini 1.0 metin, görüntü, ses ve daha fazlasını aynı anda tanıyıp anlayabilecek şekilde eğitilmiştir. Bu nedenle nüanslı bilgileri daha iyi anlayabilir ve karmaşık konularla ilgili soruları yanıtlayabilir.
Özetle bu yazımızda yeni tanıtımı yapılan Google Gemini dil modeli ile ChatGPT dil modeli yeteneklerine göre karşılaştırılarak performans düzeyleri ortaya konulmuştur.
Faydalı olması ve farkındalık oluşturması dileğiyle.
Bilimle ve teknolojiyle kalınız.
Tevfik Bulut
https://tevfikbulut.net/
Yararlanılan Kaynaklar
- Google Deepmind. https://deepmind.google/technologies/gemini
- What is SOTA in Artificial Intelligence? https://www.e2enetworks.com/blog/what-is-sota-in-artificial-intelligence.
- Introducing Gemini: our largest and most capable AI model. https://blog.google/technology/ai/google-gemini-ai/?utm_source=gdm&utm_medium=referral.