Musk'un yapay zeka şirketi xAI, ilk çok modlu yapay zeka modeli Grok-1.5V'nin lansmanını duyurdu. Grok, güçlü metin işleme yeteneklerine ek olarak belgeler, grafikler, ekran görüntüleri, fotoğraflar vb. dahil olmak üzere çeşitli görsel bilgileri de işleyebilir. Birden fazla alanda yapılan kıyaslama testlerinde Grok-1.5V'nin performansı, mevcut son teknolojiye sahip çok modlu modellerle karşılaştırılabilir düzeydedir. Özellikle xAI tarafından başlatılan yeni RealWorldQA kıyaslama testinde Grok, gerçek dünyadaki mekansal anlama yetenekleri açısından benzer modelleri geride bıraktı. RealWorldQA veri seti 700'den fazla görüntü içerir ve çok modlu modellerin fiziksel dünyaya ilişkin temel anlayışını değerlendirmek için tasarlanmıştır. Grok-1.5 yakında ilk test uzmanlarına ve mevcut kullanıcılara sunulacak.
Tüm Yorumlar