OpenAI ve Google arasındaki yapay zeka yarışmasının ardından Meta, kendi yapay zeka modelleriyle rekabete girmeye hazırlanıyor. Meta’nın çok modlu yapay zeka modelleri, metinler, resimler, ses kayıtları ve videolar gibi çeşitli medya biçimlerini işleyebildikleri için büyük dil modellerinin geliştirilmiş versiyonları olarak kabul ediliyor. Örneğin, artık kameranızı açabilir ve OpenAI’nin en yeni GPT-4 AI modelinden çevrenizle ilgili bir açıklama yazmasını isteyebilirsiniz.
Meta, Facebook’un ana şirketi olarak kendi multi modeli Chameleon (Bukalemun) ile benzer bir aracı piyasaya sürmeyi planlıyor. Chameleon, eski bir füzyon mimarisi üzerine inşa edilmiş olup, diğer sistemlerin çoğunda mümkün olmayan şekillerde birden fazla girdiyi bir araya getirebiliyor. Bugüne kadar bu tür modellerin çoğu, işlemenin ilk aşamalarında verileri ayrı varlıklar iddaci giriş olarak işliyor ve daha sonra bunları ilişkilendirmeleri aramak için bir araya getiriyordu. Bu teknik geç füzyon olarak adlandırılıyordu.
Bunun üstesinden gelmek için Meta ekibi, modellerini erken füzyon mimarisine dayandırdı. Meta’nın Chameleon ekibine göre model, ‘görüntüleri ve metni herhangi bir rastgele sırayla anlama ve oluşturma kapasitesine sahip erken füzyon belirteci tabanlı karma modeller’ dizisinden oluşuyor. Erken füzyon mimarisini kullanan yapay zeka modelleri, geç füzyon yaklaşımının sınırlamalarının ötesine geçmeyi vaat ediyor. Araştırmacılar, Gemini’den farklı olarak Chameleon’un uçtan uca bir model olduğunu ve bu durumun görüntü kod çözücülere olan ihtiyacı gereksiz hale getirdiğini belirtiyor.
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.