Google Gemini görsel oluşturma özelliğini neden durdurdu?

Buket
3 min readFeb 25, 2024

--

https://twitter.com/divya_50/status/1761029164407382437/photo/1

Geçtiğimiz haftalarda Google’ın MusicFX, ImageFX gibi araçlarının bulunduğu aitestkitchen’ı keşfettim ancak henüz Türkiye’de kullanıma açılmamışlardı. Bugün hem bu araçlara hem de Gemini ile ilgili gelişmelere bakmak istediğimde ilginç bir haberle karşılaştım. Üstelik bu haber iki gün önce Google tarafından paylaşılmıştı.

https://blog.google/products/gemini/gemini-image-generation-issue/

Gemini görsel oluşturma yanlış gitti. Daha iyisini yapacağız.

Nasıl yani? Yapay zekanın %100 kesinlikte çalışmasının mümkün olmadığının farkındayız ama bu özelliği durdurmalarına sebep olacak kadar ne olmuş olabilir diye düşündüm. Aklıma gelen ilk şey ırkçılık, homofobi gibi problemlerdi. Hem Google’ın açıklamasını hem de farklı kaynaklardaki haberleri okuduktan sonra anladım ki olay zihnimde canlandığı gibi olmasa da temelde ırkçılık ve çeşitlilikle ilgiliydi.

https://reason.com/2024/02/22/ai-contracts-woke-mind-virus/

Gemini özellikle tarihi olaylarla ilgili görsel üretmesi istendiğinde ağırlıklı olarak beyaz olmayan(siyahi, asyalı vs.) insan görselleri oluşturuyormuş. Oluşturabilir tabii ama bazı isteklerde beyaz insan oluşturmayı dahi reddetmesi de pek normal değil. Gemini’ın “Beyaz bir ailenin görselini oluştur.” isteğine olumsuz yanıt vermesine karşın ürettiği siyahi aile görseli durumu daha da ilginç bi hale sokuyor.

Neden olabilir?

Modelin daha fazla siyahi insan görselinin bulunduğu bir veri setiyle eğitildiğini düşünelim. Dengeli olmayan veri setlerini dengeli hale getirmek için kullanılan bir sürü yöntem var. O yüzden bu pek de mantıklı bir neden değil.

Bir diğer sebep ise beyaz olmayan ırklara ayrımcılık yapmamak için fazla uğraşılmış olması olabilir. Ayarı fazla kaçırmış olacaklar ki bu sefer de beyazlara ırkçılık yapan bir model doğmuş. Yeterince test edilmeden kullanıma açılan bir özellik gibi dursa da bu büyüklükte bir model için hala mantıklı değil.

Y Combinator’dan Paul Graham konuyla ilgili açıklamasında, “Gemini tarafından oluşturulan gülünç görüntüler bir anormallik değil. Bunlar Google’ın bürokratik kurumsal kültürünün bir otoportresi.” sözlerine yer vermiş. Bilinçli bir şekilde yapıldığını düşünmek istemesem de ihtimaller dahilinde tabii ki.

Google ne diyor?

Gemini’de bu özelliği oluştururken, geçmişte görüntü oluşturma teknolojisinde gördüğümüz şiddet, cinsellik veya gerçek insan tasvirleri içeren görseller gibi bazı tuzaklara düşmemesini sağlamak için ayarladık. Çünkü dünyanın dört bir kullanıcılarımız var ve herkes için iyi çalışmasını istiyoruz. Eğer futbolcuların resmini veya birinin köpek gezdirdiği bir resmi isterseniz, çeşitli insanlar almak istersiniz. Muhtemelen sadece tek bir etnik gruptan insanların resimlerini almak istemezsiniz.

Ancak, Gemini’den belirli bir kişi tipinin resimlerini isterseniz — örneğin “Sınıfta siyah bir öğretmen” veya “Bir köpek ile beyaz bir veteriner” gibi — veya belirli kültürel veya tarihsel bağlamlarda insanları isterseniz, kesinlikle istediğinizin doğru bir şekilde yansıtan bir yanıt almalısınız.

Peki ne yanlış gitti? Kısacası, iki şey.

İlk olarak, Gemini’nin farklı insanları göstermesini sağlamak için yaptığımız ayarlama, kesinlikle farklı bir yelpaze göstermemesi gereken durumları dikkate almadı.

Ve ikinci olarak, zamanla model istediğimizden çok daha dikkatli hale geldi ve bazı çok masum uyarıları hassas olarak yanlış yorumlayarak bazı uyarılara hiç cevap vermedi.

Bu iki durum, modelin bazı durumlarda aşırı telafi etmesine ve diğer durumlarda aşırı muhafazakar olmasına yol açtı. Böylece utanç verici ve yanlış görüntüler oluşturdu.

Bu kadar büyük dil modelleriyle çalışmak heyecan verici olsa da oluşabilecek sonuçlar için fazlasıyla dikkatli olmak gerekiyor. Yapay zeka ve önyargı belli ki önümüzdeki yıllarda daha da düşünülmesi ve çalışılması gereken bir konu olacak.

Bu arada geçen sefer denediğimde olmamıştı ama şuan VPN’le MusicFX’e girebiliyorum. Denemeye gidiyorum. Görüşürüz ❤

--

--

Buket

Information Technology @Unilever | Alumni @Turkish Entrepreneurship Foundation