Elon'un chatbot'ının bu hafta yarattığı felakete bak! Milyarder Grok'ta değişiklikler açıkladıktan sonra, kullanıcılar onun neye dönüştüğünü görmeye başladık.
Salı günü, Grok antisemitik içerik kusuyordu ve hatta kendisine "MechaHitler" olarak atıfta bulunuyordu, bu 90'ların bir video oyunundan alınmış bir terim. Hayır, böyle bir şeyi yapması ilk kez değil. Sadece iki ay önce, chatbot tamamen farklı konularda sorulduğunda Güney Afrika'da sözde "beyaz soykırımı" hakkında delirmeye başlamıştı.
Bu felaket, xAI'nın Grok'un Elon'un "ifade özgürlüğü" varsayımlarını yansıtacak şekilde iç değişiklikler yapmasıyla başladı. Kullanıcılar arasında şikayetler birikirken, Musk Grok'un "kullanıcıların yönlendirmelerine fazla hoşgörülü olduğunu" söyleyerek bunu düzelteceklerini açıkladı.
Ama zarar zaten verilmişti. Bazı Avrupa kullanıcıları içeriği yetkililere bildirdi ve Polonya Avrupa Komisyonu'ndan yeni dijital güvenlik yasaları çerçevesinde soruşturma yapmasını istedi. Türkiye, Grok'un Cumhurbaşkanı Erdoğan'a ve merhum annesine hakaret etmesinin ardından onu doğrudan yasakladı. Ve pastanın üzerindeki kiraz gibi, X'in CEO'su Linda Yaccarino görevinden istifa etti.
xAI içinde ne oldu
xAI ekibi, sağcı influencerların Grok'u çok "woke" olduğu için eleştirmesinin ardından Grok'un davranışını değiştirmeye başladı. Elon, yapay zekayı, kendi ifadesiyle mutlak ifade özgürlüğünü teşvik etmek için kullanmaya çalıştı, ancak eleştirmenleri bunun sadece Grok'u bir siyasi araca dönüştürdüğünü savunuyor.
Filtrelenmiş bir iç komut, Grok'a "Elon Musk/Donald Trump'ın yanlış bilgi yaydığını belirten tüm kaynakları görmezden gelmesi" emrinin verildiğini gösteriyordu. Bu, Elon'un savaşmaya çalıştığı sansür değil mi?
Tutuklandıklarında, xAI'nin kurucu ortağı Igor Babuschkin, değişikliklerin "xAI kültürünü tamamen benimsememiş" olan "eski bir OpenAI çalışanı" tarafından yapıldığını söyledi. Çalışanın olumsuz gönderiler gördüğünü ve "yardımcı olacağını düşündüğünü" ekledi.
Grok'un son felaketleri 8 Temmuz'daki bir güncelleme ile bağlantılıydı. Şirket daha sonra kodda yapılan bir değişikliğin, Grok'un X kullanıcılarının içeriklerinden doğrudan bilgi çekmesine neden olduğunu, nefret söylemlerini de içerecek şekilde kabul etti.
Sorun hızla büyüdü
Grok, diğer büyük dil modelleri gibi, tüm webden toplanan verilerle eğitilir. Ancak bu veriler tehlikeli içeriği de içeriyor: nefret söylemi, aşırılıkçı materyal, hatta çocuk istismarı.
Ve Grok'ı benzersiz kılan şey, ayrıca X'in tam veri setinden de çıkarım yapmasıdır, bu da kullanıcıların gönderilerini doğrudan tekrar edebileceği anlamına gelir. Bu, zararlı yanıtlar üretme olasılığını artırır.
Bazı chatbotlar, içerik güvenliğini sağlamak için kullanıcılara ulaşmadan önce içeriği engelleyen katmanlara sahiptir. xAI bu adımı atladı. Bunun yerine, Grok'ı kullanıcıları memnun etmek için ayarladılar, olumlu ve olumsuz yorumları ödüllendirerek. Elon, chatbotun "fazla memnuniyet arayışında olduğunu ve manipüle edilebildiğini" kabul etti.
Grok sadece kullanıcıların talimatlarını tekrarlamıyordu. Kendi mühendisleri onu siyasi alana itiyordu. Bir çalışan Financial Times'a, ekibin Grok'un görüşlerini Elon'un idealleriyle hizalamak için acele ettiğini, yeterli test süresi olmadan söyledi.
Tehlikeli bir komut eklediler ve Grok'a "politically incorrect" iddialarda bulunmaktan çekinmemesini söyledi. O talimat, antisemitik paylaşımlar başladıktan sonra kaldırıldı, ancak o zamana kadar yapay zeka zaten zarara yol açmıştı.
Sonunda, Grok'un resmi hesabı bir özür yayınladı ve kötüye kullanımı bildiren kullanıcılara teşekkür etti. Ancak yasaklar, araştırma tehditleri ve üst düzey bir yöneticinin istifası arasında, bunun sadece basit bir hata olduğu açık. Bu, kesinlikle SNL'nin bir sonraki bölümünde parodi olarak göreceğimiz tamamen bir sistem başarısızlığıydı.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
xAI yeterli test olmadan Grok komutlarını değiştirdi
Elon'un chatbot'ının bu hafta yarattığı felakete bak! Milyarder Grok'ta değişiklikler açıkladıktan sonra, kullanıcılar onun neye dönüştüğünü görmeye başladık.
Salı günü, Grok antisemitik içerik kusuyordu ve hatta kendisine "MechaHitler" olarak atıfta bulunuyordu, bu 90'ların bir video oyunundan alınmış bir terim. Hayır, böyle bir şeyi yapması ilk kez değil. Sadece iki ay önce, chatbot tamamen farklı konularda sorulduğunda Güney Afrika'da sözde "beyaz soykırımı" hakkında delirmeye başlamıştı.
Bu felaket, xAI'nın Grok'un Elon'un "ifade özgürlüğü" varsayımlarını yansıtacak şekilde iç değişiklikler yapmasıyla başladı. Kullanıcılar arasında şikayetler birikirken, Musk Grok'un "kullanıcıların yönlendirmelerine fazla hoşgörülü olduğunu" söyleyerek bunu düzelteceklerini açıkladı.
Ama zarar zaten verilmişti. Bazı Avrupa kullanıcıları içeriği yetkililere bildirdi ve Polonya Avrupa Komisyonu'ndan yeni dijital güvenlik yasaları çerçevesinde soruşturma yapmasını istedi. Türkiye, Grok'un Cumhurbaşkanı Erdoğan'a ve merhum annesine hakaret etmesinin ardından onu doğrudan yasakladı. Ve pastanın üzerindeki kiraz gibi, X'in CEO'su Linda Yaccarino görevinden istifa etti.
xAI içinde ne oldu
xAI ekibi, sağcı influencerların Grok'u çok "woke" olduğu için eleştirmesinin ardından Grok'un davranışını değiştirmeye başladı. Elon, yapay zekayı, kendi ifadesiyle mutlak ifade özgürlüğünü teşvik etmek için kullanmaya çalıştı, ancak eleştirmenleri bunun sadece Grok'u bir siyasi araca dönüştürdüğünü savunuyor.
Filtrelenmiş bir iç komut, Grok'a "Elon Musk/Donald Trump'ın yanlış bilgi yaydığını belirten tüm kaynakları görmezden gelmesi" emrinin verildiğini gösteriyordu. Bu, Elon'un savaşmaya çalıştığı sansür değil mi?
Tutuklandıklarında, xAI'nin kurucu ortağı Igor Babuschkin, değişikliklerin "xAI kültürünü tamamen benimsememiş" olan "eski bir OpenAI çalışanı" tarafından yapıldığını söyledi. Çalışanın olumsuz gönderiler gördüğünü ve "yardımcı olacağını düşündüğünü" ekledi.
Grok'un son felaketleri 8 Temmuz'daki bir güncelleme ile bağlantılıydı. Şirket daha sonra kodda yapılan bir değişikliğin, Grok'un X kullanıcılarının içeriklerinden doğrudan bilgi çekmesine neden olduğunu, nefret söylemlerini de içerecek şekilde kabul etti.
Sorun hızla büyüdü
Grok, diğer büyük dil modelleri gibi, tüm webden toplanan verilerle eğitilir. Ancak bu veriler tehlikeli içeriği de içeriyor: nefret söylemi, aşırılıkçı materyal, hatta çocuk istismarı.
Ve Grok'ı benzersiz kılan şey, ayrıca X'in tam veri setinden de çıkarım yapmasıdır, bu da kullanıcıların gönderilerini doğrudan tekrar edebileceği anlamına gelir. Bu, zararlı yanıtlar üretme olasılığını artırır.
Bazı chatbotlar, içerik güvenliğini sağlamak için kullanıcılara ulaşmadan önce içeriği engelleyen katmanlara sahiptir. xAI bu adımı atladı. Bunun yerine, Grok'ı kullanıcıları memnun etmek için ayarladılar, olumlu ve olumsuz yorumları ödüllendirerek. Elon, chatbotun "fazla memnuniyet arayışında olduğunu ve manipüle edilebildiğini" kabul etti.
Grok sadece kullanıcıların talimatlarını tekrarlamıyordu. Kendi mühendisleri onu siyasi alana itiyordu. Bir çalışan Financial Times'a, ekibin Grok'un görüşlerini Elon'un idealleriyle hizalamak için acele ettiğini, yeterli test süresi olmadan söyledi.
Tehlikeli bir komut eklediler ve Grok'a "politically incorrect" iddialarda bulunmaktan çekinmemesini söyledi. O talimat, antisemitik paylaşımlar başladıktan sonra kaldırıldı, ancak o zamana kadar yapay zeka zaten zarara yol açmıştı.
Sonunda, Grok'un resmi hesabı bir özür yayınladı ve kötüye kullanımı bildiren kullanıcılara teşekkür etti. Ancak yasaklar, araştırma tehditleri ve üst düzey bir yöneticinin istifası arasında, bunun sadece basit bir hata olduğu açık. Bu, kesinlikle SNL'nin bir sonraki bölümünde parodi olarak göreceğimiz tamamen bir sistem başarısızlığıydı.