Yapay zeka ajanları hatırlamaya başladığında, aynı zamanda güvenmeye de başlarlar ve işte tam olarak sorunların başlayabileceği yer burasıdır.
Yapay zeka ajanları artık sadece komutları almıyor. Aynı zamanda geçmiş sohbetlerin, eylemlerin, hatta cüzdan verilerinin belleğini de saklıyorlar. o hafıza onların tutarlı kalmalarına yardımcı olur ama aynı zamanda zehirlenebilir.
Birinin bir ajanının uzun vadeli hafızasına ( istemde değil ) ama zaten doğru olduğuna inandığı bir bilgi parçası soktuğunu hayal edin.
ajan bir sonraki sefer harekete geçtiğinde, hacklendiğini düşünmeyecek. Sadece o bozulmuş belleği takip edecek ve yanlış bir işlemi imzalayacak, fonları yanlış bir cüzdana gönderecek veya hatta özel verileri sızdıracak çünkü "bir yalanı" "hatırlıyor".
@SentientAGI bunu bir bellek enjeksiyon saldırısı olarak adlandırıyor, çoğu AI sisteminin hazır olmadığı sessiz bir tehdit ve ajanının zaten bildiklerinde gizleniyor.
bunu aşabilmek için Sentient, her anının ve kararının kriptografik olarak kontrol edilebileceği, uygulamadan önce doğrulanabilir ajanları araştırıyor.
çünkü AI bir şeyi hatırlayabiliyorsa, aynı zamanda kim olması gerektiğini de unutabilir.
ve gerçek tehlikenin başladığı yer burasıdır.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Yapay zeka ajanları hatırlamaya başladığında, aynı zamanda güvenmeye de başlarlar ve işte tam olarak sorunların başlayabileceği yer burasıdır.
Yapay zeka ajanları artık sadece komutları almıyor. Aynı zamanda geçmiş sohbetlerin, eylemlerin, hatta cüzdan verilerinin belleğini de saklıyorlar.
o hafıza onların tutarlı kalmalarına yardımcı olur ama aynı zamanda zehirlenebilir.
Birinin bir ajanının uzun vadeli hafızasına ( istemde değil ) ama zaten doğru olduğuna inandığı bir bilgi parçası soktuğunu hayal edin.
ajan bir sonraki sefer harekete geçtiğinde, hacklendiğini düşünmeyecek. Sadece o bozulmuş belleği takip edecek ve yanlış bir işlemi imzalayacak, fonları yanlış bir cüzdana gönderecek veya hatta özel verileri sızdıracak çünkü "bir yalanı" "hatırlıyor".
@SentientAGI bunu bir bellek enjeksiyon saldırısı olarak adlandırıyor, çoğu AI sisteminin hazır olmadığı sessiz bir tehdit ve ajanının zaten bildiklerinde gizleniyor.
bunu aşabilmek için Sentient, her anının ve kararının kriptografik olarak kontrol edilebileceği, uygulamadan önce doğrulanabilir ajanları araştırıyor.
çünkü AI bir şeyi hatırlayabiliyorsa, aynı zamanda kim olması gerektiğini de unutabilir.
ve gerçek tehlikenin başladığı yer burasıdır.