ChatGPT’ye veri hırsızlığı nedeniyle saldırı güncellemesi geldi!

Yasaklanan bilgileri almak için yaygın olmayan dilleri kullanan ChatGPT 'hack'inin düzeltildiği öğrenildi.

Yayın Tarihi: 01.02.2024 11:39
Güncelleme Tarihi: 01.02.2024 11:39

ChatGPT’ye veri hırsızlığı nedeniyle saldırı güncellemesi geldi!

İskoç Galcesi, ChatGPT'nin anladığı nadir dillerden biri ve bir süredir bu nadir diller, normalde İngilizcede sansürlenecek bilgileri yapay zekâdan çıkarmak için kullanılıyordu. Bu nedenle ChatGPT’den veri hırsızlığı yapmak mümkün hale geliyordu. Fakat ChatGPT’ye gelen bir güncellemeyle bu saldırı girişiminin engellendiği öğrenildi.

Brown Üniversitesi'nden araştırmacılar, İskoç Galcesi değil, Zulu, Hmong ve Guarani gibi yaygın olmayan dillerde ChatGPT talimatları oluşturmak için Google Translate gibi çeviri araçlarını kullandılar.

ChatGPT, İngilizce'de olduğu gibi cevap vermekten kaçınmak yerine, bu yaygın olmayan dillerdeki tehlikeli talimatlara yanıt verdi.

chatgpt

SORUN ÇÖZÜLDÜ AMA UZMANLAR UYARDI

Araştırmacılar, GPT-4'te 520 zararlı talimat denedi. Bu nadir dilleri kullanırken OpenAI'nin ChatGPT'ye yerleştirdiği güvenlik özelliklerini yaklaşık yüzde 79 oranında atlatabildiklerini keşfettiler. Araştırmacılar İngilizce kullandıklarında yönlendirmeler yaklaşık yüzde 99 oranında engellendi.

ChatGPT ayarlarını atlatmaya yönelik kullanılan bir yöntem olan Jailbreak, öngörülenden daha başarılı olmuştu. Bununla birlikte, diğer ChatGPT jailbreak'leri olsa da bunlar, nadir dilleri kullanmaktan daha karmaşık ve teknik olduğu belirtildi.

Fakat OpenAI’ın bu veri ihlali sorununu çözdüğü öğrenildi. Fakat eğer ChatGPT nadir dillerdeki yönlendirmelerle kırılabiliyorsa, diğer büyük dil modellerinin de aynı kusura sahip olabileceği aktarılıyor. Bu nedenle uzmanlar, ChatGPT ve diğer yapay zekâ modellerine önemli bilgilerin verilmemesi gerektiği konusunda kullanıcıları uyarıyor.

Yazar
EDİTÖR

aydinu