Die Indiana-Jones-Methode zeigt, wie leicht sich große Sprachmodelle austricksen lassen, indem sie historische Referenzen nutzen, um schädliche Informationen zu entlocken. Ein klares Zeichen, dass KI-Sicherheit weiter gestärkt werden muss.
#KI #Cybersicherheit
https://t3n.de/news/indiana-jones-methode-knackt-grosse-sprachmodelle-schaedliche-informationen-offenbart-1674694/