Lerne Sprachen natürlich mit frischen, authentischen Inhalten!

Beliebte Themen
Nach Region erkunden
Forscher testen eine KI-"Impfmethode", um schädliches Verhalten in KI-Systemen zu verhindern.
Forscher testen eine Methode, um zu verhindern, dass KI schädliche Eigenschaften entwickelt, indem sie KI-Modelle kleinen Mengen dieser Merkmale während des Trainings aussetzen, ein Prozess, den sie "präventive Lenkung" nennen.
Dieser "Impfansatz" verwendet "Persona-Vektoren", um unerwünschte Merkmale einzuführen und später zu entfernen, um KI gegenüber schädlichen Verhaltensweisen widerstandsfähiger zu machen.
Das Ziel ist es, problematische Verhaltensweisen in KI-Systemen wie Microsofts Bing-Chatbot und OpenAIs GPT-4 zu adressieren.
7 Artikel
Researchers test an AI "vaccination" method to prevent harmful behaviors in AI systems.