Lerne Sprachen natürlich mit frischen, authentischen Inhalten!

Beliebte Themen

Nach Region erkunden

Forscher testen eine KI-"Impfmethode", um schädliches Verhalten in KI-Systemen zu verhindern. Researchers test an AI "vaccination" method to prevent harmful behaviors in AI systems.

flag Forscher testen eine Methode, um zu verhindern, dass KI schädliche Eigenschaften entwickelt, indem sie KI-Modelle kleinen Mengen dieser Merkmale während des Trainings aussetzen, ein Prozess, den sie "präventive Lenkung" nennen. flag Researchers are testing a method to prevent AI from developing harmful traits by exposing AI models to small amounts of these traits during training, a process they call "preventative steering." flag Dieser "Impfansatz" verwendet "Persona-Vektoren", um unerwünschte Merkmale einzuführen und später zu entfernen, um KI gegenüber schädlichen Verhaltensweisen widerstandsfähiger zu machen. flag This "vaccination" approach uses "persona vectors" to introduce and later remove undesirable traits, aiming to make AI more resilient to harmful behaviors. flag Das Ziel ist es, problematische Verhaltensweisen in KI-Systemen wie Microsofts Bing-Chatbot und OpenAIs GPT-4 zu adressieren. flag The goal is to address problematic behaviors seen in AI systems like Microsoft's Bing chatbot and OpenAI's GPT-4.