Lerne Sprachen natürlich mit frischen, authentischen Inhalten!

Beliebte Themen

Nach Region erkunden

Das KI-Startup Galileo Technologies platziert Claude 3.5 Sonnet, Googles Gemini und Alibabas Qwen2-72B-Instruct im Hallucination Index-Benchmark an der Spitze. AI startup Galileo Technologies ranks Claude 3.5 Sonnet, Google's Gemini, and Alibaba's Qwen2-72B-Instruct top in the Hallucination Index benchmark.

flag Das KI-Startup Galileo Technologies hat Midrange- und Open-Source-Modelle in großen Sprachen in einem neuen Benchmarktest, dem Hallucination Index, hoch bewertet. flag AI startup Galileo Technologies has ranked midrange and open-source large language models highly in a new benchmark test, the Hallucination Index. flag Der Benchmark, der 22 führende Modelle generativer KI bewertet, hat ihre Genauigkeit anhand von drei Aufgabensammlungen gemessen. flag The benchmark, which evaluates 22 leading generative AI models, measured their accuracy across three task collections. flag An der Spitze der Rangliste stand Claude 3.5 Sonnet von Anthropics, während Gemini 1.5 Flash von Google hinsichtlich der Kosten am besten abschnitt. flag Anthropic's Claude 3.5 Sonnet topped the ranking, while Google's Gemini 1.5 Flash performed best on cost. flag Das Open-Source-Modell mit der besten Leistung war Qwen2-72B-Instruct von Alibaba. flag Alibaba's Qwen2-72B-Instruct was the top-performing open-source model.