Lerne Sprachen natürlich mit frischen, authentischen Inhalten!

Beliebte Themen

Nach Region erkunden

Das chinesische AI-Startup DeepSeek führt eine neue Methode ein, um große Modelle effizienter zu machen, Kosten zu senken und die Skalierbarkeit zu erhöhen. Chinese AI startup DeepSeek introduces new method to make large models more efficient, reducing costs and boosting scalability.

flag DeepSeek, ein chinesisches AI-Startup, hat eine neue Schulungsmethode namens Manifold-Constrained Hyper-Connections vorgestellt, die große KI-Modelle effizienter und skalierbarer machen und gleichzeitig die Kosten für Rechen- und Energiekosten senken soll. flag DeepSeek, a Chinese AI startup, has unveiled a new training method called Manifold-Constrained Hyper-Connections, designed to make large AI models more efficient and scalable while reducing computational and energy costs. flag Die Technik, die in einem von Gründer Liang Wenfeng mitverfassten und auf arXiv veröffentlichten Papier ausführlich erläutert wird, behandelt Trainingsinstabilität und Gedächtnisprobleme in früheren Modellen und ermöglicht ein stabiles Training über 3 bis 27 Milliarden Parametersysteme mit minimaler Rechenleistung. flag The technique, detailed in a paper co-authored by founder Liang Wenfeng and published on arXiv, addresses training instability and memory issues in prior models, enabling stable training across 3 billion to 27 billion parameter systems with minimal added compute. flag Aufbauend auf ByteDances früheren Arbeiten spiegelt der Ansatz Chinas Drang nach KI-Innovation wider, trotz US-Halbleiterbeschränkungen. flag Building on ByteDance’s earlier work, the approach reflects China’s push for AI innovation despite U.S. semiconductor restrictions. flag Die Veröffentlichung fördert die Vorfreude auf DeepSeeks nächstes großes Modell, möglicherweise R2, das rund um das Frühlingsfest im Februar erwartet wird. flag The release fuels anticipation for DeepSeek’s next major model, possibly R2, expected around the Spring Festival in February.