Партнёры NVIDIA запускают кластеры на архитектуре Blackwell Ultra для обучения и инференса. Прирост производительности сочетается с софт-оптимизациями (в т.ч. под длинные контексты и KV-кеш), что снижает стоимость вывода на токен.
Что известно про платформу
- Сборки на GB200 и высокоплотные узлы для генеративных моделей.
- Оптимизированные стеки: компиляторы, библиотеки, ускорители ввода-вывода.
- Поддержка гибридных сценариев (обучение + онлайн-инференс) и ускоренная перекомпоновка шардов.
Кластеры постепенно становятся доступны у провайдеров, а разработчики получают обновлённые SDK и рецепты развёртывания.