Партнёры NVIDIA запускают кластеры на архитектуре Blackwell Ultra для обучения и инференса. Прирост производительности сочетается с софт‑оптимизациями (в т.ч. под длинные контексты и KV‑кеш), что снижает стоимость вывода на токен.
Что известно про платформу
- Сборки на GB200 и высокоплотные узлы для генеративных моделей.
- Оптимизированные стеки: компиляторы, библиотеки, ускорители ввода‑вывода.
- Поддержка гибридных сценариев (обучение + онлайн‑инференс) и ускоренная перекомпоновка шардов.
Кластеры постепенно становятся доступны у провайдеров, а разработчики получают обновлённые SDK и рецепты развёртывания.