NVIDIA Blackwell Ultra выходит в облака

Партнёры NVIDIA запускают кластеры на архитектуре Blackwell Ultra для обучения и инференса. Прирост производительности сочетается с софт-оптимизациями (в т.ч. под длинные контексты и KV-кеш), что снижает стоимость вывода на токен.

Что известно про платформу

Сборки на GB200 и высокоплотные узлы для генеративных моделей.
Оптимизированные стеки: компиляторы, библиотеки, ускорители ввода-вывода.
Поддержка гибридных сценариев (обучение + онлайн-инференс) и ускоренная перекомпоновка шардов.

Стойки с вычислительными узлами Blackwell Ultra — Blackwell Ultra ориентирован на «фабрики ИИ»: плотность, энергоэффективность, сетевые ускорители.

Кластеры постепенно становятся доступны у провайдеров, а разработчики получают обновлённые SDK и рецепты развёртывания.