Nvidia Blackwell

Продукт
Разработчики: Nvidia (Нвидиа)
Отрасли: Электротехника и микроэлектроника
Технологии: Процессоры

Содержание

История

2024: Брак новых процессоров, который приводит к перегреву и может стать причиной пожара в дата-центре

В середине ноября 2024 года стало известно о том, что ИИ-ускорители Nvidia поколения Blackwell при использовании в серверных стойках высокой плотности могут сталкиваться с перегревом. Это создает риск возгорания в центре обработки данных.

Как сообщает ресурс The Information, ссылаясь на данные, полученные от осведомленных источников, проблема затрагивает так называемые суперсистемы GB200 NVL72 на базе ускорителей Blackwell. Они объединяют в одной стойке 18 узлов 1U, каждый из которых содержит два решения GB200 для работы с ресурсоемкими приложениями ИИ и высокопроизводительными вычислениями. Таким образом, в общей сложности стойка насчитывает 72 чипа Nvidia B200 и 36 процессоров Grace.

Новые серверные процессоры Nvidia оказались бракованными. Они перегреваются и могут стать причиной пожара в дата-центре

По словам сотрудников Nvidia, которые работали над проблемой перегрева, а также клиентов и поставщиков, осведомленных о ней, производитель графических чипов несколько раз просил своих партнеров изменить конструкцию стоек, чтобы минимизировать риски. Подчеркивается, что дорабатывать архитектуру серверных систем на базе Blackwell партнеры Nvidia будут вынуждены на последних этапах их производства.

«
Nvidia взаимодействует с ведущими поставщиками облачных услуг, и это неотъемлемая составляющая нашего сотрудничества. Инженерные корректировки являются частью данного процесса, а поэтому вполне ожидаемы, — заявил представитель компании Nvidia агентству Reuters.
»

Вместе с тем Dell, Foxconn и Quanta заверяют, что поставки систем GB200 идут по графику, несмотря на информацию о перегреве ИИ-ускорителей. В частности, основатель и глава Dell Technologies Майкл Делл сообщил, что компания уже начала отгружать соответствующие решения заказчикам. В этих серверных продуктах применяется эффективная система жидкостного охлаждения.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Т1 Интеграция (ранее Техносерв) (4)
  МЦСТ (4)
  Микрон (Mikron) (4)
  Lenovo (4)
  ИНЭУМ им. И.С. Брука (3)
  Другие (48)

  Cloud4Y (ООО Флекс) (1)
  Huawei Россия (Хуавэй) (1)
  Intel (1)
  Lenovo (1)
  TSMC (1)
  Другие (4)

  ISBC Group (Интеллектуальные системы управления бизнесом) (1)
  МЦСТ (1)
  Национальный центр информатизации (НЦИ) (1)
  Норси-Транс (НТ) (1)
  Трансинформ (1)
  Другие (0)

  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (1)
  Другие (0)

  Микрон (Mikron) (1)
  РСК (группа компаний, ранее - РСК Скиф) (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МЦСТ (8, 22)
  Микрон (Mikron) (2, 9)
  Oracle (1, 7)
  Nvidia (Нвидиа) (17, 6)
  Intel (36, 5)
  Другие (194, 15)

  Байкал Электроникс (Baikal Electronics) (1, 2)
  Huawei (1, 1)
  Nvidia (Нвидиа) (1, 1)
  Микрон (Mikron) (1, 1)
  Intel (1, 1)
  Другие (0, 0)

  МЦСТ (2, 2)
  Микрон (Mikron) (1, 1)
  Т-Платформы (T-Platforms) (1, 1)
  Другие (0, 0)

  МЦСТ (1, 1)
  Другие (0, 0)

  Intel (1, 1)
  Микрон (Mikron) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Микрон Интегральные микросхемы MIK - 9
  Эльбрус - 8
  Oracle SPARC - 7
  Intel Xeon Scalable - 5
  Эльбрус 4.4 - 4
  Другие 23

  Baikal-M - 2
  Микрон Интегральные микросхемы MIK - 1
  Huawei Kunpeng (процессоры) - 1
  Nvidia Tesla - 1
  Intel Xeon Scalable - 1
  Другие 0

  Микрон Интегральные микросхемы MIK - 1
  Эльбрус-8С - 1
  Baikal - 1
  Эльбрус - 1
  Другие 0

  Эльбрус - 1
  Другие 0

  Микрон Интегральные микросхемы MIK - 1
  Intel Xeon Scalable - 1
  Другие 0