Ежедневные новости о ситуации в мире и России, сводка о пандемии Коронавируса, новости культуры, науки и шоу бизнеса

IBM разработала ИИ-чип с внутренним хранением данных, и он на порядок быстрее ускорителей Nvidia

Компания IBM сообщила, что завершила испытания нового прототипа процессора для задач искусственного интеллекта. Новая разработка под кодовым именем NorthPole показала себя в 4000 раз лучше предыдущей ИИ-архитектуры компании под именем TrueNorth и «умопомрачительно» превзошла все самые передовые центральные и графические процессоры.

IBM разработала ИИ-чип с внутренним хранением данных, и он на порядок быстрее ускорителей Nvidia

Чип NorthPole изготовлен по 12-нм техпроцессу и содержит 22 млрд транзисторов на площади 800 мм2. Это фактически «сеть на чипе» — в этом процессоре сосредоточено 256 ядер с разветвленным интерфейсом и встроенной памятью. Именно за счёт встроенной в чип памяти удалось добиться самых лучших в индустрии показаний по энергоэффективности, снижению задержек и эффективной площади.

За один такт процессор NorthPole выполняет 2048 операций на каждое ядро (с 8-битной точностью). Для 4- и 2-битной точности количество выполняемых операций, соответственно, удваивается и учетверяется. Подобная способность нацелена, прежде всего, на обработку изображений. Точнее — для цифрового машинного зрения, а это автопилоты, автохирурги и прочее.

Читать также:
MSI представила плату MSI B650M Project Zero с разъёмами на реверсе

Узким местом архитектуры фон-Неймана было и остаётся разделение памяти и процессора. Разработчики IBM преодолели это препятствие, когда создали процессор, который хранит все данные в самом себе, не пересылая их во внешние запоминающие устройства.

Тестирование на модели ResNet50, а это 50-слойная нейронная сеть для проверки решений для распознавания и классификации изображений, показало, что энергоэффективность чипа NorthPole в 25 раз выше, чем энергоэффективность обычных 12-нм графических процессоров и 14-нм центральных процессоров. Также в 22 раза лучше оказались показатели по задержкам, которые были меньше у чипа IBM. Разработчики назвали это «умопомрачительным» результатом. Наконец, с точки зрения используемой площади чипа (числа транзисторов), архитектура IBM также превзошла всех конкурентов, включая даже 4-нм GPU.