Cerebras представляет WSE-3 Самый крупный в мире чип искусственного интеллекта для обучения моделей 🚀

Производительность одного кристалла полупроводникового чипа размером с одну пластину удвоилась, позволяя ему эффективно обрабатывать большие языковые модели с десятками триллионов параметров.

“`html

AI стартап Cerebras представляет самый большой чип, WSE-3, для генеративного искусственного интеллекта.

Гонка за более крупными и эффективными моделями искусственного интеллекта разгорается, и Cerebras Systems, крупный конкурент Nvidia, только что представил свое последнее творение – Wafer Scale Engine 3 (WSE-3). Этот третьегенерационный чип искусственного интеллекта, самый крупный полупроводник в мире, призван революционизировать отрасль.

Введение

Потребность в более мощных моделях искусственного интеллекта продолжает толкать границы чиповой технологии. Cerebras Systems, известная своими инновациями в этой области, только что представила WSE-3, самый большой чип искусственного интеллекта в мире. Этот прорывной чип разработан специально для обучения моделей искусственного интеллекта, оптимизируя их нейронные веса для улучшения функциональности. В этой статье мы рассмотрим особенности WSE-3, проанализируем его влияние на отрасль и обсудим его будущие перспективы.

Мощный WSE-3

Похваставшись внушительными улучшениями производительности, WSE-3 устанавливает новый стандарт для чипов искусственного интеллекта. Увеличивая пропускную способность инструкций вдвое, с 62,5 петаFLOPs до потрясающих 125 петаFLOPs, этот чип наносит серьезный удар. Его количество транзисторов также значительно выросло, составляя 4 триллиона транзисторов по сравнению с 2,6 триллиона у его предшественника. Созданный с использованием технологии 5 нм, WSE-3 использует производственный опыт TSMC, одного из ведущих производителей чипов в мире.

Правильный шаг по закону Мура

Андрю Фелдман, сооснователь и генеральный директор Cerebras Systems, подчеркнул значимость WSE-3 с точки зрения Закона Мура. Закон Мура утверждает, что схемотехника чипа удваивается примерно каждые 18 месяцев. Фелдман заявил, что WSE-3 представляет собой истинный шаг по Закону Мура, предлагая вдвое большую производительность при сохранении того же потребления энергии и цены. Этот прорыв долго ожидался в отрасли.

Размер имеет значение

Когда речь идет о размере чипа, WSE-3 уступает своим конкурентам, особенно Nvidia H100 GPU. Фелдман сравнил их, подчеркнув огромную разницу в мощности. WSE-3 является колоссальным 57 раз больше по размеру, чем предложение Nvidia, с 52 раза большим количеством ядер, более чем в 800 раз большей памятью на чипе и более чем в 3 700 раз большей пропускной способностью ткани. Эти впечатляющие показатели ложат базу для выдающейся производительности WSE-3.

Идеальный баланс

Cerebras смогла найти идеальный баланс между вычислениями и памятью в WSE-3. Немного увеличив содержание памяти и количество вычислительных ядер, они создали чип, который оптимизирует обе стороны. Фелдман утверждает, что они считают, что достигли идеального синтеза вычислений и памяти, обеспечивая лучшую производительность для обучения искусственного интеллекта.

Переписывая правила в области времени обучения

WSE-3 предлагает огромные вычислительные возможности, способные обрабатывать теоретическую модель большого языка со впечатляющим 24 триллионами параметров. Это на порядок превышает лучшие генеративные инструменты искусственного интеллекта, такие как GPT-4 от OpenAI, у которого, как утверждается, всего лишь 1 триллион параметров. Машина Cerebras позволяет выполнять все 24 триллиона параметров на одном устройстве. По сравнению с этим, для достижения аналогичных результатов графическим процессорам требуется значительно более сложное программирование и гораздо больше строк кода.

Вопросы и ответы

Q: Как WSE-3 сравнивается с другими чипами искусственного интеллекта по размеру?

A: WSE-3 является самым крупным доступным чипом искусственного интеллекта, уступая своим конкурентам. По сравнению с Nvidia H100 GPU, он в 57 раз больше и предлагает значительно большее количество ядер, память на чипе и пропускную способность ткани.

Q: Какова значимость увеличенных вычислительных и памятных возможностей WSE-3?

A: Находя правильный баланс между вычислениями и памятью, WSE-3 достигает оптимальной производительности для обучения искусственного интеллекта. Это обеспечивает более быстрое и эффективное обучение моделей.

Q: Как WSE-3 упрощает программирование по сравнению с GPU?

A: Машина Cerebras проще в программировании по сравнению с GPU. В то время как для графических процессоров требуется сложное программирование, WSE-3 уменьшает количество строк кода, необходимых для достижения аналогичных результатов, что делает его более доступным и удобным для пользователя.

“““html

Q: Как сравнивается производительность WSE-3 с другими чипами искусственного интеллекта?

A: WSE-3 предлагает беспрецедентную производительность, достигая 125 петафлопсов инструкционной пропускной способности. Эта огромная вычислительная мощность позволяет обрабатывать большие языковые модели с до 24 триллионами параметров, выделяя его среди конкурентов.

Партнерство для Улучшенного Вывода

Помимо выдающихся возможностей обучения WSE-3, Cerebras заключила партнерство с гигантом чипов Qualcomm для улучшения процесса вывода. Используя процессор AI 100 от Qualcomm, Cerebras стремится снизить стоимость запуска генеративных AI моделей в производстве. Путем использования техник, таких как разреженность, спекулятивное декодирование и поиск архитектуры сети, Cerebras и Qualcomm достигли значительных улучшений в производительности вывода.

Взгляд в Будущее

Введение WSE-3 отмечает переломный момент в развитии чипов искусственного интеллекта. С его прорывной производительностью и эффективностью этот чип устанавливает новые стандарты для отрасли. Поскольку модели AI продолжают расти по размеру и сложности, чипы вроде WSE-3 будут играть решающую роль в продвижении области.

Заключение

WSE-3 от Cerebras – свидетельство постоянного стремления к созданию более мощных моделей искусственного интеллекта. С его беспрецедентным размером, производительностью и оптимизацией для обучения, WSE-3 готов перевернуть промышленность. Этот чип представляет собой гигантский скачок вперед, обеспечивая улучшенные вычислительные возможности, которые продвинут исследования и разработку AI.

Не забудьте поделиться этой статьей и оставить свои мысли в комментариях ниже! 💬


Ссылки:

  1. Борьба Китая за Генеративное Видео Набирает Обороты
  2. Получите Microsoft Project 2021 и Visio 2021 со Скидкой 30%
  3. Как AI Брандмауэры Обеспечат Безопасность Ваших Новых Бизнес-Приложений
  4. AlphaTheta (ранее Pioneer DJ Corp) Выпускает Первый Беспроводной DJ-Контроллер и Колонку
  5. Китайский AI-проект Moonshot Поднялся до Оценки в $25 млрд, Собрав $1 млрд для LLM-ориентированного Долгого Контекста
  6. AI-Пионер Cerebras Проводит “Монструозный Год” в Гибридных Вычислениях AI
  7. airfocus Закрепляет $75 млн для Выхода на Рынок Программного Обеспечения для Управления Проектами
  8. Сделать GenAI Более Эффективным с Новым Типом Чипа

“`