ARM представили новое поколение вычислительных ядер и графических процессоров. За раз провели ребрендинг названием архитектуру, теперь вычислительные ядра называются ARM C1, а графики Mali G1, которые образуют новую экосистему ARM Lumex. Чипы под торговой маркой б Lumex предназначены для мобильных устройств, Niva для компьютеров, а Zena для автомобилей.

 

Новое поколение процессоров демонстрирует значительный прирост в задачах связанных с искусственным интеллектом, а так же трассировки лучей, и традиционно была увеличениа производительности в обычных задач. Ядра Cortex-X9xx были переименованы в ARM C1-Ultra, ARM C1-Premium новый тип ядер не имевший до этого аналогов , Cortex-A7xx переименованы в ARM C1-Pro, а Cortex-A5xx в ARM C1-Nano.

Все ядра были C1 были переведены на архитектуры ARMv9.3, а так же была добавлена поддержка матричных вычислений ARM Scalable Matrix Extension 2 (SME2), ускоряющая работу задач связанных с искусственным интеллектом и ряда других задач, вроде декодирования HDR видео.

ARM C1-Ultra ядра заточены на увеличение выполнения инструкций за цикл в однопоточных задачах на 25% быстрей Cortex-X925. ARM C1-Premium это предфлагманское решение, которое имеет на 35% меньшую площадь чем ARM C1-Ultra, показывает лучшую производительность на один квадратный миллиметр кремния.

Ядра среднего класса ARM C1-Pro предназначены для выполнения задач создающих большую нагрузку длительное время в высокопроизводительных чипов, а так же использования как самых производительных ядрах в процессорах среднего класса. По сравнению с Cortex-A725 показывает на 16 % большую производительность в играх, и на 12% большую эрегоэффективность при просмотре видео, в социальных сетях и просмотре веб-страниц.

В ядрах ARM C1-Nano основной упор сделан на энергоэффективности, которые на 26% потребляем меньше энергии Cortex-A520. Так же на 2% имеет меньшую площадь и показывает небольшую прирост производительности.

Работой вычислительных ядер управляет C1-DynamIQ Shared Unit (DSU), которых отвечает за совместное использования L3 кэш-памяти и управление питанием. По сравнению с блоком предыдущего поколения DSU-120 было улучшено энергопотребление на 26%.

Один кластер ARM C1 может содержать от одного до 14 ядер. В нем можно комбинировать разные типы ядер выбирая между Ultra, Premium, Pro и Nano.

ARM заявили что в реальных рабочих нагрузках кластер C1 процессоров показывает на 30% большую производительность в тестах, и на 15% в играх и работой с видео. В среднем имеет на 12% меньшее энергопотребление при воспроизведении видео, веб-страницах и социальных сетях по сравнению с процессорами предыдущего поколения.

Благодаря поддержка матричных вычислений SME2 удалось добиться снижения задержки в 4,7 раза в Whisper Base (распознавания речи для преобразования в текст), 4,7 увеличения производительности модели искусственного интеллекта Google Gemma 3 и 2,8 раза более быструю генерацию аудио в Stability AI (преобразование текста в аудио, генерацию фоновой музыки и аудио).

Разработчики имеют бесплатных доступ к инструментам для интеграции и доступа к новым функциям процессоров новой архитектуры.

Новая графика ARM Mali G1-Ultra поддерживает технологию трассировку лучей второго поколения Ray Tracing Unit (RTUv2), которая показывает в два раза большую производительность по сравнению с Immortalis-G925. Частота кадров в увеличивается на 40% в играх использующих аппаратное ускорение трассировки лучей. Теперь RTUv2 сделан в виде отдельного блока, для которого сделано оптимизация энергоэффективности, в частности переход в спящий режим, когда трассировка лучей не используется.

Mali G1-Ultra показывает на 20% более большую производительность при работе с растровой графикой чем Immortalis-G925 в бенчмарках. Так же на 9% имеет улучшенную энергоэффективность, и демонстрирует на 20% большую производительность в задач искусственного интеллекта.

Графика Mali G1-Ultra может иметь от 1 до 24 шейдерных ядер и поддерживает технологию масштабирования изображения ARM Accuracy Super Resolution, работа с которой уже реализована а Unreal Engine 5.