adblock check

«Монстр» с 384 ядрами: раскрыты характеристики китайского процессора Sunway SW26010 Pro

Новый 394-ядерный процессор уже работает в составе самого мощного суперкомпьютера, разработанного китайскими учёными

В 2023 году в Китае был запущен самый мощный на территории суперкомпьютер на базе серверных процессоров Sunway SW26010-Pro, представленных двумя годами ранее. Новый процессор стал преемником модели SW26010. Несмотря на то, что релиз чипа состоялся в 2021-м, разработчики только сейчас раскрыли его технические характеристики и уровень производительности.

В основу Sunway SW26010-Pro легла проприетарная архитектура RISC. Процессор включает шесть групп ядер (CG), дополненных блоком обработки протоколов (Protocol Processing Unit — PPU). Каждый CG-кластер объединяет 64 вычислительных ядра (Compute Processing Elements — CPE) с 512-битным векторным движком, 256 кбайт сверхскоростного кеша для данных и 16 кбайт для инструкций; одно управляющее ядро (Management Processing Element — MPE) — суперскалярное ядро внеочередного действия с векторным движком, по 32 Кбайт кеша L1 для данных и инструкций, 512 Кбайт кеша L2; а также 128-битный интерфейс памяти DDR4-3200.

«Монстр» с 384 ядрами: раскрыты характеристики китайского процессора Sunway SW26010 Pro

И вычислительные ядра, и управляющее ядро строят свою работу на основе директорий. Так разработчикам удалось обеспечить согласованный обмен информацией, чтобы повысить точность взаимодействия и сократить время выполнения операций по обмену данными. Новый процессор от своего предшественника без приставки «pro» отличается не только большим числом ядер (384 против 265), но и более высокой тактовой частотой — SW26010-Pro работает на частоте 2,25 ГГц, когда речь заходит про CPE и 2,1 ГГц у MPE. В модели SW26010, и в первом, и во втором случае частота работы была одинаковая — 1,45 ГГц. Увеличить пропускную способность позволила замена памяти DDR3 на DDR4. Изменился не только тип памяти, но и его объём — у предшественника на один кластер CPE приходилось 8 ГБ DDR3, а сейчас это 16 ГБ DDR4. Общий объём поддерживаемой памяти вырос с 32 ГБ до 96 ГБ.

«Монстр» с 384 ядрами: раскрыты характеристики китайского процессора Sunway SW26010 Pro

Если говорить о мощности, то максимальная FP64-производительность достигает отметки 13,8 Тфлопс, а FP32 — 27,6 Тфлопс. Например, самый современный серверный процессор от AMD, получивший название, Epyc 9654 обладает производительностью 5,4 Тфлопс, когда речь заходит о двойной точности. Правда, надо учесть, что в чипе «красных» значительно меньше ядер.

Конечно, не обошлось и без недостатков. В Sunway SW26010-Pro слабым местом является кэш и оперативная память. Разработчики, попытавшись решить проблему с кэшем, увеличили объём сверхскоростной памяти до 256 КБ, однако, из-за отсутствия кэш-памяти второго уровня (L2) этого всё равно недостаточно. Двухканальной же подсистемы памяти DDR4-3200 (51,2 Гбайт/с) едва хватает на 64 ядра с 512-векторным FPU.

ksmorodin
Автор
🇷🇺
1 комментарий
Оставьте комментарий...
Оставьте комментарий...