Производительность существующих процессоров в персональных компьютерах, смартфонах и других устройствах может быть увеличена с помощью новой программной платформы параллельной обработки данных, которая разработана специалистами Калифорнийского университета в Риверсайде (UCR). Новый метод увеличения мощности был продемонстрирован в рамках 56-го ежегодного Международного симпозиума IEEE/ACM по микроархитектуре.
Большинство современных устройств, от смартфонов и компьютеров до центров обработки данных, использует разные чипы. Это могут быть центральный процессор, графический процессор, а также специальный нейронные чипы для работы с алгоритмами искусственного интеллекта. Все они обрабатывают информацию отдельно, передавая ее от одного чипа к другому. Такой принцип приводит к появлению так называемых узких мест — это явление, при котором производительность или пропускная способность системы ограничена одним или несколькими компонентами или ресурсами.
В новом исследовании учёные из UCR демонстрируют метод, при котором существующие разнообразные компоненты работают одновременно, что значительно повышает скорость обработки информации и снижает потребление энергии.
«Вам больше не нужны новые процессоры. Необходимо лишь грамотно распорядиться имеющимися ресурсами, а не наращивать их количество или заменять старые процессоры на более производительные», — рассказал Хунг-Вей Ценг (Hung-Wei Tseng), адъюнкт-профессор факультета электротехники и вычислительной техники Калифорнийского университета и соавтор исследования.
Новый метод, называемый одновременной и гетерогенной многопоточностью (SHMT), отходит от традиционных моделей программирования, которые могут делегировать область кода исключительно одному типу процессоров, оставляя другие ресурсы бездействующими и не участвующими в текущей функции. Вместо этого SHMT использует несколько компонентов, разбивая вычислительную функцию и в дальнейшем разделяя ее между данными компонентами. Другими словами, это тип параллельной обработки.
Чтобы проверить разработанный учёными метод, они создали систему с процессорами, которые можно найти в любом современном смартфоне или компьютере. В итоге получился некий гибрид между мобильным устройством и ПК. В его основу легла платформа NVIDIA Nano Jetson с четырёхъядерным процессором ARM Cortex-A57 (CPU) и 128 графическими ядрами архитектуры Maxwell (GPU). Через слот M.2 Key E на плате был подключен ускоритель Google Edge (TPU). Объём оперативной памяти LPDDR4 с тактовой частотой 1600 МГц составлял всего 4 ГБ. Дополнительные 8 МБ памяти содержались в модуле Edge TPU. Система работала под управлением операционной системы Ubuntu Linux 18.4.
Тесты показали достаточно высокую эффективность работы новой платформы параллельной обработки. При условии наиболее эффективной политике фреймворк QAWS показал увеличение в скорости работы в 1,95 раза. Отмечалось и довольно сильно снижение энергопотребления — до 51% по сравнению с традиционным методом вычислений. Как утверждают, авторы метода, если его масштабировать до уровня центров обработки данных, то эффект обещает быть еще более колоссальным. И, что самое важное, «железо» менять не придётся.