|
Способ увеличения производительности CPU-GPU чипов на 20% |
25.07.2012
|
|
Исследователи из Государственного Университета Северной Каролины разработали
новую технологию, которая позволит увеличить производительность гибридных чипов
AMD Fusion примерно на 20%. Для этого пришлось воспользоваться такими
особенностями архитектуры х86, как предварительная выборка данных и большая
кэш-память, чтобы ускорить выполнение параллельных задач на графических
процессорах.
«Современный подход производителей, выпускающих смешанные чипы с центральным и
графическим процессорами на одном кристалле, снижает расходы на их производство
и делает компьютерные вычисления более энергоэффективными. Тем не менее, CPU и
GPU по-прежнему работают почти независимо друг от друга, и редко вместе выполняют
программы, так что в этом плане остаётся пространство для повышения
производительности. Именно в более тесном сотрудничестве процессоров и
заключается наш подход».
Центральные процессоры сейчас имеют меньше вычислительной мощности, чем
графические, но более приспособлены для решения сложных задач. Они обладают
большим количеством блоков специального назначения, отсутствующих в GPU. «Мы
позволяем графическому процессору взять на себя выполнение вычислительных задач,
а центральные процессоры будут им в этом помогать, осуществляя предварительную
выборку данных из памяти. Таким образом, процессоры занимаются теми задачами, для
которых они лучше всего приспособлены». Образно говоря, в этой связке CPU является
«мозгом», который принимает решения и осуществляет гибкую выборку данных, а GPU
«мускулами», которые обрабатывают предоставленные ему данные.
После того, как центральный процессор запускает предназначенное для GPU
приложение, графическое ядро генерирует программу для предварительного
выполнения, используя предлагаемый разработчиками алгоритм компиляции и
содержащую команды доступа к памяти. Программа не производит никаких операций с
данными с плавающей точкой и исполняется до того, как в дело вступает графический
процессор, так как центральный процессор обладает более высокими тактовыми
частотами и более высоким уровнем параллельного выполнения команд. Механизм
предварительной выборки работает с кеш-памятью второго уровня центрального процессора, в результате данные, с которыми работает GPU, хранятся в памяти L3, что
приводит к существенному сокращению времени задержек при обмене данными.
Предварительная программа контролируется приложениями на пользовательском
уровне и предоставляет высокий уровень точности исполнения и гибкости.
Эксперименты, проведённые в ряде бенчмарков, показали, что что такой подход
увеличивает скорость вычислений в среднем на 21,4%, а максимум достигал величины
113%. |
|
|
|
|
674628029 | | Андрей |
|
|
|
|
График работы |
|
|
понедельник - пятница: |
|
|
с 9:00 до 18:00 |
|
|
|
|
|
|
|
|
|
|
|
суббота - воскресенье: |
|
|
выходные дни |
|
|
|
|
|
|
|
Архив новостей |
|
|