+11 голос |

Чем больше ядер имеет процессор, тем сложнее согласовывать их работу и все больше времени тратится не на вычисления, а на ожидание когда освободится общая шина. На протяжении многих лет работающий в MIT сингапурский ученый Лишуан Пе (Li-Shiuan Peh) продвигает концепцию массивно многоядерных чипов, организованных подобно Интернету: каждое ядро имеет свой маршрутизатор и данные передаются между ними в пакетах фиксированного размера.
На этой неделе, в рамках Международного симпозиума по компьютерной архитектуре, группа профессора Пе показала 36-ядерный чип, построенный по такому «сетевому» принципу. Воплотив в себе ранние идеи группы он также решает одну из главным проблем данной концепции — сложность обеспечения когерентности кэшей, т.е. синхронного обновления локально сохраняемых копий глобально доступных данных.
В «интернет-чипе» каждое ядро соединяется только с непосредственными соседями, и это позволяет данным достигать пункта назначения многими путями, обходя заторы. Ускоряя передачу это, однако, усложняет синхронизацию в сравнении с шинной архитектурой, так как пакеты могут приниматься разными ядрами в разной последовательности.
Создатели чипа вышли из затруднения снабдив его второй «теневой» сетью. Ее функции сводятся к декларированию, что соответствующие ядра послали запрос на получение данных по основной сети. Но именно за счет такой простоты, узлы в теневой сети могут комбинировать декларации и передавать их без задержек.
Группы деклараций достигают локальных маршрутизаторов ядер через дискретные интервалы времени, достаточные для прохождения из одного конца теневой сети в другой. Таким образом, каждый маршрутизатор может сводить в таблицу информацию о том, сколько запросов было сгенерировано в каждый интервал времени и какими ядрами.
36 ядрам назначаются разные иерархические приоритеты, руководствуясь которыми каждое ядро составляет очередь на обработку полученных запросов — это обеспечивает хронологическую упорядоченность последних. Иерархия ядер перетасовывается с каждым новым интервалом, что в среднем дает всем ядрам одинаковый вес.
После проверки работоспособности созданных прототипов, в них предполагается загрузить версию ОС Linux, модифицированную для 36 ядер, и провести оценку производительности реальных приложений, сравнив ее с теоретическими прогнозами. На этом этапе аппаратные описания чипа на языке Verilog планируется предоставить в виде открытого кода.
Комп’ютерний розум: генеративний штучний інтелект у рішеннях AWS
+11 голос |