Как оказалось, наибольший интерес почти у всех читателей вызывают вопросы влияния
таймингов DDR2 на производительность, а также то, насколько ее латентность окажется
выше по сравнению с предыдущим стандартом DDR400. Как мы уже говорили в прошлых
статьях, касающихся нюансов функционирования подсистем памяти с чипсетами предыдущих
поколений, вклад основных таймингов (к примеру, CAS Latency или RAS-to-CAS) в
общий результат -- величина непостоянная, очень сильно зависящая от используемой
платформы и конфигурации. Так, наибольший рост быстродействия за счет уменьшения
задержек зафиксирован на AMD Athlon 64 (Socket 939) -- при снижении значений с
8-4-4-3 (для DDR400) до 5-2-2-2 он составил в реальных задачах около 20%. В системах
на чипсетах ATI 9100IGP для платформы Socket 478, отличающихся от конкурентов
самой высокой латентностью, подобное понижение таймингов добавило лишь около 3%
производительности.
Следовательно, пока можно сделать предварительный вывод --
чем меньше общая
латентность контроллера памяти, тем большее влияние на быстродействие оказывают
настройки подсистемы памяти. Не вдаваясь в теоретические размышления (см.
статью
"Подсистема памяти -- чем дальше, тем страшнее..."),
сразу перейдем к рассмотрению ситуации с DDR2.
Таблица
1. Сравнение приведенных задержек доступа к памяти (нс) |
Режимы
работы памяти (тайминги 8-4-4-3) |
DDR400
|
DDR-533
|
DDR2-400
|
DDR2-533
|
DDR2-667
|
DDR2-800
|
DRAM
Command Rate (CMD rate) -- время нахождения микросхемы с необходимыми данными
|
5
|
3,8
|
10,0
|
7,7
|
6,0
|
5
|
Row
Cycle time (TRC) -- время
активности банка |
RAS#
Active time (TRAS) -- время
активности страницы |
RAS-to-CAS (TRCD)
-- время между определением адреса строки и столбца |
20
|
15,4
|
40,0
|
30,8
|
24,0
|
20
|
CAS# Latency
(TCL) -- время между определением
адресного массива и началом считывания |
15
|
11,5
|
30,0
|
23,1
|
18,0
|
15
|
RAS#
Precharge time (TRP) -- время
для перезарядки страницы |
20
|
15,4
|
40,0
|
30,8
|
24,0
|
20
|
Общее
время задержек |
60
|
46,2
|
120,0
|
92,3
|
72,0
|
60
|
Для большей наглядности выясним (табл. 1), как отличаются по времени выполнения полные циклы операций с памятью стандартов DDR400 и DDR2-533. Сделаем еще одно важное замечание, о котором часто забывают пользователи, --
в подавляющем большинстве BIOS Setup материнских плат тайминги приведены в тактах реальной (!) физической шины, т. е. для DDR400 это такты 200 MHz шины, а для DDR2-533 -- 133 MHz. Как видно из таблицы, общее (теоретическое) время задержек при доступе к памяти действительно значительно меньше у DDR400 даже с учетом одинаковых таймингов. Также наглядно можно убедиться, что латентность обоих стандартов уравняется только после появления DDR2-800.
Здесь необходимо сделать несколько пояснений. Во-первых, указанная латентность DDR533, DDR2-533/667/800 справедлива только при равнозначной пропускной способности процессорной шины. Во-вторых, не следует забывать, что, когда выйдет стандарт DDR2-800, при одинаковой латентности с DDR400 объем передаваемых данных будет уже в два раза выше -- 6,4 GBps (при одноканальном 64-битном доступе) против 3,2 GBps у DDR400. Также данная таблица наверняка поможет понять принципы "вложенности" таймингов -- к примеру, самый большой из доступных таймингов
DRAM Cycle time (TRAS), в идеале, должен равняться сумме
RAS-to-CAS и
CAS Latency. В случае T
RAS > T
RCD+T
CL освобождаются дополнительные такты для синхронизации сигналов, что приводит к росту стабильности при незначительном снижении производительности. Противоположный вариант -- T
RAS< T
RCD+T
CL -- либо невозможен в принципе (контроллеры предыдущих чипсетов вообще не позволяли устанавливать это значение меньше 5, что заведомо больше минимальных 2+2), либо просто заданные цифры будут корректироваться в большую сторону -- по той простой причине, что время активности сигнала RAS# не может быть меньше, чем потребуется на определение адреса строки и столбца (т. е. массива считываемых данных).
Забегая вперед, заметим, что нам удалось установить тайминги 3-3-2-3 для DDR2-533, при этом все программы-идентификаторы подтвердили данные значения, но никакой разницы по сравнению с 6-3-2-3 даже в низкоуровневых тестах обнаружить не удалось, что полностью подтверждает вышесказанное.
На многих материнских платах под Socket 754/939 (AMD Athlon 64) есть возможность задавать еще несколько параметров, в числе которых
Row Cycle time (TRC) и
Write Enable (TWE). Первый отображает минимальное время активности всего банка памяти и равняется соответственно T
RAS+T
RP. Если установить значение больше данной суммы, при необходимости освобождаются дополнительные такты для регенерации, в обратной ситуации система либо станет работать нестабильно (равносильно заниженному T
RP), либо, как и в случае T
RAS, будет просто игнорироваться. Тайминг T
WE задает минимальное время, за которое должен быть выдан сигнал о том, что ячейки готовы к операции записи; как можно догадаться, его уменьшение приводит к увеличению скорости в режиме записи. На материнских платах с чипсетами Intel данный параметр, как правило, закрыт для изменения, но именно его прошитыми значениями можно объяснить разную скорость записи у моделей от различных производителей. Что касается тайминга DRAM Command rate (CMD rate), то он определяет, сколько времени потребуется для нахождения необходимой микросхемы -- иными словами, нужного банка. У чипсетов для Socket 478 CMD rate по умолчанию равняется 1Т, для десктопной платформы AMD64 составляет 2Т (иногда изменяется до 1Т). Заметим, один такт задержки возможен только при последовательном обращении, а при произвольном доступе к памяти в любом случае тратится два такта.
Итак, небольшой ликбез по таймингам будем считать законченным. Перейдем к рассмотрению реальных примеров с использованием памяти DDR2 в новых настольных платформах Intel.
Таблица
2. Параметры производительности при различных режимах работы памяти
|
Режим тестирования
|
Максимальная
производительность памяти, MBps |
Скорость чтения,
MBps |
Скорость записи,
MBps |
Латентность,
нс |
12-4-4-4 DDR2-533
|
5330
|
4048
|
2230
|
82
|
6-3-2-3 DDR2-533
|
5466
|
4280
|
2260
|
79
|
12-4-4-4 DDR2-400
|
4847
|
3884
|
1906
|
88
|
5-2-2-3 DDR2-400
|
4951
|
4086
|
1952
|
81
|
Таблица
3. Значения удельной производительности* |
Режим тестирования
|
Максимальная
производительность памяти, MBps |
Скорость чтения,
MBps |
Скорость записи,
MBps |
12-4-4-4 DDR2-533
|
10,0
|
7,6
|
4,2
|
6-3-2-3 DDR2-533
|
10,3
|
8,0
|
4,2
|
12-4-4-4 DDR2-400
|
12,1
|
9,7
|
4,8
|
5-2-2-3 DDR2-400
|
12,4
|
10,2
|
4,9
|
* на 1
MHz эффективной частоты.
Результаты тестирования
Для простоты понимания и наглядности данные, представленные в табл. 2, продублированы на диаграммах. Как можно заметить, даже несмотря на то, что в обоих случаях (DDR2-400 и DDR2-533) частота процессорной шины составляла всего 800 MHz, абсолютная производительность подсистемы памяти существенно увеличилась при переходе от 400 к 533 MHz. Наибольший вклад приходится именно на значительное увеличение скорости записи. Однозначно следует сказать, что контроллеры новых чипсетов Intel 915/925 изначально проектировались исключительно на частоты шины памяти 533 MHz и выше, а поддержка DDR2-400 реализована лишь для совместимости.
Еще одним веским тому подтверждением служат график, демонстрирующий скорость "отклика" подсистемы памяти в зависимости от величины пакета, и диаграмма с результатами средней латентности. Это первый случай, когда асинхронный режим работы шины памяти и процессора, да еще с увеличенными таймингами, оказался более производительным по сравнению с синхронным с меньшими уровнями задержек. Наверняка данная ситуация сохранится с выходом CPU, имеющим шину 266 (1066) MHz; примерно в то же время должны появиться в широкой продаже первые модули DDR2-667. Каким-то образом инженерам Intel удалось повысить быстродействие операций записи за счет освободившихся тактов ожидания процессора. По удельной же производительности (скорость передачи данных при 1 MHz эффективной частоты), разумеется, режим DDR2-400 имеет несколько больший КПД (табл. 3), однако, как мы уже сказали, разница оказалась намного меньшей, чем ожидалось.
Известный факт: из реальных приложений, способных адекватно воспринять сокращение задержек памяти, со значительным отрывом вперед выходят игры. Справедливости ради заметим, что ПО, работающее по принципу базы данных, также весьма чувствительно к настройкам памяти, но это, как говорится, уже совсем другая история. Для анализа изменения быстродействия в развлекательных задачах мы традиционно выбрали Unreal Tournament 2003. Видно, что разница между минимальным режимом 12-4-4-4 для DDR2-400 и 6-3-2-3 для DDR2-533 равняется 15 кадров в секунду, что составило около 8% прироста производительности. Действительно, такой отрыв можно назвать существенным, учитывая использование в тестах далеко не самой быстрой видеокарты на базе NVidia PCX5900.
Модули DDR2-533
|
Kingston KVR533
|
|
Micron PC2-4300U
|
|
Samsung PC2-4300U
|
|
Transcend DDR2-533
|
Отрадно сообщить, что компании, специализирующиеся на поставках модулей памяти,
практически сразу после анонсирования новой десктопной платформы Intel начали
поставки на отечественный рынок линеек DDR2-400 ECC для серверов и рабочих станций
(о них мы расскажем в будущих материалах) и DDR2-533 для настольных систем. Нам
удалось протестировать продукцию таких известных брендов, как Micron, Samsung,
Transcend и Kingston. Во всех модулях применялись микросхемы BGA со временем доступа
3,75 нс, что в точности соответствует эффективной частоте 533 MHz. В Micron и
Samsung, как обычно, установлены микросхемы одноименных производителей, тогда
как Kingston и Transcend построены на идентичных чипах от Elpida. Интересно, что
во время масштабного тестирования модулей DDR400, проведенного нами в начале нынешнего
года, ни один из продуктов не базировался на микросхемах этой японской компании.
Не вдаваясь в определение разгонного потенциала (пока невостребованного), мы решили ограничиться проверкой минимальных задержек в режиме DDR2-533 при стандартном напряжении 1,8 В и при его увеличении до 2 В (результаты приведены в табл. 4). Продукция Micron всегда была эталоном качества и производительности, не стали исключением и новые модули. При штатном и повышенном уровне питания они стабильно работали с меньшими задержками, тем более что при 2 В мо-дули MT16HTF6464AG оказались единственными, кому покорилось значение 2Т для RAS# Precharge. Неудивительно, что память от Kingston и Transcend продемонстрировала идентичные результаты, которые были чуть выше, чем у Samsung PC2-4300U. Попытка запустить тестовую систему в режиме DDR2 667 даже с таймингами 12-4-4-4 и при увеличенном напряжении ни с одним из комплектов модулей не увенчалась успехом. Жаль, что на тестирование не успели попасть линейки памяти от Hynix -- как известно, продукция именно этого производителя задает тон на мировом рынке.
Таблица
4. Сравнительные характеристики модулей памяти PC2-4300 (DDR2-533)
|
Модуль памяти
|
Samsung PC2-4300U
|
Micron PC2-4300U
|
Kingston KVR533
|
Transcend DDR2-533
|
Прошитые тайминги
для режима DDR2-533 |
11-4-4-4
|
12-4-4-4
|
12-4-4-4
|
11-4-4-4
|
Минимальные
тайминги приштатном напряжении 1,8 В |
8-4-3-3
|
6-3-3-3
|
8-3-3-3
|
8-3-3-3
|
Минимальные
тайминги при повышенном напряжении 2 В |
7-4-3-3
|
6-3-2-3
|
6-3-3-3
|
6-3-3-3
|
Выводы
Этот материал -- уже третий по счету, в котором серьезно затрагивается вопрос функционирования нового стандарта системной памяти DDR2. Но согласитесь, если уже в следующем году DDR2 станет массовым, подобные усилия оправданы. "Не цепляясь" за текущее сравнение DDR и DDR2, с уверенностью можно сказать, что сама технология DDR2 "не так страшна, как ее малюют", тем более что перспективы у нее очень радужные. На сайтах большинства производителей чипов уже имеется информация о готовых продуктах DDR2-667 (модули с индексом PC2-5300). Зачем далеко ходить, если в спартанских по тонким настройкам BIOS Setup материнских плат Intel присут-ствует возможность выбора этого режима, а чипсеты SiS под Socket LGA775 вообще официально поддерживают память с эффективной частотой 667 MHz.
Как мы сегодня выяснили, теоре-тически новые контроллеры, рассчитанные на применение DDR2, должны быть куда более инертными по сравнению со своими предшественниками, работающими с DDR400. Однако, как показали наши прошлые тестирования, на практике эта разница оказалась менее заметной, в чем есть реальная заслуга инженеров R&D-отдела компании Intel.
Помимо SiS, еще один крупнейший производитель чипсетов, компания VIA Technologies, также в ближайшее время покажет миру свои наборы логики под новые процессоры Intel и память DDR2. Очень будет интересно сравнить эти три решения, что мы обязательно сделаем, как только представится такая возможность.
На самом деле "страшные" значения таймингов для модулей PC2-4300 (к примеру, 12-4-4-4) еще вовсе не означают, что их нельзя привести к более привычным 6-3-3-3 (аналогичная ситуация наблюдается с линейками памяти DDR400, когда стандартная прошивка 8-4-4-3 совсем не мешает выставить на большинстве из них 5-3-2-2,5).
Модули, попавшие к нам на тестирование, являются типичными массовыми изделиями,
которым далеко до оверклокерских моделей, однако появление таковых не за горами.
Да и вообще, учитывая быстрые темпы выхода на украинский рынок новых систем Intel
и сопутствующего оборудования в виде видеокарт PCI Express и памяти DDR2, можно
ручаться, что не пройдет и полгода, как большинство отечественных пользователей
перестанут воспринимать платформу Socket 775 с ее нововведениями как что-то уникальное
и далекое от реальной жизни.
Конфигурация
тестовой системы |
Платформа
|
Intel
|
Процессор
|
Intel Pentium
4 (Prescott) 3,6 GHz, Socket LGA775, FSB 800 MHz |
Материнская
плата |
Intel D925XCV,
чипсет i925X |
Референсная
память |
Micron PC2-4300U
(DDR2-533), 2x512 MB |
Видеокарта
|
Leadtek PCX5900
128 MB (FX 5900XT, PCI Express) |
Режимы тестирования
видео |
480/830 MHz
(чип/память), ForceWare 62.01 |
Жесткий диск
|
Western
Digital WD1600 (160 GB, 7200 об/мин) |
ОС
|
Windows XP Professional
SP2, DirectX 9.0c |
Оборудование предоставлено
|
Платформа Intel |
Представительство Intel в Украине
|
(044) 490-6417 |
Модули памяти Micron
|
Модули памяти Samsung
|
"Небеса" |
(044) 490-3577 |
Модули памяти Kingston
|
Модули памяти Transcend
|
"Технопарк"
|
(044) 238-8990 |
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365