`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Тайминги DDR2 и экспресс-тестирование первых модулей

0 
 

Как оказалось, наибольший интерес почти у всех читателей вызывают вопросы влияния таймингов DDR2 на производительность, а также то, насколько ее латентность окажется выше по сравнению с предыдущим стандартом DDR400. Как мы уже говорили в прошлых статьях, касающихся нюансов функционирования подсистем памяти с чипсетами предыдущих поколений, вклад основных таймингов (к примеру, CAS Latency или RAS-to-CAS) в общий результат -- величина непостоянная, очень сильно зависящая от используемой платформы и конфигурации. Так, наибольший рост быстродействия за счет уменьшения задержек зафиксирован на AMD Athlon 64 (Socket 939) -- при снижении значений с 8-4-4-3 (для DDR400) до 5-2-2-2 он составил в реальных задачах около 20%. В системах на чипсетах ATI 9100IGP для платформы Socket 478, отличающихся от конкурентов самой высокой латентностью, подобное понижение таймингов добавило лишь около 3% производительности.

Следовательно, пока можно сделать предварительный вывод -- чем меньше общая латентность контроллера памяти, тем большее влияние на быстродействие оказывают настройки подсистемы памяти. Не вдаваясь в теоретические размышления (см. статью "Подсистема памяти -- чем дальше, тем страшнее..."), сразу перейдем к рассмотрению ситуации с DDR2.

Таблица 1. Сравнение приведенных задержек доступа к памяти (нс) 
Режимы работы памяти (тайминги 8-4-4-3)  DDR400  DDR-533  DDR2-400  DDR2-533  DDR2-667  DDR2-800 
DRAM Command Rate (CMD rate) -- время нахождения микросхемы с необходимыми данными  3,8  10,0  7,7  6,0 
Row Cycle time (TRC) -- время активности банка  RAS# Active time (TRAS) -- время активности страницы  RAS-to-CAS (TRCD) -- время между определением адреса строки и столбца  20  15,4  40,0  30,8  24,0  20 
CAS# Latency (TCL) -- время между определением адресного массива и началом считывания  15  11,5  30,0  23,1  18,0  15 
RAS# Precharge time (TRP) -- время для перезарядки страницы  20  15,4  40,0  30,8  24,0  20 
Общее время задержек  60  46,2  120,0  92,3  72,0  60 

Для большей наглядности выясним (табл. 1), как отличаются по времени выполнения полные циклы операций с памятью стандартов DDR400 и DDR2-533. Сделаем еще одно важное замечание, о котором часто забывают пользователи, -- в подавляющем большинстве BIOS Setup материнских плат тайминги приведены в тактах реальной (!) физической шины, т. е. для DDR400 это такты 200 MHz шины, а для DDR2-533 -- 133 MHz. Как видно из таблицы, общее (теоретическое) время задержек при доступе к памяти действительно значительно меньше у DDR400 даже с учетом одинаковых таймингов. Также наглядно можно убедиться, что латентность обоих стандартов уравняется только после появления DDR2-800.

Здесь необходимо сделать несколько пояснений. Во-первых, указанная латентность DDR533, DDR2-533/667/800 справедлива только при равнозначной пропускной способности процессорной шины. Во-вторых, не следует забывать, что, когда выйдет стандарт DDR2-800, при одинаковой латентности с DDR400 объем передаваемых данных будет уже в два раза выше -- 6,4 GBps (при одноканальном 64-битном доступе) против 3,2 GBps у DDR400. Также данная таблица наверняка поможет понять принципы "вложенности" таймингов -- к примеру, самый большой из доступных таймингов DRAM Cycle time (TRAS), в идеале, должен равняться сумме RAS-to-CAS и CAS Latency. В случае TRAS > TRCD+TCL освобождаются дополнительные такты для синхронизации сигналов, что приводит к росту стабильности при незначительном снижении производительности. Противоположный вариант -- TRAS< TRCD+TCL -- либо невозможен в принципе (контроллеры предыдущих чипсетов вообще не позволяли устанавливать это значение меньше 5, что заведомо больше минимальных 2+2), либо просто заданные цифры будут корректироваться в большую сторону -- по той простой причине, что время активности сигнала RAS# не может быть меньше, чем потребуется на определение адреса строки и столбца (т. е. массива считываемых данных).

Забегая вперед, заметим, что нам удалось установить тайминги 3-3-2-3 для DDR2-533, при этом все программы-идентификаторы подтвердили данные значения, но никакой разницы по сравнению с 6-3-2-3 даже в низкоуровневых тестах обнаружить не удалось, что полностью подтверждает вышесказанное.

На многих материнских платах под Socket 754/939 (AMD Athlon 64) есть возможность задавать еще несколько параметров, в числе которых Row Cycle time (TRC) и Write Enable (TWE). Первый отображает минимальное время активности всего банка памяти и равняется соответственно TRAS+TRP. Если установить значение больше данной суммы, при необходимости освобождаются дополнительные такты для регенерации, в обратной ситуации система либо станет работать нестабильно (равносильно заниженному TRP), либо, как и в случае TRAS, будет просто игнорироваться. Тайминг TWE задает минимальное время, за которое должен быть выдан сигнал о том, что ячейки готовы к операции записи; как можно догадаться, его уменьшение приводит к увеличению скорости в режиме записи. На материнских платах с чипсетами Intel данный параметр, как правило, закрыт для изменения, но именно его прошитыми значениями можно объяснить разную скорость записи у моделей от различных производителей. Что касается тайминга DRAM Command rate (CMD rate), то он определяет, сколько времени потребуется для нахождения необходимой микросхемы -- иными словами, нужного банка. У чипсетов для Socket 478 CMD rate по умолчанию равняется 1Т, для десктопной платформы AMD64 составляет 2Т (иногда изменяется до 1Т). Заметим, один такт задержки возможен только при последовательном обращении, а при произвольном доступе к памяти в любом случае тратится два такта.

Итак, небольшой ликбез по таймингам будем считать законченным. Перейдем к рассмотрению реальных примеров с использованием памяти DDR2 в новых настольных платформах Intel.

Таблица 2. Параметры производительности при различных режимах работы памяти 
Режим тестирования  Максимальная производительность памяти, MBps  Скорость чтения, MBps  Скорость записи, MBps  Латентность, нс 
12-4-4-4 DDR2-533  5330  4048  2230  82 
6-3-2-3 DDR2-533  5466  4280  2260  79 
12-4-4-4 DDR2-400  4847  3884  1906  88 
5-2-2-3 DDR2-400  4951  4086  1952  81 

Таблица 3. Значения удельной производительности* 
Режим тестирования  Максимальная производительность памяти, MBps  Скорость чтения, MBps  Скорость записи, MBps 
12-4-4-4 DDR2-533  10,0  7,6  4,2 
6-3-2-3 DDR2-533  10,3  8,0  4,2 
12-4-4-4 DDR2-400  12,1  9,7  4,8 
5-2-2-3 DDR2-400  12,4  10,2  4,9 
* на 1 MHz эффективной частоты.


Результаты тестирования

Тайминги DDR2 и экспресс-тестирование первых модулей
Тайминги DDR2 и экспресс-тестирование первых модулей
Тайминги DDR2 и экспресс-тестирование первых модулей
Тайминги DDR2 и экспресс-тестирование первых модулей
Тайминги DDR2 и экспресс-тестирование первых модулей
Тайминги DDR2 и экспресс-тестирование первых модулей
Для простоты понимания и наглядности данные, представленные в табл. 2, продублированы на диаграммах. Как можно заметить, даже несмотря на то, что в обоих случаях (DDR2-400 и DDR2-533) частота процессорной шины составляла всего 800 MHz, абсолютная производительность подсистемы памяти существенно увеличилась при переходе от 400 к 533 MHz. Наибольший вклад приходится именно на значительное увеличение скорости записи. Однозначно следует сказать, что контроллеры новых чипсетов Intel 915/925 изначально проектировались исключительно на частоты шины памяти 533 MHz и выше, а поддержка DDR2-400 реализована лишь для совместимости.

Еще одним веским тому подтверждением служат график, демонстрирующий скорость "отклика" подсистемы памяти в зависимости от величины пакета, и диаграмма с результатами средней латентности. Это первый случай, когда асинхронный режим работы шины памяти и процессора, да еще с увеличенными таймингами, оказался более производительным по сравнению с синхронным с меньшими уровнями задержек. Наверняка данная ситуация сохранится с выходом CPU, имеющим шину 266 (1066) MHz; примерно в то же время должны появиться в широкой продаже первые модули DDR2-667. Каким-то образом инженерам Intel удалось повысить быстродействие операций записи за счет освободившихся тактов ожидания процессора. По удельной же производительности (скорость передачи данных при 1 MHz эффективной частоты), разумеется, режим DDR2-400 имеет несколько больший КПД (табл. 3), однако, как мы уже сказали, разница оказалась намного меньшей, чем ожидалось.

Известный факт: из реальных приложений, способных адекватно воспринять сокращение задержек памяти, со значительным отрывом вперед выходят игры. Справедливости ради заметим, что ПО, работающее по принципу базы данных, также весьма чувствительно к настройкам памяти, но это, как говорится, уже совсем другая история. Для анализа изменения быстродействия в развлекательных задачах мы традиционно выбрали Unreal Tournament 2003. Видно, что разница между минимальным режимом 12-4-4-4 для DDR2-400 и 6-3-2-3 для DDR2-533 равняется 15 кадров в секунду, что составило около 8% прироста производительности. Действительно, такой отрыв можно назвать существенным, учитывая использование в тестах далеко не самой быстрой видеокарты на базе NVidia PCX5900.


Модули DDR2-533

Тайминги DDR2 и экспресс-тестирование первых модулей
Kingston KVR533
Тайминги DDR2 и экспресс-тестирование первых модулей
Micron PC2-4300U
Тайминги DDR2 и экспресс-тестирование первых модулей
Samsung PC2-4300U
Тайминги DDR2 и экспресс-тестирование первых модулей
Transcend DDR2-533
Отрадно сообщить, что компании, специализирующиеся на поставках модулей памяти, практически сразу после анонсирования новой десктопной платформы Intel начали поставки на отечественный рынок линеек DDR2-400 ECC для серверов и рабочих станций (о них мы расскажем в будущих материалах) и DDR2-533 для настольных систем. Нам удалось протестировать продукцию таких известных брендов, как Micron, Samsung, Transcend и Kingston. Во всех модулях применялись микросхемы BGA со временем доступа 3,75 нс, что в точности соответствует эффективной частоте 533 MHz. В Micron и Samsung, как обычно, установлены микросхемы одноименных производителей, тогда как Kingston и Transcend построены на идентичных чипах от Elpida. Интересно, что во время масштабного тестирования модулей DDR400, проведенного нами в начале нынешнего года, ни один из продуктов не базировался на микросхемах этой японской компании.

Не вдаваясь в определение разгонного потенциала (пока невостребованного), мы решили ограничиться проверкой минимальных задержек в режиме DDR2-533 при стандартном напряжении 1,8 В и при его увеличении до 2 В (результаты приведены в табл. 4). Продукция Micron всегда была эталоном качества и производительности, не стали исключением и новые модули. При штатном и повышенном уровне питания они стабильно работали с меньшими задержками, тем более что при 2 В мо-дули MT16HTF6464AG оказались единственными, кому покорилось значение 2Т для RAS# Precharge. Неудивительно, что память от Kingston и Transcend продемонстрировала идентичные результаты, которые были чуть выше, чем у Samsung PC2-4300U. Попытка запустить тестовую систему в режиме DDR2 667 даже с таймингами 12-4-4-4 и при увеличенном напряжении ни с одним из комплектов модулей не увенчалась успехом. Жаль, что на тестирование не успели попасть линейки памяти от Hynix -- как известно, продукция именно этого производителя задает тон на мировом рынке.

Таблица 4. Сравнительные характеристики модулей памяти PC2-4300 (DDR2-533) 
Модуль памяти  Samsung PC2-4300U  Micron PC2-4300U  Kingston KVR533  Transcend DDR2-533 
Прошитые тайминги для режима DDR2-533  11-4-4-4  12-4-4-4  12-4-4-4  11-4-4-4 
Минимальные тайминги приштатном напряжении 1,8 В  8-4-3-3  6-3-3-3  8-3-3-3  8-3-3-3 
Минимальные тайминги при повышенном напряжении 2 В  7-4-3-3  6-3-2-3  6-3-3-3  6-3-3-3 


Выводы

Этот материал -- уже третий по счету, в котором серьезно затрагивается вопрос функционирования нового стандарта системной памяти DDR2. Но согласитесь, если уже в следующем году DDR2 станет массовым, подобные усилия оправданы. "Не цепляясь" за текущее сравнение DDR и DDR2, с уверенностью можно сказать, что сама технология DDR2 "не так страшна, как ее малюют", тем более что перспективы у нее очень радужные. На сайтах большинства производителей чипов уже имеется информация о готовых продуктах DDR2-667 (модули с индексом PC2-5300). Зачем далеко ходить, если в спартанских по тонким настройкам BIOS Setup материнских плат Intel присут-ствует возможность выбора этого режима, а чипсеты SiS под Socket LGA775 вообще официально поддерживают память с эффективной частотой 667 MHz.

Как мы сегодня выяснили, теоре-тически новые контроллеры, рассчитанные на применение DDR2, должны быть куда более инертными по сравнению со своими предшественниками, работающими с DDR400. Однако, как показали наши прошлые тестирования, на практике эта разница оказалась менее заметной, в чем есть реальная заслуга инженеров R&D-отдела компании Intel.

Помимо SiS, еще один крупнейший производитель чипсетов, компания VIA Technologies, также в ближайшее время покажет миру свои наборы логики под новые процессоры Intel и память DDR2. Очень будет интересно сравнить эти три решения, что мы обязательно сделаем, как только представится такая возможность.

На самом деле "страшные" значения таймингов для модулей PC2-4300 (к примеру, 12-4-4-4) еще вовсе не означают, что их нельзя привести к более привычным 6-3-3-3 (аналогичная ситуация наблюдается с линейками памяти DDR400, когда стандартная прошивка 8-4-4-3 совсем не мешает выставить на большинстве из них 5-3-2-2,5).

Модули, попавшие к нам на тестирование, являются типичными массовыми изделиями, которым далеко до оверклокерских моделей, однако появление таковых не за горами. Да и вообще, учитывая быстрые темпы выхода на украинский рынок новых систем Intel и сопутствующего оборудования в виде видеокарт PCI Express и памяти DDR2, можно ручаться, что не пройдет и полгода, как большинство отечественных пользователей перестанут воспринимать платформу Socket 775 с ее нововведениями как что-то уникальное и далекое от реальной жизни.

Конфигурация тестовой системы 
Платформа  Intel 
Процессор  Intel Pentium 4 (Prescott) 3,6 GHz, Socket LGA775, FSB 800 MHz 
Материнская плата  Intel D925XCV, чипсет i925X 
Референсная память  Micron PC2-4300U (DDR2-533), 2x512 MB 
Видеокарта  Leadtek PCX5900 128 MB (FX 5900XT, PCI Express) 
Режимы тестирования видео  480/830 MHz (чип/память), ForceWare 62.01 
Жесткий диск   Western Digital WD1600 (160 GB, 7200 об/мин) 
ОС  Windows XP Professional SP2, DirectX 9.0c 

Оборудование предоставлено 
Платформа Intel  Представительство Intel в Украине  (044) 490-6417 
Модули памяти Micron 
Модули памяти Samsung  "Небеса"  (044) 490-3577
Модули памяти Kingston 
Модули памяти Transcend  "Технопарк"  (044) 238-8990 
0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT