`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Время новых героев: NVIDIA GT200 vs. AMD RV770

Статья опубликована в №27 (644) от 15 июля

+66
голосов

Итак, свершилось: почти после двухгодичного топтания на месте оба ведущих производителя видеокарт, и AMD и NVIDIA, наконец выпустили графические процессоры, которые, пусть и с определенными оговорками, можно назвать шагом вперед на архитектурном уровне. Намеренно или случайно, продукты на базе GT200 и RV770 анонсированы и появились в продаже практически в одно и то же время, и мы смогли получить от вендоров абсолютно все новинки, причем по два экземпляра каждой. Это дает нам возможность провести сравнение в SLI и CrossFire.

Воистину событие знаменательное. Причем знаменательность эта многогранна – если NVIDIA два года почивала на лаврах, достигнув архитектурного и технологического превосходства, то AMD в это время тяжело переживала процесс слияния с ATI и пыталась (чаще всего за счет демпинга) удержаться на плаву в среднем и бюджетном классах.

Не слишком ли расслабилась NVIDIA? Смогла ли правильно организовать производственный процесс объединенная AMD? Ответы на эти вопросы дадут сухие диаграммы, а мы пока разберемся, что же именно позволяет нам говорить о новом этапе в развитии графических архитектур конкурентов.

NVIDIA GT200: наступательная эволюция

Начнем с калифорнийской компании, ведь AMD уже довольно долго выступает в роли догоняющего (по крайней мере, это с уверенностью можно утверждать применительно к сегменту high-end – самому показательному при определении технологического лидерства).

Тем не менее на сегодняшний день NVIDIA отстает от AMD в скорости освоения новых техпроцессов – последняя уже больше года производит свои видеочипы по 55-нанометровому, тогда как NVIDIA пока довольствуется 65-нанометровым. Это в итоге и является причиной большей себестоимости решений калифорнийской компании, а также повышенного нагрева и увеличения площади чипа.

Увы, с выходом GT200 изменений не произошло – новый GPU также изготовляется по 65-нанометровому техпроцессу, и площадь его очень велика. При этом мы так и не увидели поддержки DirectX 10.1 – она продолжает оставаться «фишкой» чипов Radeon. NVIDIA утверждает, что это минорное изменение спецификации DirectX, и разработчики игр не будут его использовать. Как бы ни вышло на самом деле, но тут формальное технологическое преимущество все же за AMD.

Время новых героев NVIDIA GT200 vs. AMD RV770
Zotac GeForce GTX 280 AMP! Edition – одна из самых быстрых видеокарт в мире

Количество транзисторов в новом процессоре поражает: их здесь 1,4 млрд штук. По большому счету, архитектурно GT200 недалеко ушел от G92 и, соответственно, G80. Основные принципы построения унифицированной архитектуры остались прежними, и главное нововведение, по сути, – это экстенсивное наращивание числа исполнительных блоков ядра. У GeForce GTX 280 целых 240 шейдерных процессоров против 128 у GeForce 9800 GTX. Раньше флагманским одночиповым решением считался именно GeForce 9800 GTX, и теперь GeForce GTX 280 приходит ему на смену. Количество текстурных модулей возросло с 64 до 80, а блоков растеризации – с 16 до 32.

На базе GT200 пока выпущено две платы – кроме GeForce GTX 280 есть еще GeForce GTX 260, у которого несколько снижены тактовые частоты и меньше исполнительных блоков с формулой 192 унифицированных процессора/64 TMU/28 ROP, что тоже очень и очень немало.

Ну и конечно же, нельзя не упомянуть, что GeForce GTX 280 – это первая видеокарта, стандартный объем графической RAM которой составляет знаковые 1 ГБ. У GeForce GTX 260 немного уóже шина памяти – 448 бит вместо 512 (тоже рекордный показатель!), и соответственно, меньше самого ОЗУ – замысловатые 896 МБ.

Уже на этом этапе становится понятно, что перед нами видеопроцессор с колоссальной вычислительной мощностью, но не содержащий принципиально новых подходов по сравнению с предшественником. Однако это не совсем так, ведь помимо грубого наращивания «мышечной массы» произошло множество архитектурных изменений.

Как и ранее, массив шейдерных вычислителей разделен на кластеры, содержащие текстурные модули, кэши и потоковые процессоры (streaming processors – SP), но конфигурация их несколько иная, в частности, в каждом кластере теперь по три SP, а всего кластеров стало десять. Также каждый из потоковых процессоров сейчас содержит больше памяти для файла регистров, что должно значительно повысить эффективность выполнения сложных шейдеров.

Более существенным нововведением можно считать увеличенное количество одновременно исполняемых потоков – свыше 30 000 для GeForce GTX 280. Для чипов поколений G80/G92 эта цифра была практически вдвое меньше. Кроме того, все потоковые процессоры будут равномерно загружены работой, за чем следит специализированный диспетчер.

Время новых героев NVIDIA GT200 vs. AMD RV770
MSI R4870-T2D512 – одночиповый флагман AMD проявил себя очень хорошо

Важно и то, что теперь каждый SP может выполнять две инструкции MAD+MUL за такт, за счет появления нового специализированного блока внутри потокового процессора – SFU (Special Function Unit). Это нововведение кардинально повышает математическую вычислительную мощность GT200, что должно сказаться как на традиционных задачах 3D-рендеринга, так и на специализированных неграфических вычислениях. Для последних очень важно и такое новшество, как поддержка вычислений с плавающей запятой двойной точности.

Самое пристальное внимание было уделено дальнейшему развитию технологии CUDA. По значимости неграфические вычисления на GPU теперь ставятся NVIDIA как минимум на уровень основных функций видеоадаптера, при этом особый акцент делается на вычислительных ресурсах GT200, приближающихся (в разновидности GeForce 280 GTX) к 1 TFLOPS. Маркетинговая активность, которая должна убедить разработчиков ПО использовать инструментарий CUDA, достаточно велика. Интересно, что последняя версия клиента для распределенных вычислений Folding@Home уже поддерживает вычисления на GPU, при этом быстродействие GeForce GTX 280 в сотни (!) раз выше, нежели у современного четырехъядерного CPU и примерно втрое выше, чем у Radeon HD 3870.

Таким образом, уже сейчас очевидно, что за вычислениями на графических процессорах большое будущее, и многие задачи смогут получить существенный прирост производительности от перехода на GPU-рассчеты. Отрадно, что NVIDIA уделяет данной теме столько внимания, и самый главный ее козырь сейчас – это действительно удобный и качественный инструментарий для разработчиков в виде CUDA.

Время новых героев NVIDIA GT200 vs. AMD RV770
Zotac GeForce GTX 260 AMP! Edition – отличная видеокарта, которой очень нужно подешеветь

Одна из разновидностей таких вычислений – ускорение физических расчетов в играх. Совсем недавно NVIDIA приобрела компанию Ageia, запомнившуюся смелой попыткой создать рынок для нового вида устройств – физических ускорителей. Попытка, разумеется, провалилась, но сам движок PhysX, судя по всему, был очень даже интересен. Поэтому теперь NVIDIA планирует внедрить поддержку расчетов PhysX во все видеокарты с CUDA, за счет чего популярность, а также, вполне вероятно, применяемость этой технологии вырастут многократно. Как и с другими видами вычислений, расчет эффектов PhysX силами видеоадаптера значительно эффективнее, чем с помощью центральных процессоров.

NVIDIA сообщает и о многих других мелких изменениях, которые затронули практически все блоки GPU. В итоге наше предположение крепнет – архитектура GT200 является экстенсивным развитием идей, заложенных в первую унифицированную схему G80, при этом исправлены все недоработки и добавлены все современные дополнительные возможности и функции. Ну а учитывая то, что G80 выдержал почти два года в качестве флагманского решения, и дополнив картину сильно возросшей чистой производительностью, мы получаем (в теории) практически идеальный продукт, имеющий одни только сильные стороны.

Но и такая точка зрения не совсем верна, ведь с эргономикой у GeForce GTX 280/GeForce GTX 260 есть большие проблемы, что, впрочем, вполне в духе современных тенденций. Прежде всего, в реальности нагрев этих видеочипов и видеокарт чрезвычайно высок, а энергопотребление GeForce GTX 280 под нагрузкой составляет четверть киловатта. Не лишним будет упомянуть и то, что для питания применяются два дополнительных коннектора: 6- и 8-контактный.

Надо отдать должное системам охлаждения новинок – они достаточно эффективно справляются с отводом такого жара и при этом практически не шумят.

AMD RV770: неожиданная контратака

Начиная с момента анонса Radeon HD 3870/3850 AMD захватила технологическое лидерство в нескольких областях – 55-нанометровый техпроцесс, использование памяти GDDR4, некоторые инновационные архитектурные шаги. С выходом новых поколений видеочипов – RV770 и GT200 – ситуация остается в целом той же. По-прежнему за AMD преимущество в техпроцессе, а NVIDIA продолжает упорно применять память GDDR3 даже во флагманских продуктах, «выдавливая» из нее все более высокие частоты. Первое, что бросается в глаза из списка спецификаций нового Radeon HD 4870, – это использование памяти GDDR5. При не слишком возросшей реальной тактовой частоте эффективная – выше в четыре раза (у DDR2/3/4 – только в два). Таким образом, стартовая частота первых модулей памяти GDDR5 начинается с запредельного значения 3600 МГц, а в перспективе в ближайшее время нас ожидают микросхемы с возможностью работы на частотах до 7 ГГц. Кроме того, новый тип памяти имеет пониженное энергопотребление, что тоже очень важно, когда мы говорим о современных раскаленных видеокартах.

Как и в случае с NVIDIA, RV770 является дальнейшим развитием унифицированной архитектуры первого поколения, с исправлением недоработок и избавлением от узких мест. Но на фоне конкурента структурные изменения самого чипа выглядят более глобальными. Количество скалярных потоковых процессоров увеличилось до 800, и это дало AMD основания заявить, что производительность RV770 при вычислениях с двойной точностью составляет впечатляющие 240 GFLOPS.

Но куда важнее увеличение функциональных блоков ядра – это 40 текстурных блоков (против 16 у Radeon HD 3850/3870), причем сами TMU были заметно переделаны. Теперь текстурные блоки, как и у NVIDIA, включены в состав кластеров потоковых процессоров, а не сгруппированы в одном месте кристалла, и вследствие этого их конфигурация несколько изменилась. Выросли также объем и производительность внутренней кэш-памяти.

Хотя количество блоков растеризации осталось таким же, как и у RV670 (16), теперь они могут обрабатывать вдвое большее число пикселов, что должно очень позитивно сказаться на ресурсной стоимости полноэкранного сглаживания.

В RV770 AMD приняла решение отказаться от «кольцевой» шины памяти Ring bus, используемой с момента выхода Radeon 1800 XT. Теперь применена схема с четырьмя контроллерами RAM и хабом-диспетчером, который эффективно управляет потоками.

Кроме того, новый чип содержит ряд других, более мелких изменений, в основном исправляющих те или иные недоработки первого поколения архитектуры R600.

Время новых героев NVIDIA GT200 vs. AMD RV770
Gigabyte GV-R485-512H-B – Radeon HD 4850 не урезан по функциональным блокам ядра

Не меньший, а, вероятно, даже больший, чем NVIDIA, акцент делает AMD на альтернативных вычислениях на GPU. Повышению возможностей RV770 в этой области сопутствует возросшее до 800 количество потоковых процессоров. Также был произведен ряд оптимизаций на архитектурном уровне: ускорена производительность расчетов двойной точности с плавающей запятой, достигнута боóльшая степень параллелизма при вычислениях за счет гибкого распределения данных между исполнительными блоками, в результате чего производительность операций по преобразованию Фурье стала выше в семь раз. Помимо этого, значительно увеличено быстродействие случайных операций чтения и записи (в отдельных ситуациях – в два раза по сравнению с Radeon HD 3870).

Не обошлось без нововведений в работе с видео высокого разрешения. На сегодняшний день это одно из главных направлений развития возможностей GPU. В RV770 встроен специализированный процессор для обработки этих задач уже второй версии – UVD 2 (Unified Video Decoder). Поддерживаются 24- и 30-битовые устройства вывода изображения через DisplayPort с разрешением вплоть до 2560×1600.

Развитие получила также идея не только декодировать видео в процессе его просмотра, но и силами GPU производить вычисления по его переводу из одного формата в другой. При этом перекодирование HD-разрешения 1080i на Radeon HD 4870 будет происходить со скоростью, превышающей 30 кадров в секунду – т. е. быстрее, чем в реальном времени.

Среди заметных изменений отметим и переработанный аудиоконтроллер, который в RV770 поддерживает 7.1-канальный вывод с битрейтом вплоть до 6 МБ/с.

На базе RV770 уже выпущено два продукта – Radeon HD 4850 и 4870. В противоположность подходу NVIDIA эти решения не отличаются количеством функциональных блоков ядра, а только частотами и типом применяемой памяти.

Результаты тестирования и выводы

Время новых героев NVIDIA GT200 vs. AMD RV770
Время новых героев NVIDIA GT200 vs. AMD RV770
Время новых героев NVIDIA GT200 vs. AMD RV770
Время новых героев NVIDIA GT200 vs. AMD RV770
Время новых героев NVIDIA GT200 vs. AMD RV770

Мы сравнили, разумеется, все новинки – GeForce 280 GTX, GeForce 260 GTX, Radeon HD 4870 и Radeon HD 4850, а также разогнанные версии видеокарт NVIDIA от Zotac – AMP! Edition, отличающиеся достаточно серьезно повышенными тактовыми частотами. Кроме того, были использованы графические адаптеры прошлого поколения – GeForce 9800 GTX, GeForce 9800 GX2 и Radeon HD 3870. К сожалению, по техническим причинам результаты SLI и CrossFire на момент сдачи номера не были готовы, но эти данные будут доступны на сайте ko-online.com.ua в ближайшее время.

Итак, для тестирования в Crysis мы выбрали наиболее тяжелый режим Very High quality, DirectX 10 и разрешение 1680×1050 – довольно типичное для современных 20-дюймовых мониторов. Формально первое место за GeForce 9800 GX2 – двухчиповым монстром прошлого поколения. Но за ним вплотную идет GeForce 280 GTX, а его разогнанная версия и вовсе быстрее всех. Radeon HD 4870 и GeForce 260 GTX показали одинаковый результат, а Radeon HD 4850 с запасом одолела GeForce 9800 GTX. В остальных тестах картина примерно такая: GeForce 9800 GX в большинстве случаев немного отстает от GeForce 280 GTX, а разгон новинки увеличивает отрыв еще сильнее. При этом при прочих равных, выбирая между SLI-решением и обычной одночиповой видеокартой, предпочтение следует отдать классической плате с одним GPU, которая всегда превосходит многочиповые устройства по эргономике и показывает стабильно высокий результат во всех играх, независимо от того, оптимизировано приложение для SLI или нет.

Если же сравнивать GeForce 280 GTX с прямым одночиповым предшественником, то разница просто колоссальная – практически двукратный прирост в большинстве тестов! Великолепный результат. Неплохо себя проявил и GeForce 260 GTX.

Интереснее же всего показали себя решения от AMD – Radeon HD 4870 идет примерно вровень с GeForce 260 GTX. Но новейшая стратегия компании заключается в том, чтобы с флагманскими решениями конкурента соперничать CrossFire-комбинацией из двух собственных видеокарт. И вот тут начинается самое любопытное: устаревший 65-нанометровый техпроцесс, а может, просто самоуверенность NVIDIA, привели к тому, что новинки на базе чипа GT200 стоят запредельных денег. И по соотношению цена/производительность Radeon HD 4870/4850 легко обходят конкурентов даже с учетом CrossFire.

NVIDIA довольно быстро опомнилась и оперативно снизила цены на свои видеокарты, но и этого на данный момент недостаточно, чтобы конкурировать с AMD. Продукты на базе GT200 получились очень сложными и дорогими, а выход годных чипов – не слишком высоким, так что законы рынка о спросе и предложении не дадут ценам опуститься до рекомендованных компанией значений.

Вот такая парадоксальная ситуация складывается – несмотря на то что в абсолютном выражении NVIDIA выпустила лучшую видеокарту, победа в этом раунде, похоже, все-таки за AMD. Браво!

И мы пожелаем ей удачи и дальнейшего увеличения набранной скорости, которая очень понадобится в ближайшее время, ведь компания потревожила спящего льва.

Конфигурация тестового стенда
Процессор Intel Core 2 Duo E8500 (3,16 ГГц, 6 МБ, 1333 МГц FSB)
Материнская плата ASUS P5N-T (чипсет nForce 780i SLI)
Память Kingston KHX9200D2K2/2G, в режиме DDR2-800, тайминги 4-4-4-8
Жесткий диск Samsung HD501LJ (500 GB, 16 MB Cache)
Блок питания PC Power & Cooling Turbo-Cool 1200 Вт
ОС Windows Vista SP1
Монитор NEC MultySync LCD3090WQXi (разрешения до 2560×1600)
Драйверы ForceWare 177,43, 175,19 (NVIDIA), Catalyst 8.6

Дополнительные материалы:

Диаграммы с результатами в SLI и CrossFire

Время новых героев NVIDIA GT200 vs. AMD RV770Время новых героев NVIDIA GT200 vs. AMD RV770Время новых героев NVIDIA GT200 vs. AMD RV770Время новых героев NVIDIA GT200 vs. AMD RV770Время новых героев NVIDIA GT200 vs. AMD RV770

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+66
голосов

Напечатать Отправить другу

Читайте также

"+" Хочется похвалить авторов за проделанную работу.
"-" Выводы статьи сводяться к лаконичной форме:
"не верь глазам своим..." - т.е. AMD всё равно победитель (=%))!
Как по мне у AMD ситуация осталась почти такая же
(в процентном соотношении), как и в случае
Radeon HD 38** vs GeForse 8800** и даже хуже:
"топовый" Radeon HD 4870 практически во всех тестах (кроме UT3)
уступает "средненькому" GeForse 260GTX, а до GeForse 280GTX
ему не хватает каких-то "незаметных" 15-25%!
Предположим, что стуацию подправит CrossFire, но сильно сомневаюсь,
что GeForse 2*0GTX в SLI не будет быстрее
(про деньги выложенные за эти конфигурации через годик-другой можно не вспоминать, т.к.
карты и вся система будет считаться морально устаревшей и
"и пригодной только в качестве печатной машинки (c)" :)!).

Спасибо!
Лаконичность формы обусловлена колоссальным объемом работы и ограниченностью журанльного места. В итоге статья не разрослась в Тему номера только по организационным причинам, и еле влезла в 5 полос.

Как по мне у AMD ситуация осталась почти такая же
(в процентном соотношении)

Тут от точки зрения зависит. Рельно вроде и так, но психологически перевес сейчас именно на стороне AMD. Я так думаю (с)

zilogR350, если при оценке быстродействия вы опирались только на данные статьи, то Вам можно посочувствовать. Уже опубликована масса обзоров(thg.ru, 3dnews.ru, etc), в которых видно, что 4870 опережает 260GTX, и особенно в высоких разрешениях со сглаживанием. Разница между ним и 280ГТХ - до 15%, при цене меньшей на 70-100%. Да и не топ 4870 - топ будет 4870Х2.
Что касается 4850 - на сегодня это самая лучшая покупка (цена ок. 210 долл. в рознице) - который быстрее на 10-15% чем 9800GTX (цена 300 долл.).

Что касается статьи - удивило, что тестирование проходило в основном на синтетике и играх, которые уже сложно назвать современными (к тому же без включения сглаживания).

Я могу сказать только то, что вы вольны выбирать источники информации по своему собственному усмотрению.
Мне кажется, Crysis и UT3 -- это вполне современные игры, а Fear пока соверешенно не потерял актуальности в плане создания нагрузки на видеокарту.
Сглаживание не включалось только в Crysis (в таком разрешении система и так его еле ворочала), в UT3 и Fear АА включен. В диаграммах указаны настройки.

У меня Radeon HD 2600Pro и 20% которые он "не дотягивает" в (штатном режиме) до Radeon HD 2600XT очень и очень чувствуются (была возможность сравнить в аналогичных условиях).
"Двухчиповая" 3870x2, в "исполнении" AMD работала несколько медленнее чем аналогичные "одночиповые" карты в CrossFire...

Интересно будет смотреться система с 4-мя двухчиповыми 4870Х2(Может даст в Crysis >100fps (Very High settings) в 1680x1050, или процессор будет "бутылочным горлышком"?).

Добавил результаты в SLI и CrossFire для всех сочетаний.

По производительности самого чипа и по некоторім тестам 4000я серия AMD жжет недецКи. НО кто-то будет спорить, что N-бренд тесно сотрудничает с производителями игр компьютерных и мы имеем значек N при загрузке и меньшее кол-во лагов.
Т.е. как в старые добрые времена. 3д марк для нвидии иль для радеона показывает разную производительность :) смотря под кого заточен.
ТАк что AMD надо будет ее поработать над маркетингом своих продуктов.
сам буду ждать ответа на этот ход Н-бренда. Снижения цен и новых продуктов, ибо 280 пока выглядит бредово, а 260 как для мазохиста :)

Евгений Слободянюк, на диаграммах я не заметил информации о сглаживании, в UT3 - просто max settings, в FEAR - мягкие тени выключены.

Ну а по теме - серия 48** действительно получилась очень удачной, особенно радуют цены, которые максимально близки к рекомендованным

Если вы хоть раз включали эти игры, то должны знать, что maximum settings это не просто "я повключал все на максимум", а конкретный набор опций, который включает в себя ,в данном случае, и сглаживание.

Ну а по теме..
Согласен.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT