Выход видеокарт NVIDIA GeForce GTX 4xx
DELETED
Акула пера
3/21/2010, 4:23:06 PM
Хостинг фотографий
Вряд ли это уже кого-то удивит, но история с бесконечными отсрочками релиза наиболее ожидаемых видеокарт NVIDIA GeForce GTX 4xx вновь получила свое продолжение. Известный зарубежом интернет-портал ShaneBaxtor сообщает, что появления на прилавках магазинов графических карт GeForce GTX 470 и GeForce GTX 480 можно ожидать не ранее 6 апреля, тогда как ранее назывался срок 26 марта.
Благо срок сдвинут не так сильно, как это происходило ранее - дебют дискретных ускорителей NVIDIA следующего поколения первоначально ожидался еще в ноябре-декабре прошлого года. Поэтому дополнительные 10 дней для привыкших к ожиданию поклонников этого бренда не должны вызывать особого расстройства.
Впрочем, указанная отсрочка не затрагивает вопроса о неразглашении информации о первых видеокартах поколения Fermi. Поэтому можно надеяться на то, что по прошествии 26 числа сего месяца подробные технические сведения о производительности этих ускорителей не заставят себя долго ждать.
Вряд ли это уже кого-то удивит, но история с бесконечными отсрочками релиза наиболее ожидаемых видеокарт NVIDIA GeForce GTX 4xx вновь получила свое продолжение. Известный зарубежом интернет-портал ShaneBaxtor сообщает, что появления на прилавках магазинов графических карт GeForce GTX 470 и GeForce GTX 480 можно ожидать не ранее 6 апреля, тогда как ранее назывался срок 26 марта.
Благо срок сдвинут не так сильно, как это происходило ранее - дебют дискретных ускорителей NVIDIA следующего поколения первоначально ожидался еще в ноябре-декабре прошлого года. Поэтому дополнительные 10 дней для привыкших к ожиданию поклонников этого бренда не должны вызывать особого расстройства.
Впрочем, указанная отсрочка не затрагивает вопроса о неразглашении информации о первых видеокартах поколения Fermi. Поэтому можно надеяться на то, что по прошествии 26 числа сего месяца подробные технические сведения о производительности этих ускорителей не заставят себя долго ждать.
Rosinka
Мастер
3/28/2010, 1:43:40 PM
666555 вас кто то ввёл в заблуждение
вот так сказать текстовая версия одного из обзоров
<div title="" class="spoilerbody" onclick="open_close. <br><br>Кэш-память работает совместно с разделяемой (общей) памятью мультипроцессора и дополняет её. Общая память улучшает скорость доступа к памяти для алгоритмов с предсказуемым доступом к памяти, а кэш-память L1 ускоряет доступ из нерегулярных алгоритмов, в которых адреса запрашиваемых данных заранее неизвестны. <br><br>Каждый мультипроцессор в GF100 имеет 64 килобайта начиповой памяти, которая может быть сконфигурирована в двух разных вариантах: 48 килобайт общей памяти и 16 килобайт L1 кэш-памяти, и наоборот — 16 КБ общей памяти и 48 КБ кэша. <br><br>Для графических программ GF100 использует вариант с 16 КБ кэша, он работает как регистровый буфер. В вычислительных программах кэш и общая память позволяет потокам одного блока обмениваться данными, работая вместе, что снижает требования к пропускной способности памяти. Кроме того, общая память сама по себе позволяет эффективно использовать на GPU многие вычислительные алгоритмы. <br><br>Кроме того, GF100 имеет 768 КБ унифицированной кэш-памяти второго уровня, которая обслуживает все запросы по загрузке и сохранению данных, а также текстурные выборки. Кэш второго уровня обеспечивает эффективный и высокоскоростной обмен данными для всего GPU. И вычислительные алгоритмы, запросы данных в которых непредсказуемы (физические расчёты, трассировка лучей и др.), получат значительный прирост скорости от аппаратной кэш-памяти. А фильтры постобработки, в которых несколько мультипроцессоров читают одни и те же данные, получат ускорение из-за меньшего количества вызовов данных из внешней памяти. <br><br>Унифицированная кэш-память более эффективна, чем отдельные кэши для разных целей. При выделенных кэшах может сложиться положение, когда один из них используется полностью, но воспользоваться простаивающими объёмами других типов кэш-памяти при этом невозможно. И эффективность кэширования будет ниже теоретически возможной. А унифицированный L2 кэш в GF100 динамически выделяет пространство под разные запросы, что позволяет добиться высокой эффективности. <br><br>В общем, теперь один L2 кэш замещает собой текстурный L2 кэш, кэш ROP и начиповые буферы GPU предыдущих поколений. Кэш второго уровня в GF100 используется для записи и чтения данных, и является полностью последовательным (когерентным). Сравните с L2 кэшем в GT200, используемым только для чтения. <br><br>В целом, новый GPU обеспечивает более эффективный обмен данными между стадиями конвейера и способен значительно сэкономить пропускную способность внешней памяти, повысив эффективность использования исполнительных блоков видеочипа. <br>Новые блоки ROP и улучшенное сглаживание<br><br>Блоки ROP и подсистема блендинга и сглаживания в GF100 также претерпела значительные изменения, направленные на увеличение эффективности их работы. Один раздел ROP в GF100 содержит восемь блоков ROP, то есть вдвое больше, чем в предыдущих поколениях. Каждый блок ROP способен выводить 32-битное целочисленное значение за такт, пиксель формата FP16 за два такта или FP32 пиксель за четыре такта. <br><br>Самым большим недостатком предыдущих чипов, связанным с ROP, считается низкая эффективность сглаживания методом мультисемплинга MSAA 8x. NVIDIA значительно улучшила производительность этого режима в GF100, повысив эффективность сжатия буфера, а также эффективность работы блоков ROP при рендеринге небольших примитивов. Последнее изменение важно и потому, что тесселяция увеличивает количество мелких треугольников, и требования к производительности блоков ROP при этом возрастают. <br><br>Но не только скорость сглаживания нам интересна, но и качество изображения. В своих новых решениях серии GTX 400, NVIDIA вводит новый алгоритм сглаживания, названный 32x CSAA (Coverage Sampling Antialiasing), обеспечивающий высочайшее качество сглаживания как геометрии, так и полупрозрачных текстур, использующих alpha-to-coverage. Число 32 в данном случае расшифровывается как восемь честных мультисемплинговых выборок плюс 24 выборки покрытия пикселя (pixel coverage). <br><br>В предыдущих поколениях использовалось четыре или восемь выборок, что не обеспечивает полного избавления от алиасинга, но вызывает бандинг. А новый режим 32x CSAA использует 32 coverage выборки, минимизирующих все артефакты алиасинга. <br><br>Полупрозрачное сглаживание методом мультисемплинга (Transparency Multisampling, или TMAA) также получает преимущество от улучшенного метода CSAA. TMAA обычно используется в старых DirectX 9 приложениях, которые не используют метод alpha-to-coverage, недоступный для этого API. В этом случае используется техника альфа-теста, при которой полупрозрачные текстуры имеют резкие края. <br><br>Использование coverage выборок не очень сильно повышает требования к пропускной способности памяти и её объёму, производительность нового метода 32x CSAA незначительно отличается от обычного 8x MSAA на GF100, лишь на десяток процентов в худшем случае. А, учитывая небольшую разницу между 4x и 8x, самым лучшим методом по соотношению производительности и качества будет как раз 32x CSAA, особенно на таких мощных решениях, как GTX 470 и GTX 480. <br>Вычислительные задачи на GPU<br><br>До сих пор GPU создавались с расчётом на применение растеризации, а другие применения были лишь побочной возможностью. Но постепенно появляются и другие применения, новые алгоритмы в игровых движках, так как GPU расширяют свои возможности, поддерживая расчётные API вроде CUDA, DirectCompute и OpenCL. <br><br>Архитектура чипа GF100 была спроектирована для эффективного исполнения различных алгоритмов и решения множества неграфических задач, поддающихся распараллеливанию. Например, в трассировке лучей, физических расчётах и алгоритмах искусственного интеллекта, использование общей памяти бесполезно, но в этом случае поможет кэш-память, которая как раз появилась в GF100. 48 килобайт кэша первого уровня на каждый из мультипроцессоров и использование глобального кэша второго уровня может повысить производительность многих алгоритмов. <br><br>Другим важным изменением в GF100 стал улучшенный планировщик. G80 и GT200 выполняют большие программы со сравнительно большим временем переключения контекста между различными задачами. Для чисто вычислительных задач с большими объёмами данных это подходит, но игровые приложения используют несколько различных задач одновременно: имитация тканей, физика жидкостей, постобработка и т.п. И на GF100 эти задачи могут эффективно выполняться параллельно, обеспечивая максимальный КПД для вычислительных устройств. <br><br>В играх с использованием вычислительных шейдеров, переключение контекста происходит каждый кадр, и высокая скорость этого переключения критична для поддержания высокой частоты кадров. В GF100 значительно снизили время переключения контекста (до 20 микросекунд), что сделало возможным быстрое и неоднократное переключение между потоками в пределах одного кадра. <br><br>Вычислительные алгоритмы могут использоваться для решения большого количества задач различного плана в игровых приложениях. Например, это новые гибридные алгоритмы рендеринга, когда трассировка лучей применяется для отрисовки корректных отражений и преломлений. Или воксельный рендеринг для правдоподобной имитации объёмных данных. <br><br>Это может быть и сложная постобработка изображений: продвинутый HDR-рендеринг, сложные фильтры для сглаживания и имитации оптических эффектов, вроде имитации зоны нерезкости и боке (bokeh). А в играх уже сейчас используются физические эффекты, которые можно ещё усложнить, добавить динамику жидкостей, турбулентность для эффектов с системами частиц, вроде дыма или жидкостей, и т.п. <br><br>Из конкретных примеров можно привести многие современные игры. Так, для создания реалистичной водной поверхности в совсем новой игре Just Cause 2 при помощи CUDA используются возможности чипов NVIDIA. Мы уж не говорим о DirectCompute, который применяется для постобработки в Aliens vs Predator, Metro 2033 и DiRT 2. <br><br>Для раскрытия всех вычислительных способностей новых решений, NVIDIA выпустила CUDA Toolkit 3.0, в котором появилась поддержка основанных на графическом процессоре GF100 продуктов, вместе с обещанной поддержкой C++, ECC, а также библиотек линейной алгебры (BLAS и LAPACK), дебаггера CUDA-GDB и профайлера Visual Profiler. <br><br>Также NVIDIA выпускает удобный набор для 3D-разработчиков — Parallel Nsight, также известный как Nexus. Этот набор помогает в удобной разработке приложений, использующих GPU в среде Visual Studio 2008. В него входят утилиты для отлова ошибок, профилирования, анализа кода для GPU и его производительности. Всё это интегрировано прямо в Visual Studio и весьма удобно. Поддерживается CUDA C, OpenCL, DirectCompute, Direct3D, и OpenGL. Мы уверены, что разработчики оценят богатые возможности нового ПО NVIDIA и возьмут его на вооружение. <br>Трассировка лучей<br><br>Метод трассировки лучей часто используется в 3D-графике, но он слишком трудоёмок, чтобы использовать его в графике реального времени. Поэтому в будущих приложениях возможно применение трассировки совместно с растеризацией. Трассировку непросто выполнить эффективно на GPU, ведь просчитываемые лучи имеют непредсказуемые направления, и их просчёт требует доступа к памяти по случайным адресам, в то время как GPU обычно получают данные из памяти линейными блоками. <br><br>Архитектура GF100 как раз отличается от предыдущих тем, что при её проектировании учитывались требования в том числе и алгоритмов трассировки лучей. Это первый видеочип, поддерживающий аппаратную рекурсию, что делает возможным эффективное выполнение подобных задач. Да и двухуровневая архитектура кэширования значительно увеличивает эффективность рейтрейсинга, увеличивая скорость запросов данных из памяти. L1 кэш улучшает «локальность» памяти для соседних лучей, а L2 кэш увеличивает пропускную способность доступа к видеопамяти. <br><br>GF100 способен эффективно выполнять и продвинутые алгоритмы просчёта глобального освещения, такие как трассировка пути (path tracing). Этот метод схож с трассировкой лучей, в нём используется большое количество лучей для сбора данных о непрямом освещении сцены. В данном алгоритме производительность GF100 до 3,5-4 раз выше по сравнению с GT200. <br><br>Но всё же эти методы слишком сложны, чтобы применять их в играх. Разработчики могут использовать одновременно и растеризацию, и трассировку лучей, что называется гибридным рендерингом. Например, растеризация может использоваться в первом проходе рендеринга, а для части пикселей в следующем проходе при помощи трассировки лучей просчитается отражение. Такие гибридные модели — отличный способ получения высокой производительности при весьма высококачественном результате. <br><br>Для демонстрации возможностей своих решений NVIDIA создала специальную демонстрационную программу Design Garage, в которой при рендеринге моделей автомобилей в настраиваемой сцене при помощи технологии NVIDIA OptiX рассчитывается глобальное освещение. Эта программа будет доступна для всех владельцев видеокарт NVIDIA, но на решениях вышедших до GTX 470 и GTX 480, она довольно сильно тормозит. <br><br>В качестве пожелания к игровым разработчикам — нам бы очень хотелось увидеть интеграцию подобной возможности в игровой движок какой-нибудь гоночной игры. С её помощью игроки смогли бы получить очень качественные изображения своих любимых автомобилей в режимах «photo mode» или «gallery mode», уже существующих в подобных играх, но весьма далёких по качеству от представленного выше. <br>Технология NVIDIA 3D Vision Surround<br><br>С выходом решений линейки GTX 400 компания NVIDIA предложила технологию, позволяющую выводить стереоизображение сразу на три монитора (понятно, что сподвигла их на это вышедшая ранее технология Eyefinity от заклятого конкурента). <br><br>Технология использует активные беспроводные затворные очки и стереодрайверы NVIDIA из комплекта 3D Vision. На двух видеокартах GTX 400, работающих в конфигурации SLI, при помощи технологии 3D Vision Surround можно получить стереоизображение высокого разрешения сразу на трёх устройствах вывода. <br><br>Поддерживается три монитора в разрешении 1920x1080 в стереорежиме или в разрешении 2560x1600 в обычном 2D. Также, 3D Vision Surround включает возможность компенсации изображения, скрытого за рамками мониторов. С включенной функцией та часть изображения, которая скрыта за рамками мониторов, не показывается пользователю. В результате получается более целостная картинка, что особенно важно для стереорежима, когда малейшее несоответствие картинки на разных мониторах может разрушить эффект объёма. <br><br>Отметим, что 3D Vision Surround — это чисто программное решение, и оно работает лишь с двумя или более GPU, объединёнными в систему SLI, а с одной видеокартой такой возможности нет — количество активных выходов всё равно не может быть более двух на каждую карту. Зато эта технология будет работать в том числе и на SLI системах на основе старых видеокарт серии GTX 200. Поддержка 3D Vision Surround должна появиться в драйверах в следующем месяце. Выводы по архитектуре<br><br>Из написанного выше очевидно, что GF100 — это абсолютно новая архитектура NVIDIA, а не доработанная старая. Новый GPU отличается значительно улучшенными возможностями по графическим и неграфическим расчётам. Можно сказать, что по своей универсальности он стал ближе к CPU и должен в ближайшем будущем составить им конкуренцию в высокопроизводительных вычислениях. <br><br>С точки зрения графического конвейера в GF100 были сделаны очень важные изменения. В состав нового GPU входит шестнадцать движков тесселяции и четыре блока растеризации, которые весьма полезны для 3D-графики в играх DirectX 11. Тесселяция и наложение карт смещения являются самым важным нововведением этой версии API и приносят заметное улучшение качества картинки, и GTX 470 и GTX 480 должны обеспечивать высокую производительность при обработке геометрии. <br><br>Не только изменениями в графическом конвейере может похвастать новая графическая архитектура NVIDIA. Новые решения предлагают максимальные возможности для неграфических расчётов на GPU. Это первые графические решения с поддержкой C++, рекурсии и возможностью кэширования и записи и чтения данных. Нововведения дают разработчикам возможности для решения множества задач, включая трассировку лучей, глобальное освещение, сложные физические эффекты, искусственный интеллект и т.п. <br><br>В новой архитектуре были устранены и некоторые недостатки предыдущих GPU. Например, блоки ROP в GF100 значительно усилены, а полноэкранное сглаживание получило улучшения и по качеству и по производительности. <br><br>По сравнению с предыдущим чипом, в GF100 компания NVIDIA удвоила число потоковых процессоров, немного увеличила пропускную способность памяти за счёт поддержки GDDR5 (но шина памяти сузилась с 512-бит до 384-бит). И всё бы хорошо, но при сравнении характеристик GF100 и GT200 видно, что слабым местом нового решения может стать количество текстурных модулей — их в GF100 стало даже меньше, чем было в GT200. <br><br>И вполне возможны ситуации, когда GTX 480 будет наравне или даже уступать по скорости текстурирования предыдущим решениям NVIDIA и конкурирующим, особенно в устаревших приложениях, не использующих Gather4 и SSAO. Такому решению NVIDIA мы видим два возможных объяснения. Или разработчики намеренно усилили вычислительные способности чипа, несколько ослабив при этом графические, предполагая дальнейшее изменение баланса в играх в сторону вычислений, или же изначально частота работы текстурных блоков планировалась большей, чем получилось в итоге в моделях, поступивших в продажу. <br><br>Как мы знаем, у NVIDIA разные части чипа способны работать на разных частотах, производных от других. И есть такое предположение, что TMU должны были работать быстрее, и этим объясняется их меньшее количество, по сравнению с GT200. Возможно, что из-за проблем с техпроцессом TSMC, частоту текстурных модулей не удалось поднять до проектной, и в итоге пиковая производительность текстурирования не просто не выросла, а даже снизилась. <br><br>Если решение об усилении математических способностей в ущерб текстурированию было принято намеренно, будет ли оно оправданным при том, что в последние годы выходят в основном мультиплатформенные игры, а требовательные ПК-игры можно пересчитать по пальцам? Впрочем, возможно, что в реальных игровых приложениях недостаток компенсируется улучшенной архитектурой кэширования, которая сгладит его. <br><br>Ещё одним недостатком новых видеокарт NVIDIA, на наш взгляд, можно назвать <br>отключение части потоковых ядер из-за проблем с производством столь сложного чипа на 40 нм техпроцессе TSMC. Все первые модели на GF100 имеют отключенные исполнительные блоки: в GTX 480 и GTX 470 активны не 512 потоковых процессоров, которые физически есть в чипе, а лишь 480 и 448 процессоров, соответственно. Вместе с не слишком высокими частотами это объясняется необходимостью улучшения выхода годных продуктов. В результате, очень хорошо выглядящая на бумаге архитектура может показать не самые впечатляющие результаты в некоторых приложениях. <br><br>Но об этом мы точно узнаем в следующих частях статьи. В первой части мы познакомились с теоретическими особенностями нового чипа GF100 и новых моделей видеокарт на его основе от компании NVIDIA, а следующая часть статьи посвящена практической части исследования в синтетических тестах, в которой мы сравним производительность новых решений на основе чипа GF100 со скоростью предыдущих решений компании и конкурирующих видеокарт AMD.<br>По ссылке, указанной выше, мы познакомились теоретической частью и все поняли про потенциал нового продукта NVIDIA. А теперь перейдем к практической части. А начинается она, как всегда, со знакомства, собственно, с самой видеокартой. <br><br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br>GPU: GeForce GTX 480 (GF100) <br>Интерфейс: PCI-Express x16 <br>Частоты работы GPU (ROPs/Shaders): 700/1400 MHz (номинал — 700/1400 МГц) <br>Частоты работы памяти (физическая (эффективная)): 925 (3700) MHz (номинал — 925 (3700) МГц) <br>Ширина шины обмена с памятью: 384bit <br>Число вершинных процессоров: - <br>Число пиксельных процессоров: - <br>Число универсальных процессоров: 480 <br>Число текстурных процессоров: 60 (BLF/TLF/ANIS) <br>Число ROPs: 48 <br>Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты). <br>Цвет текстолита: черный <br>RAMDACs/TDMS: интегрированы в GPU <br>Выходные гнезда: 2xDVI (Dual-Link/HDMI), HDMI-mini <br>VIVO: нет <br>TV-out: нет <br>Поддержка многопроцессорной работы: SLI (Hardware) <br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br>Карта имеет 1536 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой сторонe PCB. <br><br>Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1000 (4000) МГц. <br><br>Сравнение с эталонным дизайном, вид спереди <br>NVIDIA GeForce GTX 480 1536MB PCI-E Reference card NVIDIA GeForce GTX 285<br><br>Сравнение с эталонным дизайном, вид сзади <br>NVIDIA GeForce GTX 480 1536MB PCI-E Reference card NVIDIA GeForce GTX 285 <br>Мы сравнили новый продукт с последним предыдущим однопроцессорным рещением от NVIDIA, имеющим 512-битный интерфейс обмена с памятью. Очевидно, что из-за того, что ныне шина уменьшена до 384 бит, а также из-за отсутствия отдельного блока NVIO, дизайн PCB несколько упрощен и стал дешевле. Однако в то же время усилен блок питания, поскольку ускоритель потребляет экстремально много — до 300 Вт, а это сравнимо с двухпроцессорным решением предыдущего поколения GTX 295. <br>Кстати, про ТВ-выход можно уже забывать. Все реже и реже встречаются современные видеокарты с этим интерфейсом. Считается, что HDMI должен вытеснить старые аналоговые решения. И мы видим, что новинка от NVIDIA начисто лишена аналогого вывода на ТВ. <br>Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком), поэтому проблем с такими мониторами также не должно быть. К тому же продукт уже оснащен один разъемом HDMI. Следует напомнить, что комбинация из двух таких карт в режиме SLI позволяет выводить картинку игры сразу на ТРИ монитора, делая впечатления от игры более яркими, по аналогии с технологией AMD EyeFinity. <br><br>Максимальные разрешения и частоты: <br>240 Hz Max Refresh Rate <br>2048 x 1536 x 32bit x85Hz Max — по аналоговому интерфейсу <br>2560 x 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI) <br>По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь. <br>Есть смысл сказать, что карта требуют дополнительного питания, причем двумя разъемами, один из которых 8-пиновый, а второй 6-пиновый. Если насчет последнего — нет проблем, так как уже все современные БП имеют такие «хвосты», то для запитки через 8-пиновый разъем требуется специальный переходник, который должен поставляться с серийными видеокартами. <br><br>О системе охлаждения. <br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br><br>Принципиально кулер не отличается от предыдущих решений семейства GTX — турбина прогоняет воздух через радиатор и выводит тепло за пределы системного блока. Однако в виду чрезмерного энергопотребления нового продукта, а следовательно и нагрева, СО претерпела усовершенствования в части усиления теплоотвода с помощью тепловых трубок. Как мы видим, центральный радиатор с трубками охлаждает только ядро. Когда как микросхемы памяти охлаждаются прижимающейся к ним пластиной, находящейся под кожухом. <br><br>Вероятно уже исчерпаны возможности поиска СО такого типа, чтобы могли справиться с сильно греющимся ядром без шума. Поэтому должны сказать, что СО получилась шумная. Даже в 2D режиме кулер работает на 44% от максимума, хотя раньше такой показатель был где-то 20-25%. Шум начинается после 50%. Поэтому кулер работает на грани слышимости шума, и это в простое! Что говорить про нагрузку, когда СО начинает постепенно усиливать обороты вращения турбины, доводя в среднем до 70-80% при работе карты в трехмерном режиме. <br> <br> <br><br><br><br><br><br><br><br><br>Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А. Николайчук AKA Unwinder) и получили следующие результаты: <br><br><br><br>NVIDIA GeForce GTX 480 1536MB PCI-E<br><br><br><br>И это неудивительно, ведь нагрев ядра достигает 95 градусов, и даже такой высокий показатель достигается ценой очень шумной работы СО. Так что любителям самой передовой и быстрой трехмерной игровой графики придется забыть — что такое тишина, если гонять игры или какие-либо тесты. Даже в 2D при нагрузке карты всяким сложным контентом (типа флеша или видео) кулер уже весьма слышим. <br><br><br><br><br>Комплектация. <br><br>Это референсный продукт, поэтому комплектации и упаковки нет. <br><br><br><br><br>Теперь перейдем к тестам. Вначале покажем конфигурацию тестового стенда. <br><br><br><br>Установка и драйверы<br><br>Конфигурация тестового стенда: <br>Компьютер на базе Intel Core I7 CPU 920 (Socket 1366 LGA) <br>процессор Intel Core I7 CPU 920 (2667 MHz); <br>системная плата ASUS P6T Deluxe на чипсете Intel X58; <br>оперативная память 3 GB DDR3 SDRAM Corsair 1066MHz; <br>жесткий диск WD Caviar SE WD1600JD 160GB SATA; <br>блок питания Tagan TG900-BZ 900W. <br>операционная система Windows 7 32bit; DirectX 11; <br>монитор Dell 3007WFP (30");
драйверы ATI версии CATALYST 10.3; NVIDIA версии 197.17.
VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте https://3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
Так как у нас нет своих синтетических DirectX 11 тестов, то нам пришлось воспользоваться примерами из различных пакетов SDK и демонстрационными программами. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).
Также мы взяли по два примера от обоих производителей: NVIDIA и AMD, чтобы ни от кого не было никаких претензий в предвзятости. Из ATI Radeon SDK были взяты примеры DetailTessellation11.exe и PNTriangles11.exe (они есть и в DX SDK, кстати). Ну а со стороны NVIDIA были представлены две демонстрационные программы: Realistic Character Hair и Realistic Water Terrain, которые скоро должны стать доступными для скачивания на сайте компании.
0) явно завышена и нуждается в коррективе — впрочем, это уже решает рынок и спрос. Рекомендованная розничная цена для американского рынка 499 USD, для российского рынка 18999 рублей (на конец марта 2010).
Теперь о дополнительных вещах. Они также немаловажны. Новый продукт NVIDIA отлично поддерживает все последние новации NVIDIA в плане физических расчетов, и этот факт может стать также плюсом в копилку GTX 480. Не забываем про SLI. Установка двух таких карт даст пользователю немалый потенциал в играх (на много месяцев вперед), а также возможность вывода игры на три монитора, причем даже в стереорежиме (у нас будет отдельный материал на тему NVIDIA 3D Vision и ATI Eyefinity). Разумеется, шум будет весьма высоким, нагрев и потребление — тоже, нужен БП не менее 1000 Вт для такой конфигурации. Но это уже для энтузиастов. Вполне вероятно, что партнеры NVIDIA выпустят свои решения и улучшат СО. Также не забываем о том, что при двухплатной конфигурации можно SLI отключить, и использовать второй ускоритель только для обсчета физики.
В целом, очень тяжело дать четко выраженную однозначную оценку. Да, потенциал GTX 480 налицо. Однако он связан со многими минусами: потребление, нагрев, шумность, сверхвысокая (и необъективная) цена. Здесь уже каждый пользователь решает для себя сам — что ему важнее. И еще: чем больше будет выходить игр с реально высоким использованием тесселяции, — тем больше GTX 480 будет выигрывать. Поэтому мы не делаем сейчас окончательных выводов. Вполне возможно, что через год картина кардинально изменится, а может и раньше.
Итак, на сегодня GTX 480 — самый быстрый однопроцессорный ускоритель с феноменальным потенциалом. Тем не менее, самым быстрым трехмерным ускорителем игрового класса по-прежнему остается Radeon 5970. Однако он дороже, а также очень громоздкий. И не забываем, что двухпроцессорная конструкция более уязвима в плане своевременной поддержки той или иной игры драйверами. Тем не менее, GTX 480 SLI — самая быстрая на сегодня двухплатная комбинация, но и самая дорогая.
О более младшем GeForce GTX 470 мы расскажем в следующих материалах, оставайтесь с нами.
Финальный выбор, как обычно, за нашими читателями.
Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших i3D-Speed и i3D-Quality.
вот так сказать текстовая версия одного из обзоров
<div title="" class="spoilerbody" onclick="open_close. <br><br>Кэш-память работает совместно с разделяемой (общей) памятью мультипроцессора и дополняет её. Общая память улучшает скорость доступа к памяти для алгоритмов с предсказуемым доступом к памяти, а кэш-память L1 ускоряет доступ из нерегулярных алгоритмов, в которых адреса запрашиваемых данных заранее неизвестны. <br><br>Каждый мультипроцессор в GF100 имеет 64 килобайта начиповой памяти, которая может быть сконфигурирована в двух разных вариантах: 48 килобайт общей памяти и 16 килобайт L1 кэш-памяти, и наоборот — 16 КБ общей памяти и 48 КБ кэша. <br><br>Для графических программ GF100 использует вариант с 16 КБ кэша, он работает как регистровый буфер. В вычислительных программах кэш и общая память позволяет потокам одного блока обмениваться данными, работая вместе, что снижает требования к пропускной способности памяти. Кроме того, общая память сама по себе позволяет эффективно использовать на GPU многие вычислительные алгоритмы. <br><br>Кроме того, GF100 имеет 768 КБ унифицированной кэш-памяти второго уровня, которая обслуживает все запросы по загрузке и сохранению данных, а также текстурные выборки. Кэш второго уровня обеспечивает эффективный и высокоскоростной обмен данными для всего GPU. И вычислительные алгоритмы, запросы данных в которых непредсказуемы (физические расчёты, трассировка лучей и др.), получат значительный прирост скорости от аппаратной кэш-памяти. А фильтры постобработки, в которых несколько мультипроцессоров читают одни и те же данные, получат ускорение из-за меньшего количества вызовов данных из внешней памяти. <br><br>Унифицированная кэш-память более эффективна, чем отдельные кэши для разных целей. При выделенных кэшах может сложиться положение, когда один из них используется полностью, но воспользоваться простаивающими объёмами других типов кэш-памяти при этом невозможно. И эффективность кэширования будет ниже теоретически возможной. А унифицированный L2 кэш в GF100 динамически выделяет пространство под разные запросы, что позволяет добиться высокой эффективности. <br><br>В общем, теперь один L2 кэш замещает собой текстурный L2 кэш, кэш ROP и начиповые буферы GPU предыдущих поколений. Кэш второго уровня в GF100 используется для записи и чтения данных, и является полностью последовательным (когерентным). Сравните с L2 кэшем в GT200, используемым только для чтения. <br><br>В целом, новый GPU обеспечивает более эффективный обмен данными между стадиями конвейера и способен значительно сэкономить пропускную способность внешней памяти, повысив эффективность использования исполнительных блоков видеочипа. <br>Новые блоки ROP и улучшенное сглаживание<br><br>Блоки ROP и подсистема блендинга и сглаживания в GF100 также претерпела значительные изменения, направленные на увеличение эффективности их работы. Один раздел ROP в GF100 содержит восемь блоков ROP, то есть вдвое больше, чем в предыдущих поколениях. Каждый блок ROP способен выводить 32-битное целочисленное значение за такт, пиксель формата FP16 за два такта или FP32 пиксель за четыре такта. <br><br>Самым большим недостатком предыдущих чипов, связанным с ROP, считается низкая эффективность сглаживания методом мультисемплинга MSAA 8x. NVIDIA значительно улучшила производительность этого режима в GF100, повысив эффективность сжатия буфера, а также эффективность работы блоков ROP при рендеринге небольших примитивов. Последнее изменение важно и потому, что тесселяция увеличивает количество мелких треугольников, и требования к производительности блоков ROP при этом возрастают. <br><br>Но не только скорость сглаживания нам интересна, но и качество изображения. В своих новых решениях серии GTX 400, NVIDIA вводит новый алгоритм сглаживания, названный 32x CSAA (Coverage Sampling Antialiasing), обеспечивающий высочайшее качество сглаживания как геометрии, так и полупрозрачных текстур, использующих alpha-to-coverage. Число 32 в данном случае расшифровывается как восемь честных мультисемплинговых выборок плюс 24 выборки покрытия пикселя (pixel coverage). <br><br>В предыдущих поколениях использовалось четыре или восемь выборок, что не обеспечивает полного избавления от алиасинга, но вызывает бандинг. А новый режим 32x CSAA использует 32 coverage выборки, минимизирующих все артефакты алиасинга. <br><br>Полупрозрачное сглаживание методом мультисемплинга (Transparency Multisampling, или TMAA) также получает преимущество от улучшенного метода CSAA. TMAA обычно используется в старых DirectX 9 приложениях, которые не используют метод alpha-to-coverage, недоступный для этого API. В этом случае используется техника альфа-теста, при которой полупрозрачные текстуры имеют резкие края. <br><br>Использование coverage выборок не очень сильно повышает требования к пропускной способности памяти и её объёму, производительность нового метода 32x CSAA незначительно отличается от обычного 8x MSAA на GF100, лишь на десяток процентов в худшем случае. А, учитывая небольшую разницу между 4x и 8x, самым лучшим методом по соотношению производительности и качества будет как раз 32x CSAA, особенно на таких мощных решениях, как GTX 470 и GTX 480. <br>Вычислительные задачи на GPU<br><br>До сих пор GPU создавались с расчётом на применение растеризации, а другие применения были лишь побочной возможностью. Но постепенно появляются и другие применения, новые алгоритмы в игровых движках, так как GPU расширяют свои возможности, поддерживая расчётные API вроде CUDA, DirectCompute и OpenCL. <br><br>Архитектура чипа GF100 была спроектирована для эффективного исполнения различных алгоритмов и решения множества неграфических задач, поддающихся распараллеливанию. Например, в трассировке лучей, физических расчётах и алгоритмах искусственного интеллекта, использование общей памяти бесполезно, но в этом случае поможет кэш-память, которая как раз появилась в GF100. 48 килобайт кэша первого уровня на каждый из мультипроцессоров и использование глобального кэша второго уровня может повысить производительность многих алгоритмов. <br><br>Другим важным изменением в GF100 стал улучшенный планировщик. G80 и GT200 выполняют большие программы со сравнительно большим временем переключения контекста между различными задачами. Для чисто вычислительных задач с большими объёмами данных это подходит, но игровые приложения используют несколько различных задач одновременно: имитация тканей, физика жидкостей, постобработка и т.п. И на GF100 эти задачи могут эффективно выполняться параллельно, обеспечивая максимальный КПД для вычислительных устройств. <br><br>В играх с использованием вычислительных шейдеров, переключение контекста происходит каждый кадр, и высокая скорость этого переключения критична для поддержания высокой частоты кадров. В GF100 значительно снизили время переключения контекста (до 20 микросекунд), что сделало возможным быстрое и неоднократное переключение между потоками в пределах одного кадра. <br><br>Вычислительные алгоритмы могут использоваться для решения большого количества задач различного плана в игровых приложениях. Например, это новые гибридные алгоритмы рендеринга, когда трассировка лучей применяется для отрисовки корректных отражений и преломлений. Или воксельный рендеринг для правдоподобной имитации объёмных данных. <br><br>Это может быть и сложная постобработка изображений: продвинутый HDR-рендеринг, сложные фильтры для сглаживания и имитации оптических эффектов, вроде имитации зоны нерезкости и боке (bokeh). А в играх уже сейчас используются физические эффекты, которые можно ещё усложнить, добавить динамику жидкостей, турбулентность для эффектов с системами частиц, вроде дыма или жидкостей, и т.п. <br><br>Из конкретных примеров можно привести многие современные игры. Так, для создания реалистичной водной поверхности в совсем новой игре Just Cause 2 при помощи CUDA используются возможности чипов NVIDIA. Мы уж не говорим о DirectCompute, который применяется для постобработки в Aliens vs Predator, Metro 2033 и DiRT 2. <br><br>Для раскрытия всех вычислительных способностей новых решений, NVIDIA выпустила CUDA Toolkit 3.0, в котором появилась поддержка основанных на графическом процессоре GF100 продуктов, вместе с обещанной поддержкой C++, ECC, а также библиотек линейной алгебры (BLAS и LAPACK), дебаггера CUDA-GDB и профайлера Visual Profiler. <br><br>Также NVIDIA выпускает удобный набор для 3D-разработчиков — Parallel Nsight, также известный как Nexus. Этот набор помогает в удобной разработке приложений, использующих GPU в среде Visual Studio 2008. В него входят утилиты для отлова ошибок, профилирования, анализа кода для GPU и его производительности. Всё это интегрировано прямо в Visual Studio и весьма удобно. Поддерживается CUDA C, OpenCL, DirectCompute, Direct3D, и OpenGL. Мы уверены, что разработчики оценят богатые возможности нового ПО NVIDIA и возьмут его на вооружение. <br>Трассировка лучей<br><br>Метод трассировки лучей часто используется в 3D-графике, но он слишком трудоёмок, чтобы использовать его в графике реального времени. Поэтому в будущих приложениях возможно применение трассировки совместно с растеризацией. Трассировку непросто выполнить эффективно на GPU, ведь просчитываемые лучи имеют непредсказуемые направления, и их просчёт требует доступа к памяти по случайным адресам, в то время как GPU обычно получают данные из памяти линейными блоками. <br><br>Архитектура GF100 как раз отличается от предыдущих тем, что при её проектировании учитывались требования в том числе и алгоритмов трассировки лучей. Это первый видеочип, поддерживающий аппаратную рекурсию, что делает возможным эффективное выполнение подобных задач. Да и двухуровневая архитектура кэширования значительно увеличивает эффективность рейтрейсинга, увеличивая скорость запросов данных из памяти. L1 кэш улучшает «локальность» памяти для соседних лучей, а L2 кэш увеличивает пропускную способность доступа к видеопамяти. <br><br>GF100 способен эффективно выполнять и продвинутые алгоритмы просчёта глобального освещения, такие как трассировка пути (path tracing). Этот метод схож с трассировкой лучей, в нём используется большое количество лучей для сбора данных о непрямом освещении сцены. В данном алгоритме производительность GF100 до 3,5-4 раз выше по сравнению с GT200. <br><br>Но всё же эти методы слишком сложны, чтобы применять их в играх. Разработчики могут использовать одновременно и растеризацию, и трассировку лучей, что называется гибридным рендерингом. Например, растеризация может использоваться в первом проходе рендеринга, а для части пикселей в следующем проходе при помощи трассировки лучей просчитается отражение. Такие гибридные модели — отличный способ получения высокой производительности при весьма высококачественном результате. <br><br>Для демонстрации возможностей своих решений NVIDIA создала специальную демонстрационную программу Design Garage, в которой при рендеринге моделей автомобилей в настраиваемой сцене при помощи технологии NVIDIA OptiX рассчитывается глобальное освещение. Эта программа будет доступна для всех владельцев видеокарт NVIDIA, но на решениях вышедших до GTX 470 и GTX 480, она довольно сильно тормозит. <br><br>В качестве пожелания к игровым разработчикам — нам бы очень хотелось увидеть интеграцию подобной возможности в игровой движок какой-нибудь гоночной игры. С её помощью игроки смогли бы получить очень качественные изображения своих любимых автомобилей в режимах «photo mode» или «gallery mode», уже существующих в подобных играх, но весьма далёких по качеству от представленного выше. <br>Технология NVIDIA 3D Vision Surround<br><br>С выходом решений линейки GTX 400 компания NVIDIA предложила технологию, позволяющую выводить стереоизображение сразу на три монитора (понятно, что сподвигла их на это вышедшая ранее технология Eyefinity от заклятого конкурента). <br><br>Технология использует активные беспроводные затворные очки и стереодрайверы NVIDIA из комплекта 3D Vision. На двух видеокартах GTX 400, работающих в конфигурации SLI, при помощи технологии 3D Vision Surround можно получить стереоизображение высокого разрешения сразу на трёх устройствах вывода. <br><br>Поддерживается три монитора в разрешении 1920x1080 в стереорежиме или в разрешении 2560x1600 в обычном 2D. Также, 3D Vision Surround включает возможность компенсации изображения, скрытого за рамками мониторов. С включенной функцией та часть изображения, которая скрыта за рамками мониторов, не показывается пользователю. В результате получается более целостная картинка, что особенно важно для стереорежима, когда малейшее несоответствие картинки на разных мониторах может разрушить эффект объёма. <br><br>Отметим, что 3D Vision Surround — это чисто программное решение, и оно работает лишь с двумя или более GPU, объединёнными в систему SLI, а с одной видеокартой такой возможности нет — количество активных выходов всё равно не может быть более двух на каждую карту. Зато эта технология будет работать в том числе и на SLI системах на основе старых видеокарт серии GTX 200. Поддержка 3D Vision Surround должна появиться в драйверах в следующем месяце. Выводы по архитектуре<br><br>Из написанного выше очевидно, что GF100 — это абсолютно новая архитектура NVIDIA, а не доработанная старая. Новый GPU отличается значительно улучшенными возможностями по графическим и неграфическим расчётам. Можно сказать, что по своей универсальности он стал ближе к CPU и должен в ближайшем будущем составить им конкуренцию в высокопроизводительных вычислениях. <br><br>С точки зрения графического конвейера в GF100 были сделаны очень важные изменения. В состав нового GPU входит шестнадцать движков тесселяции и четыре блока растеризации, которые весьма полезны для 3D-графики в играх DirectX 11. Тесселяция и наложение карт смещения являются самым важным нововведением этой версии API и приносят заметное улучшение качества картинки, и GTX 470 и GTX 480 должны обеспечивать высокую производительность при обработке геометрии. <br><br>Не только изменениями в графическом конвейере может похвастать новая графическая архитектура NVIDIA. Новые решения предлагают максимальные возможности для неграфических расчётов на GPU. Это первые графические решения с поддержкой C++, рекурсии и возможностью кэширования и записи и чтения данных. Нововведения дают разработчикам возможности для решения множества задач, включая трассировку лучей, глобальное освещение, сложные физические эффекты, искусственный интеллект и т.п. <br><br>В новой архитектуре были устранены и некоторые недостатки предыдущих GPU. Например, блоки ROP в GF100 значительно усилены, а полноэкранное сглаживание получило улучшения и по качеству и по производительности. <br><br>По сравнению с предыдущим чипом, в GF100 компания NVIDIA удвоила число потоковых процессоров, немного увеличила пропускную способность памяти за счёт поддержки GDDR5 (но шина памяти сузилась с 512-бит до 384-бит). И всё бы хорошо, но при сравнении характеристик GF100 и GT200 видно, что слабым местом нового решения может стать количество текстурных модулей — их в GF100 стало даже меньше, чем было в GT200. <br><br>И вполне возможны ситуации, когда GTX 480 будет наравне или даже уступать по скорости текстурирования предыдущим решениям NVIDIA и конкурирующим, особенно в устаревших приложениях, не использующих Gather4 и SSAO. Такому решению NVIDIA мы видим два возможных объяснения. Или разработчики намеренно усилили вычислительные способности чипа, несколько ослабив при этом графические, предполагая дальнейшее изменение баланса в играх в сторону вычислений, или же изначально частота работы текстурных блоков планировалась большей, чем получилось в итоге в моделях, поступивших в продажу. <br><br>Как мы знаем, у NVIDIA разные части чипа способны работать на разных частотах, производных от других. И есть такое предположение, что TMU должны были работать быстрее, и этим объясняется их меньшее количество, по сравнению с GT200. Возможно, что из-за проблем с техпроцессом TSMC, частоту текстурных модулей не удалось поднять до проектной, и в итоге пиковая производительность текстурирования не просто не выросла, а даже снизилась. <br><br>Если решение об усилении математических способностей в ущерб текстурированию было принято намеренно, будет ли оно оправданным при том, что в последние годы выходят в основном мультиплатформенные игры, а требовательные ПК-игры можно пересчитать по пальцам? Впрочем, возможно, что в реальных игровых приложениях недостаток компенсируется улучшенной архитектурой кэширования, которая сгладит его. <br><br>Ещё одним недостатком новых видеокарт NVIDIA, на наш взгляд, можно назвать <br>отключение части потоковых ядер из-за проблем с производством столь сложного чипа на 40 нм техпроцессе TSMC. Все первые модели на GF100 имеют отключенные исполнительные блоки: в GTX 480 и GTX 470 активны не 512 потоковых процессоров, которые физически есть в чипе, а лишь 480 и 448 процессоров, соответственно. Вместе с не слишком высокими частотами это объясняется необходимостью улучшения выхода годных продуктов. В результате, очень хорошо выглядящая на бумаге архитектура может показать не самые впечатляющие результаты в некоторых приложениях. <br><br>Но об этом мы точно узнаем в следующих частях статьи. В первой части мы познакомились с теоретическими особенностями нового чипа GF100 и новых моделей видеокарт на его основе от компании NVIDIA, а следующая часть статьи посвящена практической части исследования в синтетических тестах, в которой мы сравним производительность новых решений на основе чипа GF100 со скоростью предыдущих решений компании и конкурирующих видеокарт AMD.<br>По ссылке, указанной выше, мы познакомились теоретической частью и все поняли про потенциал нового продукта NVIDIA. А теперь перейдем к практической части. А начинается она, как всегда, со знакомства, собственно, с самой видеокартой. <br><br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br>GPU: GeForce GTX 480 (GF100) <br>Интерфейс: PCI-Express x16 <br>Частоты работы GPU (ROPs/Shaders): 700/1400 MHz (номинал — 700/1400 МГц) <br>Частоты работы памяти (физическая (эффективная)): 925 (3700) MHz (номинал — 925 (3700) МГц) <br>Ширина шины обмена с памятью: 384bit <br>Число вершинных процессоров: - <br>Число пиксельных процессоров: - <br>Число универсальных процессоров: 480 <br>Число текстурных процессоров: 60 (BLF/TLF/ANIS) <br>Число ROPs: 48 <br>Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты). <br>Цвет текстолита: черный <br>RAMDACs/TDMS: интегрированы в GPU <br>Выходные гнезда: 2xDVI (Dual-Link/HDMI), HDMI-mini <br>VIVO: нет <br>TV-out: нет <br>Поддержка многопроцессорной работы: SLI (Hardware) <br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br>Карта имеет 1536 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой сторонe PCB. <br><br>Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1000 (4000) МГц. <br><br>Сравнение с эталонным дизайном, вид спереди <br>NVIDIA GeForce GTX 480 1536MB PCI-E Reference card NVIDIA GeForce GTX 285<br><br>Сравнение с эталонным дизайном, вид сзади <br>NVIDIA GeForce GTX 480 1536MB PCI-E Reference card NVIDIA GeForce GTX 285 <br>Мы сравнили новый продукт с последним предыдущим однопроцессорным рещением от NVIDIA, имеющим 512-битный интерфейс обмена с памятью. Очевидно, что из-за того, что ныне шина уменьшена до 384 бит, а также из-за отсутствия отдельного блока NVIO, дизайн PCB несколько упрощен и стал дешевле. Однако в то же время усилен блок питания, поскольку ускоритель потребляет экстремально много — до 300 Вт, а это сравнимо с двухпроцессорным решением предыдущего поколения GTX 295. <br>Кстати, про ТВ-выход можно уже забывать. Все реже и реже встречаются современные видеокарты с этим интерфейсом. Считается, что HDMI должен вытеснить старые аналоговые решения. И мы видим, что новинка от NVIDIA начисто лишена аналогого вывода на ТВ. <br>Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком), поэтому проблем с такими мониторами также не должно быть. К тому же продукт уже оснащен один разъемом HDMI. Следует напомнить, что комбинация из двух таких карт в режиме SLI позволяет выводить картинку игры сразу на ТРИ монитора, делая впечатления от игры более яркими, по аналогии с технологией AMD EyeFinity. <br><br>Максимальные разрешения и частоты: <br>240 Hz Max Refresh Rate <br>2048 x 1536 x 32bit x85Hz Max — по аналоговому интерфейсу <br>2560 x 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI) <br>По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь. <br>Есть смысл сказать, что карта требуют дополнительного питания, причем двумя разъемами, один из которых 8-пиновый, а второй 6-пиновый. Если насчет последнего — нет проблем, так как уже все современные БП имеют такие «хвосты», то для запитки через 8-пиновый разъем требуется специальный переходник, который должен поставляться с серийными видеокартами. <br><br>О системе охлаждения. <br><br>NVIDIA GeForce GTX 480 1536MB PCI-E <br><br>Принципиально кулер не отличается от предыдущих решений семейства GTX — турбина прогоняет воздух через радиатор и выводит тепло за пределы системного блока. Однако в виду чрезмерного энергопотребления нового продукта, а следовательно и нагрева, СО претерпела усовершенствования в части усиления теплоотвода с помощью тепловых трубок. Как мы видим, центральный радиатор с трубками охлаждает только ядро. Когда как микросхемы памяти охлаждаются прижимающейся к ним пластиной, находящейся под кожухом. <br><br>Вероятно уже исчерпаны возможности поиска СО такого типа, чтобы могли справиться с сильно греющимся ядром без шума. Поэтому должны сказать, что СО получилась шумная. Даже в 2D режиме кулер работает на 44% от максимума, хотя раньше такой показатель был где-то 20-25%. Шум начинается после 50%. Поэтому кулер работает на грани слышимости шума, и это в простое! Что говорить про нагрузку, когда СО начинает постепенно усиливать обороты вращения турбины, доводя в среднем до 70-80% при работе карты в трехмерном режиме. <br> <br> <br><br><br><br><br><br><br><br><br>Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А. Николайчук AKA Unwinder) и получили следующие результаты: <br><br><br><br>NVIDIA GeForce GTX 480 1536MB PCI-E<br><br><br><br>И это неудивительно, ведь нагрев ядра достигает 95 градусов, и даже такой высокий показатель достигается ценой очень шумной работы СО. Так что любителям самой передовой и быстрой трехмерной игровой графики придется забыть — что такое тишина, если гонять игры или какие-либо тесты. Даже в 2D при нагрузке карты всяким сложным контентом (типа флеша или видео) кулер уже весьма слышим. <br><br><br><br><br>Комплектация. <br><br>Это референсный продукт, поэтому комплектации и упаковки нет. <br><br><br><br><br>Теперь перейдем к тестам. Вначале покажем конфигурацию тестового стенда. <br><br><br><br>Установка и драйверы<br><br>Конфигурация тестового стенда: <br>Компьютер на базе Intel Core I7 CPU 920 (Socket 1366 LGA) <br>процессор Intel Core I7 CPU 920 (2667 MHz); <br>системная плата ASUS P6T Deluxe на чипсете Intel X58; <br>оперативная память 3 GB DDR3 SDRAM Corsair 1066MHz; <br>жесткий диск WD Caviar SE WD1600JD 160GB SATA; <br>блок питания Tagan TG900-BZ 900W. <br>операционная система Windows 7 32bit; DirectX 11; <br>монитор Dell 3007WFP (30");
драйверы ATI версии CATALYST 10.3; NVIDIA версии 197.17.
VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте https://3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
Так как у нас нет своих синтетических DirectX 11 тестов, то нам пришлось воспользоваться примерами из различных пакетов SDK и демонстрационными программами. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).
Также мы взяли по два примера от обоих производителей: NVIDIA и AMD, чтобы ни от кого не было никаких претензий в предвзятости. Из ATI Radeon SDK были взяты примеры DetailTessellation11.exe и PNTriangles11.exe (они есть и в DX SDK, кстати). Ну а со стороны NVIDIA были представлены две демонстрационные программы: Realistic Character Hair и Realistic Water Terrain, которые скоро должны стать доступными для скачивания на сайте компании.
0) явно завышена и нуждается в коррективе — впрочем, это уже решает рынок и спрос. Рекомендованная розничная цена для американского рынка 499 USD, для российского рынка 18999 рублей (на конец марта 2010).
Теперь о дополнительных вещах. Они также немаловажны. Новый продукт NVIDIA отлично поддерживает все последние новации NVIDIA в плане физических расчетов, и этот факт может стать также плюсом в копилку GTX 480. Не забываем про SLI. Установка двух таких карт даст пользователю немалый потенциал в играх (на много месяцев вперед), а также возможность вывода игры на три монитора, причем даже в стереорежиме (у нас будет отдельный материал на тему NVIDIA 3D Vision и ATI Eyefinity). Разумеется, шум будет весьма высоким, нагрев и потребление — тоже, нужен БП не менее 1000 Вт для такой конфигурации. Но это уже для энтузиастов. Вполне вероятно, что партнеры NVIDIA выпустят свои решения и улучшат СО. Также не забываем о том, что при двухплатной конфигурации можно SLI отключить, и использовать второй ускоритель только для обсчета физики.
В целом, очень тяжело дать четко выраженную однозначную оценку. Да, потенциал GTX 480 налицо. Однако он связан со многими минусами: потребление, нагрев, шумность, сверхвысокая (и необъективная) цена. Здесь уже каждый пользователь решает для себя сам — что ему важнее. И еще: чем больше будет выходить игр с реально высоким использованием тесселяции, — тем больше GTX 480 будет выигрывать. Поэтому мы не делаем сейчас окончательных выводов. Вполне возможно, что через год картина кардинально изменится, а может и раньше.
Итак, на сегодня GTX 480 — самый быстрый однопроцессорный ускоритель с феноменальным потенциалом. Тем не менее, самым быстрым трехмерным ускорителем игрового класса по-прежнему остается Radeon 5970. Однако он дороже, а также очень громоздкий. И не забываем, что двухпроцессорная конструкция более уязвима в плане своевременной поддержки той или иной игры драйверами. Тем не менее, GTX 480 SLI — самая быстрая на сегодня двухплатная комбинация, но и самая дорогая.
О более младшем GeForce GTX 470 мы расскажем в следующих материалах, оставайтесь с нами.
Финальный выбор, как обычно, за нашими читателями.
Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших i3D-Speed и i3D-Quality.