Контакти

Geforce 9800 яка серія. Визначаємо серію продукту відеокарт Nvidia. Плюси і мінуси відеокарти

NVIDIA GeForce 9000 Series
кодове ім'яG92, G92b, G94, G94b, G96, G98
GPU початкового рівняGeForce 9300GS, GeForce 9400GT, GeForce 9500GT
GPU середнього діапазонуGeForce 9600
топові GPUGeForce 9800
Версія Direct3D і шейдеровDirect3D 10
Shader Model 4.0
версія OpenGLOpenGL 3.3
версія OpenCLOpenCL 1.1
попередникGeForce 8
наступникGeForce 100

NVIDIA GeForce 9800 GX2

Gigabyte GeForce 9500 GT

Технічні характеристики GeForce 9 серії

Модель 9800 9600 9500 9400 9300
GX2 GTX + GTX GT GT Green GT GT Green GSO 512 GSO GT GT GS
дата виходу 18.03.08 18.07.08 01.04.08 18.07.08 - 21.02.08 - - 29.04.08 18.07.08 26.08.08 -
графічний процесор 2 x G92 G92b G92 G92b G94 G94b G94 G92 G96 G98
Кількість транзисторів, млн 2 x 754 754 505 754 314 -
Техпроцес, нм 65 55 65 65 / 55 55 65 / 55 55 65 55 65
Частота ядра, МГц 600 738 675 600 550 650 600 650 550 567
Частота шейдерного блоку, МГц 1500 1836 1688 1512 1375 1625 1500 1625 1375 1400
Кількість потокових процесорів 2 x 128 128 112 64 48 96 32 16 8
Кількість текстурних блоків 2 x 64 64 56 32 24 48 16 8
Кількість блоків растеризації 2 x 16 16 12 8 4
Продуктивність, GFLOPS 2 x 576 705 648 504 462 312 288 234 396 134,4 67,2 33,6
Заповнення сцени, млрд пікс / 2 x 9,6 11,8 10,8 9,6 8,8 10,4 9,6 7,8 6,6 4,4 2,2
Заповнення сцени, млрд текс / 2 x 38,4 47,2 43,2 33,6 30,8 20,8 19,2 15,6 26,4 8,8 4,4 4,5
стандарт відеопам'яті GDDR3 DDR2
Розрядність шини відеопам'яті, біт 2 x 256 256 192 128 64
Частота відеопам'яті, МГц 1000 1100 900 800 500
Пропускна здатність пам'яті, Гб / 2 x 64,0 70,4 57,6 38,4 16,0 8,0
Обсяг відеопам'яті, Мб 2 x 512 512 / 1024 512 384 512 256
Енергоспоживання, Вт 265 140 165 105 75 95 60 90 100 50 30
інтерфейс PCI Express 2.0 x16
Підтримка версій API Direct3D 10, OpenGL 3.3, OpenCL 1.1
Підтримка версії Shader Model Shader Model 4.0

Серія GeForce 9800

NVIDIA GeForce 9800GX2

  • Шина PCI Express 2.0;
  • Два графічних ядра G92-450 (65-нм), що функціонують на частоті 600 МГц;
  • 256 (2 × 128) потокових процесорів, що працюють на частоті 1500 МГц;
  • 1024 Мб (2 × 512 Мб) GDDR3 відеопам'яті з 256-бітним інтерфейсом і частотою 1000 МГц;
  • Споживана потужність становить 265 Вт;
  • Сумісність з DirectX 10 .0 Shader Model 4.0 OpenGL 3.3;
  • Підтримка Quad SLI.

Фактично є подвійний картою на основі пари 8800GTS 512 Мб. Ця відеокарта є продовженням концепції двочіпових акселераторів GX2, які зустрічалися в серії NVIDIA GeForce 7900.

NVIDIA GeForce 9800GTX +

  • Шина PCI Express 2.0;
  • Графічне ядро \u200b\u200bG92b-400 (55-нм), яке функціонує на частоті 738 МГц;
  • 128 потокових процесорів, що працюють на частоті одна тисяча вісімсот тридцять шість МГц;
  • 1024 Мб або 512 Мб GDDR3
  • Споживана потужність становить 140 Вт;
  • Підтримка 3-Way SLI.

Є версією GeForce 9800GTX на 55-нм техпроцесу з збільшеними частотами і меншим енергоспоживанням. За продуктивністю трохи перевершує AMD / ATI Radeon 4850. Пізніше була перейменована в GeForce GTS 250.

NVIDIA GeForce 9800GTX

  • Шина PCI Express 2.0;
  • Графічне ядро \u200b\u200bG92-400 (65-нм), яке функціонує на частоті 675 МГц;
  • 128 потокових процесорів, що працюють на частоті 1688 МГц;
  • 1024 Мб або 512 Мб GDDR3 відеопам'яті з 256-бітним інтерфейсом і частотою 1100 МГц;
  • Споживана потужність становить 168 Вт;
  • Сумісність з DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Підтримка 3-Way SLI.

Аналог NVIDIA GeForce 8800GTS 512 Мб з підвищеними частотами. Дуже швидко поступилася своє місце на ринку 9800GTX +, терміново випущеної у відповідь на вихід AMD / ATI Radeon 4850/4870, які володіли більш високою продуктивністю.

NVIDIA GeForce 9800GT

  • Шина PCI Express 2.0;
  • Графічне ядро \u200b\u200bG92-400 (65-нм / 55-нм), яке функціонує на частоті 600 МГц;
  • 112 потокових процесорів;
  • 1024 Мб або 512 МБ GDDR3
  • Споживана потужність становить 105 Вт;
  • Сумісність з DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Підтримка 2-Way SLI.

Аналог NVIDIA GeForce 8800GT 512 Мб.

NVIDIA GeForce 9800GT Green

  • Шина PCI Express 2.0;
  • Графічне ядро \u200b\u200bG92-400 (55-нм), яке функціонує на частоті 550 МГц;
  • 112 потокових процесорів;
  • 1024 Мб або 512 МБ GDDR3 відеопам'яті з 256-бітним інтерфейсом;
  • Споживана потужність становить 75 Вт;
  • Сумісність з DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Підтримка 2-Way SLI.

Відеоадаптер Nvidia GeForce 9800 GT з об'ємом пам'яті 512 Мб з'явився на ринку в 2008 році, замінивши попередню модель. Пізніше були випущені версії з 1 Гб GDDR5 і поліпшеними можливостями в іграх. Всі варіанти карт виявилися в бюджетній ціновій категорії і призначалися для зборки недорогих ігрових комп'ютерів.

Параметри графічного адаптера цілком відповідають вимогам ігрових додатків 2008-2009 роки. Основні характеристики Nvidia GeForce 9800 GT наступні:

  • Графічний процесор G92-270;
  • Частота GPU - від 550 до 600 МГц;
  • Частота пам'яті - 1400-1800 МГц;
  • Розрядність - 256 біт;
  • Максимальна швидкість передачі даних - 57,6 ГБ / с;
  • Підтримуваний дозвіл зображення - до 2560х1600.

Відеокарта підтримує технологію Nvidia SLI для підвищення продуктивності, HybridPower для автоматичного перемикання на вбудовану графіку і PhysX, що забезпечує максимальну реалістичність ігрового процесу. Працює вона і з пакетами DirectX 10 і OpenGL 2.0, забезпечуючи якісну 3D-графіку. Підтримка більш сучасних наборів API функцій не передбачена.

Огляд GeForce 9800 GT

Енергоспоживання 9800 GT досить висока - на рівні 105 Вт, тому для її роботи потрібно потужний блок живлення. Виробник рекомендує використовувати не менше 450 Вт. Для запуску сучасних ігор варто вибрати більш продуктивні БП - на 500 або Потужність 600 Вт.

Для того щоб підтримувалася нормальна температура відеокарти GeForce 9800 GT, всі модифікації комплектуються активними системами охолодження - як правило, з одним кольором.

У нормальному режимі карта нагрівається не більше ніж до 77 градусів. Максимальне значення - 105 градусів.

Для підключення периферійних пристроїв на відеоадаптер є такі роз'єми:

  • 2 DVI, до яких через перехідники можна підключати і звичайні кабелі VGA і HDMI;
  • TV-Out для виведення аналогового сигналу;
  • MIO, за допомогою якого можна об'єднувати дві карти.

Максимальне значення ефективної частоти відеокарти становить 2000 МГц, що дозволяє розганяти її на 11-30%, в залежності від моделі. Варто врахувати, що помітне збільшення показників може призвести до сильного перегріву.

Як розігнати відеокарту Nvidia GeForce 9800 GT

Виконуючи розгін Nvidia GeForce 9800 GT, можна збільшити значення її частоти. Результатом стає підвищення продуктивності карти і fps під час ігрового процесу. Хоча запускати гри, мінімальним вимогам яких вона не відповідає, все одно не вийде.

Забезпечити розгін відеокарти Nvidia GeForce 9800 GT допоможуть спеціальні утиліти типу MSI Afterburner або Nvidia Inspector.

Максимальна частота розігнаного відеоадаптера не повинна перевищувати 2000 МГц. Розігнана карта працює швидше, але споживає вже до 120-125 Вт.

Після розгону Майнінг на 9800 GT можливий, але не рекомендований. Навіть з появою нової криптовалюта Bitcoin Gold, добувати яку можна за допомогою графічних процесорів, продуктивність все одно буде занадто низькою навіть для того, щоб окупити електрику, тим більше при такому високому TDP.

Які ігри потягне Nvidia GeForce 9800 GT

Проведений свого часу тест в іграх GeForce 9800 GT показав можливість використання відеокарти для бюджетних геймерських ПК. Мінімальні вимоги для комп'ютера, відповідного карті: материнська плата із слотами PCI-Express 16x, 512-1024 МБ ОЗУ і блок живлення на 500 Вт. Також рекомендована установка пакета DX10.

Результати перевірки наступні:

  1. У грі Crysys (2009) при установці роздільною здатністю 1280 × 1024 пікс. 512-мегабайтная модель забезпечує від 22 до 30 fps - приблизно на рівні відеокарти HD 4770.
  2. При запуску гри Stalker (дозвіл 1680х1050 пікс.) Частота зміни картинок досягає 13-25 кадрів в секунду, якщо користуватися адаптером з 512 Мб GDDR5, і до 30, якщо встановити на комп'ютер гігабайтну версію.
  3. Гра Skyrim з 512 Мб картою не запуститься взагалі, а гігабайтна модифікація на мінімальних налаштуваннях покаже до 65 fps.

Ігри, випущені після 2011-2012 рр., Запускати за допомогою GeForce 9800 GT 512 Мб не рекомендується. Більшість з них покаже не більше 20 fps, інші не будуть працювати. Версія з 1 Гб пам'яті підійде, але теж навряд чи забезпечить допустимий якість ігрового процесу.

порівняння виробників

На самому початку продажів ціна Nvidia GeForce 9800 GT становила близько 2700-3000 рублів за версії з 512 Мб і близько 3,5 тис. Руб. за гігабайтні модифікації. Продукція більш відомих виробників типу MSI, Palit і Asus отримала частоту пам'яті 1800 МГц і більш високу вартість. Зараз її можна купити на вторинному ринку всього за 600-700 руб.

МаркаПам'ять, МбЧастота процесора, МГцЧастота пам'яті, МГцВартість, руб.
Gigabyte1024 600 1800 3600
Gigabyte512 600 1500 2900
Gigabyte512 550 1800 2800
ECS512 550 1800 2600
MSI512 550 1800 2900
Asus512 600 1800 3000
Inno3D1024 600 1800 3500
Club 3D1024 550 1400 3300
Gainward1024 550 1800 3500
Zotac1024 550 1600 3400
Palit512 600 1800 2700
Palit1024 550 1800 3400

Більш вигідні варіанти брендів Zotac, Club 3D і Gigabyte обходилися покупцям дешевше, але і працювали повільніше. Частота таких графічних адаптерів перебувала в межах 1400-1600 МГц. Зараз їх ціна приблизно така ж, як для моделей колись коштували дорожче - не більш 1000 руб.

Як перевстановити відеодрайвер для GeForce 9800 GT

Для нормальної роботи відеоадаптера потрібна наявність правильно працюють керуючих програм. Існує три способи, як завантажити і встановити нові драйвера на комп'ютер з картою 9800 GT:

  1. Завантаження з офіційного ресурсу виробника. Єдиний варіант, який гарантує правильну роботу і безпеку ПК.
  2. Завантаження зі сторонніх ресурсів. Спосіб, при якому можна не тільки завантажити драйвер для Nvidia GeForce 9800 GT, але і заразити комп'ютер вірусом.
  3. Використання спеціальних утиліт типу DriverPack Solution, DriverHub або Driver Booster Free. В цьому випадку драйвер може виявитися застарілим.

На офіційному сайті компанії Nvidia можна знайти нові версії керуючих програм для відеокарти, призначені для різних операційних систем. У списку підтримуваних картою платформ є Windows 7 32 і 64 біт, Windows 10 і Linux. На інших ресурсах можна знайти драйвера і для таких рідкісних ОС, як Solaris.

технологія (нм)90 80 65/55 транзисторів (М)681 289 210 754 505 314 універсальних процесорів128 32 16 128 64 32 текстурних блоків32 16 8 64 32 16 блоків блендінга24 8 16 8 шина пам'яті384 (64х6)128 (64х2)256 (64Х4)128 (64х2) типи пам'ятіDDR, GDDR2, GDDR3, GDDR4 системна шина чіпаPCI-Express 16хPCI-Express 2.0 16х RAMDAC2 х 400МГц інтерфейсиTV-Out
TV-In (потрібен чіп захоплення)
2 x DVI Dual Link
HDTV-OutTV-Out
TV-In (потрібен чіп захоплення)
2 x DVI Dual Link
HDTV-Out
HDMITV-Out
TV-In (потрібен чіп захоплення)
2 x DVI Dual Link
HDTV-Out
HDMI
DisplayPort вершинні шейдери4.0 піксельні шейдери4.0 точність піксельних обчисленьFP32 точність вершинних обчисленьFP32 формати текстурFP32)
FP16
I8
DXTC, S3TC
3Dc формати рендеринга FP32
FP16
I8
10
інші MRTє антиалиасингTAA (AA прозорих полігонів)
CSAA 2x-16x
генерація Z2х в режимі без кольору буфер шаблонівдвосторонній технології тінейапаратні карти тіней
оптимізації геометричних тіней

Специфікації референсних карт на базі сімейства G8X

мапачіп
шина
блоків ALU / TMUчастота ядра (МГц)частота пам'яті (МГц)обсяг пам'яті (Мбайт)ПСП (Гбайт)тексель Рейт (мтекс)філл
Рейт (мегапікселів)
GeForce 8500 GTG86
PEG16х
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16х
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16х
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16х
96/24 500 800(1600) 320 GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16х
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16х
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16х
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256MBG92
PEG16х
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16х
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16х
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800 GSG92
PEG16х
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16х
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16х
32/16 550 800(1600) 256/512 GDDR2 / GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16х
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16х
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16х
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16х
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX +G92
PEG16х
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16х
2x (128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16х
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
мапачіп
шина
блоків ALU / TMUчастота ядра (МГц)частота пам'яті (МГц)обсяг пам'яті (Мбайт)ПСП (Гбайт)тексель Рейт (мтекс)філл
Рейт (мегапікселів)

Подробиці: G80, сімейство GeForce 8800

специфікації G80

  • Офіційна назва чіпа GeForce 8800
  • Кодове ім'я G80
  • Технологія 90 нм
  • 681 мільйон транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин і пікселів, а також інших можливих видів даних
  • Апаратна підтримка останніх нововведень DirectX 10, в тому числі і нової шейдерной моделі - Shader Model 4.0, генерації геометрії і запису проміжних даних з шейдерів (stream output)
  • 384 біт шина пам'яті, 6 незалежних контролерів шириною 64 біта, підтримка GDDR4
  • Частота ядра 575 ГГц (GeForce 8800 GTX)
  • 128 скалярних ALU з плаваючою точкою (цілочисельні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD + MUL без втрати тактів)
  • ALU працюють на більш ніж подвоєною частотою (1.35 ГГц для 8800 GTX)
  • 32 текстурних блоки, підтримка FP16 і FP32 компонент в структурах
  • 64 блоку білінійної фільтрації (тобто можлива безкоштовна чесна трилинейная фільтрація, а також удвічі ефективніша за швидкістю анізотропна фільтрація)
  • - розмір блоку планування - 8х4 (32) пікселя.
  • 6 широких блоків ROP (24 пікселя) c підтримкою режимів антиалиасинга до 16 семплів на піксель в тому числі при FP16 або FP32 форматі буфера кадру (тобто можливі HDR + AA). Кожен блок складається з масиву гнучко конфігуруються ALU і відповідає за генерацію і сравніеніе Z, MSAA, Блендінг. Пікова продуктивність всієї підсистеми до 96 MSAA відліків (+ 96 Z) за такт, в режимі без кольору (Z only) - 192 відліку за такт.
  • Всі інтерфейси винесені на зовнішній додатковий чіп NVIO (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Дуже хороша масштабованість архітектури, можна по одному блокувати або прибирати контролери пам'яті і ROP (всього 6), шейдерниє блоки (всього 8 блоків TMU + ALU)

Специфікації референсной карти GeForce 8800 GTX

  • Частота ядра 575 МГц
  • Частота універсальних процесорів 1350 МГц
  • Кількість текстурних блоків - 32, блоків блендінга - 24
  • Обсяг пам'яті 768 мегабайт
  • Пропускна здатність пам'яті 86.4 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 13.8 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур 18.4 гігатекселя в сек.
  • SLI роз'єм
  • Шина PCI-Express 16х
  • Рекомендована ціна $ 599

Специфікації референсной карти GeForce 8800 GTS

  • Частота ядра 500 МГц
  • Частота універсальних процесорів 1200 МГц
  • Кількість універсальних процесорів 96
  • Кількість текстурних блоків - 24, блоків блендінга - 20
  • Тип пам'яті GDDR3, 1.1 нс (штатна частота 2 * 900 МГц)
  • Обсяг пам'яті 640 мегабайт
  • Теоретична максимальна швидкість зафарбування 10.0 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур 12.0 гігатекселя в сек.
  • Два DVI-I роз'єму (Dual Link, підтримується висновок в дозволах до 2560х1600)
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $ 449

архітектура

Переходу на уніфіковані графічні архітектури ми чекали довго. Тепер можна констатувати факт - з появою GeForce 8800 цей перехід відбувся, і критична вершина вже пройдена. Далі піде поступовий спуск подібних архітектур в середній і бюджетний сегменти і їх подальший розвиток, аж до злиття з багатоядерними процесорними архітектурами в далекій перспективі. Отже, знайомимося з першої уніфікованої архітектурою від NVIDIA:

Перед нами вся діаграма чіпа. Чіп складається з 8 універсальних обчислювальних блоків (шейдерних процесорів) і хоча NVIDIA говорить про 128 процесорах, заявляючи, що кожне ALU є таким, це трохи невірно - одиниця виконання команд - такий ось процесорний блок, в якому згруповані 4 TMU і 16 ALU. Всього, таким чином, ми маємо 128 ALU і 32 TMU, але гранулярность виконання становить 8 блоків, кожен з яких в один момент може займатися своєю справою, наприклад, виконувати частину вершинного, або пиксельного, або геометричного шейдера над блоком з 32 пікселів (або блоком з відповідного числа вершин і інших примітивів). Всі розгалуження, переходи, умови і т.д. застосовуються цілком до одного блоку і таким чином найлогічніше, його і називати шейдерних процесорів, нехай і дуже широким.

Кожен такий процесор забезпечений власним кешем першого рівня, в якому тепер зберігаються не тільки текстури, а й інші дані, які можуть бути запитані шейдерних процесорів. Важливо розуміти, що основний потік даних, наприклад пікселі або вершини, які і проходять обробку, рухаючись по колу під керуванням сірого кардинала (блоку, позначеного на схемі Thread Processor) - не кешуються, а йдуть потоком, в чому і полягає основна принада сьогоднішніх графічних архітектур - відсутність повністю випадкового доступу на рівні оброблюваних примітивів.

Крім керуючого блоку і 8 обчислювальних шейдерних процесорів в наявності 6 блоків ROP, які виконують визначення видимості, запис в буфер кадру і MSAA (сині, поруч з блоками кешу L2) згруповані з контролерами пам'яті, чергами записи і кешем другого рівня.

Таким чином, ми отримали дуже широку (8 блоків, що обробляють порції по 32 пікселя кожен) архітектуру здатну плавно масштабироваться в обидві сторони. Додавання або видалення контролерів пам'яті і шейдерних процесорів, буде відповідним чином масштабувати пропускну здатність всієї системи, не порушуючи балансу і не створюючи вузьких місць. Це логічне і красиве рішення, що реалізує основний плюс уніфікованої архітектури - автоматичний баланс і високий ККД використання наявних ресурсів.

Крім шейдерних блоків і ROP в наявності набір керуючих і адміністративних блоків:

  • Блоки, які запускають на виконання дані тих чи інших форматів (Vertex, Geometry і Pixel Thread Issue) - своєрідні привратники, що готують дані для чіслодробілкі в шейдерних процесорах відповідно до формату даних, поточним шейдером і його станом, умовами розгалужень і т.д.
  • Setup / Raster / ZCull - блок, що перетворює вершини в пікселі - тут виконується установка, растеризация трикутника на блоки по 32 пікселя, попередній блоковий HSR.
  • Input Assembler - блок, що вибирає геометричні та інші вихідні дані з пам'яті системи або локальної пам'яті, складає з потоків вихідні структури даних, які підуть ззовні на вхід нашої «каруселі». А на виході, після багатьох кіл під керуванням вершинного, геометричного, пиксельного шейдера і налаштувань блендінга, ми отримаємо готові (і згладжені, якщо потрібно) пікселі з ROP блоків.

До речі, невеликий відступ: добре видно, що в майбутньому ці блоки набудуть більш загальний характер і не будуть так зав'язані на конкретні види шейдерів. Тобто перетворяться просто в універсальні блоки, які здійснюють запуск даних на обчислення і конверсію форматів - наприклад, від одного шейдера до іншого, від вершинного до піксельному і т.д. Ніяких принципових змін в архітектуру це вже не внесе, діаграма буде виглядати і працювати практично також, за винятком меншого числа спеціальних «сірих» блоків. Вже зараз все три блоку Thread Issue є, швидше за все (реально) одним блоком із загальною функціональністю і контекстними доповненнями:

Шейдерний процесор і його TMU / ALU

Отже, в кожному з 8 шейдерних блоків в наявності 16 скалярних ALU. Що, знову таки дає нам потенційну можливість збільшити ККД їх навантаження аж до 100%, незалежно від коду шейдера. ALU працюють на подвоєною частоті і таким чином відповідають або перевершують (в залежності від операцій в шейдера) 8 четирехкомпонентних векторних ALU старого зразка (G70) на рівній базовій частоті ядра. NVIDIA наводить такий розрахунок пікової продуктивності:

Однак він дійсний для самого невигідного для інших варіанти, коли мають місце два множення. У реальному житті варто поділити цю перевагу в півтора рази або близько того. Але, в будь-якому випадку, ці скалярні ALU за рахунок більш високої тактової частоти і їх числа обженуть всі раніше існуючі чіпи. За винятком, може бути, SLI конфігурації G71, в разі не найвигідніших для нової архітектури шейдеров.

Цікаво, що точність всіх ALU становить FP32 і, з урахуванням нової архітектури, ми не передбачаємо ніякого переваги для FP16 шейдеров зі зниженою точністю. Ще один цікавий момент - підтримка обчислень в целочисленном форматі. Цей пункт необхідний для реалізації SM4. При реалізації арифметики дотриманий стандарт IEEE 754, що робить її придатною для серйозних неігрових обчислень - наукових, статистичних, економічних і ін.

Тепер про взаємодію текстурних блоків і ALU в рамках одного шейдерного блоку:

Операція вибірки і фільтрації текстур не вимагає ресурсів ALU і може тепер проводитися повністю паралельно математичних обчислень. Генерація ж текстурних координат (на схемі - А) Як і раніше забирає частину часу ALU. Це логічно, якщо ми хочемо використовувати транзистори чіпа на всі 100%, адже генерація текстурних координат вимагає стандартних плаваючих операцій і заводити для неї окремі ALU було б непередбачливо.

Самі по собі текстурні модулі мають наступну конфігурацію:

В наявності 4 модуля для адресації текстур TA (визначення за координатами точної адреси для вибірки) і вдвічі більше модулів для білінійної фільтрації TF. Чому так? Це дозволяє при помірному витрачання транзисторів забезпечити безкоштовну чесну трилинейную фільтрацію або вдвічі знизити падіння швидкості при анізотропної фільтрації. Швидкість на звичайних дозволах, в звичайній фільтрації і без АА давно не має сенсу - і попереднє покоління прискорювачів прекрасно справляється в таких умовах. Новим чіпом підтримуються і FP16 / FP32 формати текстур, а також SRGB гамма корекція на вході (TMU) і виході (ROP).

Наведемо специфікації шейдерной моделі нових процесорів, що відповідає вимогам SM4:

У наявності значні кількісні і якісні зміни - все менше і менше обмежень для шейдеров, все більше і більше спільного з CPU. Поки що без особливого довільного доступу (така операція з'явилася в SM4, - пункт Load Op на діаграмі, але її ефективність для загальних цілей поки сумнівна, особливо в перших реалізаціях), але немає сумнівів, що незабаром і цей аспект буде розвинений, як була розвинена за ці 5 років підтримка FP форматів - від перших проб в NV30 до тотального, наскрізного FP32 конвеєра у всіх режимах зараз - в G80.

Як ми пам'ятаємо, крім 8 шейдерних блоків, в наявності 6 блоків ROP:

На діаграмі показані два окремих шляхи для Z і C однак реально це просто один набір ALU, які діляться на дві групи при обробці пікселів з кольором, або діють як одна група при обробці в режимі Z-Only, збільшуючи таким чином пропускну здатність удвічі. В наш час немає сенсу вважати окремі пікселі - їх і так достатньо, важливіше порахувати скільки MSAA семплів може бути оброблено за такт. Відповідно, при MSAA 16х чіп може видавати 6 повноцінних пікселів за такт, при 8х - 12 і т.д. Цікаво, що масштабованість роботи з буфером кадрів на висоті - як ми пам'ятаємо, кожен блок ROP працює з власним контролером пам'яті і не заважає сусіднім.

І нарешті є повноцінна підтримка FP32 і FP16 форматів буфера кадрів разом з антиалиасинг, тепер немає ніяких обмежень для фантазії розробників, і HDR протягом усього конвеєра не вимагає зміни загальної послідовності побудови кадру навіть в AA режимі.

CSAA

З'явився і новий метод згладжування - CSAA. Скоро на сайті буде його докладне дослідження, а поки відзначимо, що цей метод багато в чому схожий на підхід ATI і також має справу з псевдостохастіческімі паттернами і поширенням відліків на сусідні геометричні зони (відбувається розмазування пікселя, пікселі не мають різкого розмежування, а як би переходять один в інший з т.з. AA, покриваючи якусь зону). Причому кольору відліків і глибина зберігаються окремо від інформації про їх місцезнаходження і таким чином на один піксель може припадати 16 відліків але, наприклад, всього 8 обчислених значень глибини - що додатково заощаджує пропускну здатність і такти.

Відомо, що класичний MSAA в режимах, більших ніж 4х, стає дуже вимогливий з точки зору пам'яті, в той час як якість зростає все менше і менше. Новий метод коригує це, дозволяючи отримувати 16х режим згладжування, помітно більш якісний ніж MSAA 16х, з обчислювальними витратами, порівнянними з 4х MSAA.

NVIO

Ще одне нововведення в G80 - винесені за межу основного чіпа прискорювача інтерфейси. За них тепер відповідає окремий чіп під назвою NVIO:

У цьому чіпі інтегровані:

  • 2 * 400 МГц RAMDAC
  • 2 * Dual Link DVI (або LVDS)
  • HDTV-Out

Підсистема виведення виглядає так:

Точність при цьому завжди становить 10 біт на компоненту. Зрозуміло, в середньому сегменті і тим більше в бюджетних рішеннях окремий зовнішній чіп може не зберегтися, але для дорогих карт в такому рішенні більше плюсів, ніж мінусів. Інтерфейси займають значну площу чіпа, сильно залежать від перешкод, вимагають особливого харчування. Усунувши всі ці проблеми за допомогою зовнішнього чіпа, можна виграти в якості вихідних сигналів і гнучкості конфігурації, а також не ускладнювати розробку і так складного чіпа урахуванням оптимальних режимів для вбудованих RAMDAC.

Подробиці: G84 / G86, сімейства GeForce 8600 і 8500

специфікації G84

  • Офіційна назва чіпа GeForce 8600
  • Кодове ім'я G84
  • Технологія 80 нм
  • 289 мільйонів транзисторів
  • Частота ядра до 675 МГц (GeForce 8600 GTS)
  • ALU працюють на більш ніж подвоєною частотою (1.45 ГГц для GeForce 8600 GTS)
  • 16 текстурних блоків, підтримка FP16 і FP32 компонент в структурах
  • 16 блоків білінійної фільтрації (в порівнянні з G80 немає можливості безкоштовної трилинейной фільтрації і більш ефективної за швидкістю анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних і вершинних шейдерах
  • Запис результатів до 8 буферів кадру одночасно (MRT)

Специфікації референсной карти GeForce 8600 GTS

  • Частота ядра 675 МГц
  • Частота універсальних процесорів 1450 МГц
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 256 мегабайт
  • Пропускна здатність пам'яті 32.0 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 5.4 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур 10.8 гігатекселя в сек.
  • Енергоспоживання до 71 Вт
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $ 199-229

Специфікації референсной карти GeForce 8600 GT

  • Частота ядра 540 МГц
  • Частота універсальних процесорів 1180 МГц
  • Кількість універсальних процесорів 32
  • Кількість текстурних блоків 16 (див. Синтетику), блоків блендінга 8
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 256 мегабайт
  • Пропускна здатність пам'яті 22.4 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 4.3 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур 8.6 гігатекселя в сек.
  • Енергоспоживання до 43 Вт
  • SLI роз'єм
  • Шина PCI-Express 16х
  • Рекомендована ціна $ 149-159

специфікації G86

  • Офіційна назва чіпа GeForce 8500
  • Кодове ім'я G86
  • Технологія 80 нм
  • 210 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин і пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, в тому числі і нової шейдерной моделі Shader Model 4.0, генерації геометрії і запису проміжних даних з шейдерів (stream output)
  • 128-біт шина пам'яті, два незалежних контролера шириною 64 біта
  • Частота ядра до 450 МГц (GeForce 8500 GT)
  • ALU працюють на подвоєною частоті (900 МГц для GeForce 8500 GT)
  • 16 скалярних ALU з плаваючою точкою (цілочисельні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD + MUL без втрати тактів)
  • 8 текстурних блоків, підтримка FP16 і FP32 компонент в структурах
  • 8 блоків білінійної фільтрації (в порівнянні з G80, немає можливості безкоштовної трилинейной фільтрації і більш ефективної за швидкістю анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних і вершинних шейдерах
  • 2 широких блоки ROP (8 пікселів) з підтримкою режимів антиалиасинга до 16 семплів на піксель, в тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігуруються ALU і відповідає за генерацію і порівняння Z, MSAA, Блендінг. Пікова продуктивність всієї підсистеми до 32 MSAA відліків (+ 32 Z) за такт, в режимі без кольору (Z only) 64 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, HDTV) інтегровані на чіп (на відміну від винесених на зовнішній додатковий чіп NVIO у GeForce 8800)

Специфікації референсной карти GeForce 8500 GT

  • Частота ядра 450 МГц
  • Частота універсальних процесорів 900 МГц
  • Ефективна частота пам'яті 800 МГц (2 * 400 МГц)
  • Тип пам'яті DDR2
  • Обсяг пам'яті 256/512 мегабайт
  • Пропускна здатність пам'яті 12.8 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 3.6 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур 3.6 гігатекселя в сек.
  • Енергоспоживання до 40 Вт
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600)
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, опциональная підтримка HDCP
  • Рекомендована ціна $ 89-129

Архітектура G84 і G86

Уже за специфікаціями видно, що G84 це щось середнє між однієї четвертої і однієї третьої частин флагмана лінійки G80. З точки зору кількості універсальних процесорів виходить чверть, а з точки зору кількості блоків ROP і контролера пам'яті третину. З текстурнікамі складніше, це начебто не чверть, але і не половина, про це ми поговоримо нижче. G86, в свою чергу, взагалі щось цікаве по обчислювальній потужності всього лише 1/8 від G80, а по ROP все та ж 1/3. Явно NVIDIA не поспішає спускати в low-end чіпи, швидкі обчислювально.

Основне питання тут а чи достатньо буде цієї самої четвертинки і 1/8 для того, щоб скласти гідну конкуренцію нинішнім рішенням і майбутнім чіпам AMD? Чи не занадто сильно урізали в NVIDIA кількість блоків? Причому, не сказати, щоб за кількістю транзисторів обидва чіпа були занадто маленькі ... У G84 майже половина транзисторів G80, в G86 майже третину. Схоже, що рішення компромісне, якби вони залишали половину блоків G80, то чіп був би занадто дорогим у виробництві, так і становив би успішну конкуренцію своїм же GeForce 8800 GTS.

У найближчому майбутньому, швидше за все, на основі технології 65 нм можна буде зробити більш продуктивні чіпи для середнього і нижнього цінових діапазонів, а зараз поки що вийшло так. Ми розглянемо питання продуктивності нових чіпів в синтетичних і ігрових тестах, але вже зараз можна сказати, що G84 і G86 можуть бути не дуже швидкими через малу кількість ALU, вони, швидше за все, будуть приблизно нарівні з поточними рішеннями схожою з ними ціни.

На архітектурі G84 і G86 ми не будемо зупинятися надто докладно, змін в порівнянні з G80 тут трохи, в силі залишається все сказане в огляді GeForce 8800, з поправкою на кількісні характеристики. Але все ж опишемо основні моменти, які стоять нашої уваги і наведемо кілька слайдів, присвячених архітектурним специфікаціям нових чіпів.

G80 складається з восьми універсальних обчислювальних блоків (шейдерних процесорів), NVIDIA воліє говорити про 128 процесорах. Одиниця виконання команд, судячи з усього, це такий процесорний блок цілком, в якому згруповані 4 TMU і 16 ALU. Кожен з блоків в один момент може виконувати частину вершинного, пиксельного або геометричного шейдера над блоком з 32 пікселів, вершин чи інших примітивів, також може займатися фізичними розрахунками. У кожного процесора є свій кеш першого рівня, в якому зберігаються текстури та інші дані. Крім керуючого блоку і обчислювальних шейдерних процесорів присутні шість блоків ROP, які виконують визначення видимості, запис в буфер кадру і MSAA, згруповані c контролерами пам'яті, чергами записи і кешем другого рівня.

Ця архітектура здатна масштабироваться в обидві сторони, що і було зроблено в нових рішеннях. Ми вже згадували про це красивому вирішенні, що реалізує основний плюс уніфікованої архітектури автоматичний баланс і високий ККД використання наявних ресурсів в статті по GeForce 8800. Там же передбачалося, що рішення середнього рівня буде складатися з половини обчислювальних блоків, а рішення на основі двох шейдерних процесорів і одного ROP стане бюджетним. На жаль, якщо в GeForce 8800 було вісім процесорів, що складають 32 TMU і 128 ALU, в нових чіпах їх кількість урізали сильніше, ніж ми припускали спочатку. Судячи з усього, схема G84 виглядає так:

Тобто, все залишилося незмінним, крім кількості блоків і контролерів пам'яті. Є невеликі зміни, пов'язані з текстурними блоками і помітні на цьому малюнку, але про це ми поговоримо далі. Цікаво, куди пішло стільки транзисторів, якщо всього лише 32 процесора в G84 залишили? У G84 мало не половина транзисторів, в порівнянні з G80, при значно зниженому числі каналів пам'яті, ROP і шейдерних процесорів. Та й у G86 транзисторів дуже багато, при всього лише 16-ти процесорах ...

Цікаво також, наскільки якісно в реальних додатках буде збалансовуватися навантаження між виконанням вершинних, піксельних і геометричних шейдерів, адже число універсальних виконавчих блоків стало тепер значно менше. Тим більше, що сама по собі уніфікована архітектура ставить нові завдання перед розробниками, при її використанні доведеться думати про те, як ефективно використовувати загальну потужність між верховими, пиксельними і геометричними шейдерами. Наведемо простий приклад упор в піксельні розрахунки. У цьому випадку збільшення навантаження на вершинні блоки в традиційній архітектурі не приведе до падіння продуктивності, а в уніфікованої викличе зміна балансу і зменшення кількості ресурсів для піксельних розрахунків. Ми обов'язково розглянемо питання продуктивності, а зараз продовжимо дослідження змін в архітектурі G84 і G86.

Шейдерний процесор і TMU / ALU

Схема шейдерних блоків і оцінка їх пікової обчислювальної продуктивності G80 наводилася у відповідній статті, для G84 і G86 схема не змінилася, а їх продуктивність перерахувати нескладно. ALU в чіпах також працюють на подвоєною частоті і вони скалярні, що дозволяє домогтися високого ККД. Ніяких відмінностей немає і по функціональності, точність всіх ALU становить FP32, є підтримка обчислень в целочисленном форматі, а при реалізації дотриманий стандарт IEEE 754, важливий для наукових, статистичних, економічних та інших обчислень.

А ось текстурні модулі в порівнянні з застосованими в G80 змінилися, NVIDIA запевняє, що в нових чіпах були зроблені архітектурні зміни для збільшення продуктивності уніфікованих процесорів. У G80 кожен текстурнік міг обчислювати чотири текстурних адреси і виконувати вісім операцій текстурной фільтрації за такт. Стверджується, що в нових чіпах перше число було збільшено вдвічі, і він здатний на більше в два рази кількість текстурних вибірок. Тобто, текстурні модулі G84 і G86 мають наступну конфігурацію (для порівняння зліва приведена схема блоку G80):

За словами NVIDIA, тепер кожен з блоків має вісім модулів адресації текстур (визначення за координатами точної адреси для вибірки) TA і рівно така ж кількість модулів білінійної фільтрації (TF). У G80 було чотири модуля TA і вісім TF, що дозволяло при зниженому витраті транзисторів забезпечити «безкоштовну» трилинейную фільтрацію або вдвічі знизити падіння швидкості при анізотропної фільтрації, що корисно саме для прискорювачів верхнього рівня, де анізотропна фільтрації використовується користувачами майже завжди. Ми перевіримо всі дані вказані вірно в практичній частині, обов'язково подивіться аналіз відповідних синтетичних тестів, так як вони суперечать цим даним.

Вся інша функціональність текстурних блоків однакова, підтримуються формати текстур FP16 / FP32 і ін. Тільки якщо на G80 фільтрація FP16 текстур також була на повній швидкості через подвоєного кількості блоків фільтрації, в рішеннях середнього і нижнього рівнів такого вже немає (знову ж, при умови, якщо вищевказані зміни дійсно є).

Блоки ROP, запис в буфер кадру, згладжування

Блоки ROP, яких в G80 було шість штук, а в нових чіпах стало по два, не змінилися:

Кожен з блоків обробляє по чотири пікселя (16 субпікселів), всього виходить 8 пікселів за такт для кольору і Z. У режимі тільки Z обробляється в два рази більшу кількість семплів за один такт. При MSAA 16х чіп може видавати два пікселя за такт, при 4х 8 і т.д. Як і в G80, є повноцінна підтримка FP32 і FP16 форматів буфера кадрів спільно з антиалиасинг.

Підтримується відомий по GeForce 8800 новий метод згладжування Coverage Sampled Antialiasing (CSAA), який був докладно описаний у відповідному матеріалі:

Якщо коротко, суть методу така, що кольори відліків і глибина зберігаються окремо від інформації про їх місцезнаходження, на один піксель може припадати по 16 відліків і всього 8 обчислених значень глибини, що економить пропускну здатність і такти. CSAA дозволяє обійтися передачею і зберіганням одного значення кольору або Z на кожен піксель, уточнюючи усереднене значення екранного пікселя за рахунок більш докладної інформації про те, як цей піксель перекриває краю трикутників. У підсумку, новий метод дозволяє отримувати режим згладжування 16х, помітно більш якісний ніж MSAA 4х, з обчислювальними витратами, порівнянними з ним. А в окремих випадках, в яких метод CSAA не працює, виходить звичайний MSAA меншій мірі, а не повна відсутність антиалиасинга.

PureVideo HD

Переходимо до найбільш цікавим змін. Виявляється, в G84 і G86 є нововведення, що вигідно відрізняють їх навіть від G80! Це стосується вбудованого відеопроцесора, який в нових чіпах отримав розширену підтримку PureVideo HD. Заявлено, що ці чіпи повністю розвантажують центральний процесор системи при декодуванні всіх типів поширених відеоданих, в тому числі найбільш «важкого» формату H.264.

У G84 і G86 використовується нова модель програмованого PureVideo HD видеопроцессора, більш потужна, в порівнянні з застосованої в G80, і включає так званий BSP движок. Новий процесор підтримує декодування H.264, VC-1 і MPEG-2 форматів з дозволом до 1920x1080 і бітрейтом до 30-40 Мбіт / с, він виконує всю роботу по декодуванню CABAC і CAVLC даних апаратно, що дозволяє відтворювати всі існуючі HD-DVD і Blu-ray диски навіть на середніх по потужності одноядерних ПК.

Відеопроцесор в G84 / G86 складається з декількох частин: сам Video Processor другого покоління (VP2), що виконує завдання IDCT, компенсації руху і видалення артефактів блочности для MPEG2, VC-1 і H.264 форматів, що підтримує апаратне декодування другого потоку; потоковий процесор (BSP), що виконує завдання статистичного декодування CABAC і CAVLC для формату H.264, а це одні з найбільш трудомістких розрахунків; движок декодування захищених даних AES128, призначення якого зрозуміло з його назви він займається розшифровкою відеоданих, використовуваних в захисті від копіювання на Blu-ray і HD-DVD дисках. Ось так виглядають відмінності в ступені апаратної підтримки декодування відео на різних відеочіпах:

Блакитним кольором виділені завдання, що виконуються відеочіпом, а зеленим центральним процесором. Як бачите, якщо попереднє покоління допомагало процесору тільки в частині завдань, то новий відеопроцесор, застосовуваний в останніх чіпах, робить все завдання сам. Ефективність рішень ми перевіримо в майбутніх матеріалах по дослідженню ефективності апаратного декодування відео, NVIDIA ж призводить в матеріалах такі цифри: при використанні сучасного двоядерного процесора і програмного декодування даних, із диском Blu-ray і HD-DVD з'їдає до 90-100% процесорного часу, при апаратному декодуванні на відеочіпі минулого покоління на тій же системі до 60-70%, а з новим двигуном, який вони розробили для G84 і G86 всього лише 20%. Це, звичайно, не схоже на заявлене повністю апаратне декодування, але все ж на дуже і дуже ефективне.

На момент анонса, нові можливості, що з'явилися в PureVideo HD, працюють лише в 32-бітової версії Windows Vista, а підтримка PureVideo HD в Windows XP з'явиться тільки влітку. Що стосується якості відтворення відео, постобработки, дєїнтерлейсинга і т.п., то з цим у NVIDIA справи поліпшилися ще в GeForce 8800, а нові чіпи нічим особливо не відрізняються в цьому плані.

CUDA, неігрові та фізичні розрахунки

У статті за GeForce 8800 згадувалося, що збільшилася пікова продуктивність плаваючою арифметики у нових прискорювачів і гнучкість уніфікованої шейдерной архітектури, стали достатні для розрахунку фізики в ігрових додатках і навіть більш серйозних завдань: математичного та фізичного моделювання, економічних і статистичних моделей і розрахунків, розпізнавання образів , обробки зображень, наукової графіки і багато чого іншого. Для цього був випущений спеціальний API, орієнтований на обчислення, який зручний для адаптації і розробки програм, перекладають обчислення на GPU CUDA (Compute Unified Device Architecture).

Детальніше про CUDA написано в статті про G80, ми зупинимося на ще одному модному напрямку останнім часом підтримки фізичних розрахунків на GPU. NVIDIA називає подібну свою технологію Quantum Effects. Декларується, що все відеочіпи нового покоління, включаючи розглянуті сьогодні G84 і G86, непогано підходять для розрахунків подібного роду, дозволяючи перенести частину навантаження з CPU на GPU. В якості конкретних прикладів наводяться симуляції диму, вогню, вибухів, динаміки волосся і одягу, вовни і рідин, і багато чого іншого. Але поки що більше хочеться написати про інше. Про те, що поки нам показують тільки картинки з тестових додатків з великою кількістю розраховуються відеочіпами фізичних об'єктів, а іграми з такою підтримкою навіть поки і не пахне.

Підтримка зовнішніх інтерфейсів

Як ми пам'ятаємо, в GeForce 8800 нас трохи здивувало ще одне несподіване нововведення додатковий чіп, який підтримує винесені за межі основного зовнішні інтерфейси. У разі топових відеокарт цими завданнями займається окремий чіп під назвою NVIO, в якому інтегровані: два 400 МГц RAMDAC, два Dual Link DVI (або LVDS), HDTV-Out. Вже тоді ми припускали, що в середньому і нижньому сегментах окремий зовнішній чіп навряд чи збережеться, так і вийшло насправді. У G84 і G86 підтримка всіх зазначених інтерфейсів вбудована в сам чіп.

На GeForce 8600 GTS встановлюються два Dual Link DVI-I виходу з підтримкою HDCP, це перша відеокарта на ринку з подібними можливостями (HDCP і Dual Link спільно). Що стосується HDMI, підтримка цього роз'єму апаратно реалізована повністю і може бути виконана виробниками на картах спеціального дизайну. А ось у GeForce 8600 GT і 8500 GT підтримка HDCP і HDMI опциональная, але вони цілком можуть бути реалізовані окремими виробниками в своїй продукції.

Подробиці: G92, сімейство GeForce 8800

специфікації G92

  • Кодове ім'я чіпа G92
  • Технологія 65 нм
  • 754 мільйони транзисторів (більше, ніж у G80)
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин і пікселів, а також інших видів даних
  • Частота ядра 600 МГц (GeForce 8800 GT)
  • ALU працюють на більш ніж подвоєною частотою (1.5 ГГц для GeForce 8800 GT)
  • 112 (це у для GeForce 8800 GT, а всього, ймовірно, 128) скалярних ALU з плаваючою точкою (цілочисельні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD + MUL без втрати тактів)
  • 56 (64) блоків текстурної адресації з підтримкою FP16 і FP32 компонент в структурах (пояснення див. Нижче)
  • 56 (64) блоків білінійної фільтрації (як і в G84 і G86, немає безкоштовної трилинейной фільтрації і більш ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних і вершинних шейдерах
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, HDTV) інтегровані на чіп (на відміну від винесених на зовнішній додатковий чіп NVIO у GeForce 8800)

Специфікації референсной карти GeForce 8800 GT 512MB

  • Частота ядра 600 МГц
  • Ефективна частота пам'яті 1.8 ГГц (2 * 900 МГц)
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 512 мегабайт
  • Енергоспоживання до 110 Вт
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $ 249

Специфікації референсной карти GeForce 8800 GT 256MB

  • Частота ядра 600 МГц
  • Частота універсальних процесорів 1500 МГц
  • Кількість універсальних процесорів 112
  • Кількість текстурних блоків 56, блоків блендінга 16
  • Ефективна частота пам'яті 1.4 ГГц (2 * 700 МГц)
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 256 мегабайт
  • Пропускна здатність пам'яті 44.8 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 9.6 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур до 33.6 гігатекселя в сек.
  • Енергоспоживання до 110 Вт
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $ 199

Специфікації референсной карти GeForce 8800 GTS 512MB

  • Частота ядра 650 МГц
  • Кількість універсальних процесорів 128
  • Ефективна частота пам'яті 2.0 ГГц (2 * 1000 МГц)
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 512 мегабайт
  • Пропускна здатність пам'яті 64.0 гігабайти в сек.
  • Теоретична швидкість вибірки текстур до 41.6 гігатекселя в сек.
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $ 349-399

Архітектура чіпа G92

Архітектурно G92 від G80 відрізняється не сильно. По тому, що нам відомо, можна сказати, що G92 це флагман лінійки (G80), перекладений на новий техпроцес, з невеликими змінами. NVIDIA вказує в своїх матеріалах, що чіп має 7 великих шейдерних блоків і, відповідно, 56 текстурних блоків, а також по чотири широких ROP, число транзисторів в чіпі викликає підозри про те, що вони щось не договорюють. В анонсованих спочатку рішеннях задіяні не всі блоки, існуючі в чіпі фізично, їх кількість в G92 більше, ніж активних в GeForce 8800 GT. Хоча збільшена складність чіпа пояснюється включенням до його складу раніше окремого чіпа NVIO, а також видеопроцессора нового покоління. Крім того, на кількість транзисторів вплинули і ускладнені блоки TMU. Також, цілком ймовірно, були збільшені кеші для збільшення ефективності використання 256-бітної шини пам'яті.

Цього разу, щоб скласти гідну конкуренцію відповідним чіпам AMD, в NVIDIA вирішили залишити в mid-end чипі досить велика кількість блоків. Підтвердилося наше припущення з огляду G84 і G86, що на основі технології 65 нм випустять набагато більш продуктивні чіпи для середнього цінового діапазону. Архітектурних змін в чіпі G92 трохи, і ми не будемо на цьому зупинятися детально. Все сказане вище про рішення з серії GeForce 8 залишається в силі, ми повторимо тільки деякі основні моменти, присвячених архітектурним специфікаціям нового чіпа.

Для нового рішення NVIDIA в своїх документах наводить таку схему:

Тобто з усіх змін тільки зменшена кількість блоків і деякі зміни в TMU, про яких написано далі. Як вище зазначено, є сумніви в тому, що фізично це так і є, але даємо опис, виходячи з того, що пише NVIDIA. G92 складається з семи універсальних обчислювальних блоків (шейдерних процесорів), NVIDIA традиційно говорить про 112 процесорах (по крайней мере, в перших рішеннях GeForce 8800 GT). Кожен з блоків, в якому згруповані 8 TMU і 16 ALU, може виконувати частину вершинного, пиксельного або геометричного шейдера над блоком з 32 пікселів, вершин чи інших примітивів, може займатися і іншими (неграфічні) розрахунками. У кожного процесора є свій кеш першого рівня, в якому зберігаються текстури та інші дані. Крім керуючого блоку і обчислювальних шейдерних процесорів присутній чотири блоки ROP, які виконують визначення видимості, запис в буфер кадру і MSAA, згруповані c контролерами пам'яті, чергами записи і кешем другого рівня.

Універсальні процесори і TMU

Схема шейдерних блоків і оцінка їх пікової обчислювальної продуктивності G80 наводилася у відповідній статті, для G92 вона не змінилася, їх продуктивність перерахувати нескладно, виходячи із змін в тактовій частоті. ALU в чіпах працюють на більш ніж подвоєною частотою, вони скалярні, що дозволяє домогтися високого ККД. Про функціональні відмінності поки що невідомо, чи доступна точність розрахунків FP64 в цьому чіпі чи ні. Точно є підтримка обчислень в целочисленном форматі, а при реалізації всіх обчислень дотриманий стандарт IEEE 754, важливий для наукових, статистичних, економічних та інших розрахунків.

Текстерно модулі в G92 не такі, як в G80, вони повторюють рішення TMU в G84 і G86, в яких були зроблені архітектурні зміни для збільшення продуктивності. Нагадаємо, що в G80 кожен текстурнік міг обчислювати по чотири текстурних адреси і виконувати по вісім операцій текстурной фільтрації за такт, а в G84 / G86 TMU здатні на більше в два рази кількість текстурних вибірок. Тобто, кожен з блоків має вісім модулів адресації текстур (визначення за координатами точної адреси для вибірки) TA і рівно така ж кількість модулів білінійної фільтрації (TF):

Не варто думати, що 56 блоків GeForce 8800 GT в реальних застосуваннях будуть сильніше 32 блоків в GeForce 8800 GTX. При включеній трилинейной і / або анізотропної фільтрації останні будуть швидше, так як вони зможуть виконає трохи більше роботи по фільтрації текстур вибірок. Ми перевіримо цю інформацію в практичній частині, зробивши аналіз результатів відповідних синтетичних тестів. Вся інша функціональність текстурних блоків не змінилася, підтримуються формати текстур FP16, FP32 і інші.

Блоки ROP, запис в буфер кадру, згладжування

Блоки ROP самі по собі також не змінилися, але їх кількість стало іншим. У G80 було шість ROP, а в новому рішенні їх стало чотири, для зниження собівартості виробництва чіпів і PCB відеокарт. Також це урізання може бути пов'язано з тим, щоб не створювати занадто сильну конкуренцію існуючим рішенням верхнього рівня.

Кожен з блоків обробляє по чотири пікселя або 16 субпікселів, і всього виходить 16 пікселів за такт для кольору і Z. У режимі тільки Z обробляється в два рази більшу кількість семплів за один такт. При MSAA 16х чіп може видавати два пікселя за такт, при 4х 8 і т.д. Як і в G80, повноцінно підтримуються формати буфера кадрів FP32 і FP16 спільно з антиалиасинг.

Підтримується відомий за попередніми чіпам серії новий метод згладжування Coverage Sampled Antialiasing (CSAA). А ще одним нововведенням стало те, що в GeForce 8800 GT був оновлений алгоритм антиалиасинга напівпрозорих поверхонь (transparency antialiasing). На вибір користувача пропонувалися два варіанти: мультісемплінг (TRMS) і суперсемплінг (TRSS), перший відрізнявся дуже гарною продуктивністю, але ефективно працював далеко не у всіх іграх, а другий був якісним, але повільним. В GeForce 8800 GT декларується новий метод мультісемплінг напівпрозорих поверхонь, що поліпшує його якість і продуктивність. Цей алгоритм дає майже таку ж поліпшення якості, як і суперсемплінг, але відрізняється високою продуктивністю лише на кілька відсотків гірше для режиму без включеного антиалиасинга напівпрозорих поверхонь.

PureVideo HD

Одним з очікуваних змін в G92 став вбудований відеопроцесор другого покоління, відомий по G84 і G86, який отримав розширену підтримку PureVideo HD. Уже відомо, що цей варіант відеопроцесора майже повністю розвантажує CPU під час декодування всіх типів відеоданих, в тому числі «важких» форматів H.264 і VC-1.

Як і в G84 / G86, в G92 використовується нова модель програмованого PureVideo HD видеопроцессора, що включає так званий BSP движок. Новий процесор підтримує декодування H.264, VC-1 і MPEG-2 форматів з дозволом до 1920x1080 і бітрейтом до 30-40 Мбіт / с, виконуючи роботу по декодуванню CABAC і CAVLC даних апаратно, що дозволяє відтворювати всі існуючі HD-DVD і Blu -ray диски навіть на середніх по потужності одноядерних ПК. Декодування VC-1 не таке ефективне, як H.264, але воно все ж підтримується новим процесором.

Детальніше про відеопроцесорі другого покоління можна прочитати в частині, присвяченій чіпам G84 і G86. Робота сучасних відеорішень була частково перевірена в останньому матеріалі з дослідження ефективності апаратного декодування відео даних.

PCI Express 2.0

З справжніх нововведень в G92 можна виділити підтримку шини PCI Express 2.0. Друга версія PCI Express збільшує стандартну пропускну здатність в два рази, з 2.5 Гбіт / с до 5 Гбіт / с, в результаті, по роз'єму x16 можна передавати дані на швидкості до 8 ГБ / с в кожному напрямі, на відміну від 4 ГБ / с для версії 1.x. При цьому дуже важливо, що PCI Express 2.0 сумісний з PCI Express 1.1, і старі відеокарти будуть працювати в нових системних платах, і нові відеокарти з підтримкою другої версії залишаться працездатними в платах без його підтримки. За умови достатності зовнішнього живлення і без збільшення пропускної здатності інтерфейсу, природно.

Для забезпечення зворотної сумісності з існуючими PCI Express 1.0 і 1.1 рішеннями, специфікація 2.0 підтримує як 2.5 Гбіт / с, так і 5 Гбіт / с швидкості передачі. Зворотна сумісність PCI Express 2.0 дозволяє використовувати минулі рішення з 2.5 Гбіт / с в 5.0 Гбіт / с слотах, які будуть працювати на меншій швидкості, а пристрій, розроблене по специфікаціям версії 2.0, може підтримувати і 2.5 Гбіт / с і 5 Гбіт / с швидкості . В теорії з сумісністю все добре, а ось на практиці з деякими поєднаннями системних плат і карт розширення можливе виникнення проблем.

Підтримка зовнішніх інтерфейсів

Як і слід було очікувати, наявний на платах GeForce 8800 додатковий чіп NVIO, що підтримує винесені за межі основного зовнішні інтерфейси (два 400 МГц RAMDAC, два Dual Link DVI (або LVDS), HDTV-Out), в даному випадку був включений до складу самого чіпа , підтримка всіх зазначених інтерфейсів вбудована в сам G92.

На відкритих GeForce 8800 GT зазвичай встановлюють два Dual Link DVI-I виходу з підтримкою HDCP. Що стосується HDMI, підтримка цього роз'єму реалізована повністю, вона може бути виконана виробниками на картах спеціального дизайну, які можуть бути випущені кілька пізніше. Хоча наявність роз'єму HDMI на відеокарті зовсім необов'язково, його з успіхом замінить перехідник з DVI на HDMI, який додається в комплекті більшості сучасних відеокарт.

На відміну від відеокарт серії RADEON HD 2000 компаній AMD, GeForce 8800 GT не містить вбудований аудіочіп, необхідний для підтримки передачі звуку по DVI за допомогою перехідника на HDMI. Подібна можливість передачі зображення та звуку по одному роз'єму затребувана, перш за все, на картах середнього і нижчого рівнів, які встановлюються в маленькі корпуси медиацентров, а GeForce 8800 GT навряд чи підходить на цю роль.

Подробиці: G94, сімейство GeForce 9600

специфікації G94

  • Кодове ім'я чіпа G94
  • Технологія 65 нм
  • 505 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин і пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, в тому числі шейдерной моделі Shader Model 4.0, генерації геометрії і запису проміжних даних з шейдерів (stream output)
  • 256-біт шина пам'яті, чотири незалежних контролера шириною по 64 біта
  • Частота ядра 650 МГц (GeForce 9600 GT)
  • ALU працюють на більш ніж подвоєною частотою (1.625 ГГц у GeForce 9600 GT)
  • 64 скалярних ALU з плаваючою точкою (цілочисельні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD + MUL без втрати тактів)
  • 32 блоки текстурної адресації з підтримкою FP16 і FP32 компонент в структурах
  • 32 блоки білінійної фільтрації (як і в G84 і G92, це дає збільшене кількість білінійних вибірок, але без безкоштовної трилинейной фільтрації і ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних і вершинних шейдерах
  • 4 широких блоки ROP (16 пікселів) з підтримкою режимів антиалиасинга до 16 семплів на піксель, в тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігуруються ALU і відповідає за генерацію і порівняння Z, MSAA, Блендінг. Пікова продуктивність всієї підсистеми до 64 MSAA відліків (+ 64 Z) за такт, в режимі без кольору (Z only) 128 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)

Специфікації референсной карти GeForce 9600 GT

  • Частота ядра 650 МГц
  • Частота універсальних процесорів 1625 МГц
  • Кількість універсальних процесорів 64
  • Кількість текстурних блоків 32, блоків блендінга 16
  • Ефективна частота пам'яті 1.8 ГГц (2 * 900 МГц)
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 512 мегабайт
  • Пропускна здатність пам'яті 57.6 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 10.4 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур до 20.8 гігатекселя в сек.
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • Енергоспоживання до 95 Вт
  • Рекомендована ціна $ 169-189

архітектура G94

З архітектурної точки зору G94 відрізняється від G92 тільки кількісними характеристиками, у нього менше число виконавчих блоків: ALU і TMU. Та й від G8x відмінностей не так багато. Як було написано в попередніх матеріалах, лінійка чіпів G9x є злегка модифікованої лінійкою G8x, перекладеної на новий техпроцес з невеликими архітектурними змінами. Новий mid-end чіп має 4 великих шейдерних блоку (всього 64 ALU) і 32 текстурних блоки, а також чотири широких ROP.

Отже, архітектурних змін в чіпі трохи, майже про всі написано вище, і все раніше сказане для попередніх рішень залишається в силі. А тут наведемо лише основну діаграму чіпа G94:

Текстерно блоки в G94 точно такі ж, що і в G84 / G86 і G92, вони вміють вибирати вдвічі більше білінійну відфільтрованих вибірок з текстур, в порівнянні з G80. Але 32 текстурних блоки GeForce 9600 GT в реальних програми не будуть працювати швидше, ніж 32 блоки у GeForce 8800 GTX лише через більшу робочої частоти GPU. Таке може спостерігатися тільки при вимкненому трилинейной і анізотропної фільтрації, що буває вкрай рідко, тільки в тих алгоритмах, де застосовуються невідфільтровані вибірки, наприклад, в parallax mapping.

Ще одним з переваг G9x і GeForce 9600 GT зокрема, компанія NVIDIA вважає якусь нову технологію стиснення, реалізовану в блоках ROP, яка, за їхньою оцінкою, працює на 15% ефективніше тієї, що використовувалася в попередніх чіпах. Мабуть, це якраз ті самі архітектурні модифікації в G9x, призначені для забезпечення більшої ефективності роботи 256-бітної шини пам'яті, в порівнянні з 320/384-бітної, про які ми писали раніше. Природно, в реальних додатках такої великої різниці не буде, навіть за даними самої NVIDIA приріст від нововведень в ROP найчастіше становить лише близько 5%.

Незважаючи на всі зміни в архітектурі G9x, додають складності чіпу, про які ми ще поговоримо нижче, число транзисторів в чіпі досить велике. Ймовірно, така складність GPU пояснюється включенням до його складу раніше окремого чіпа NVIO, видеопроцессора нового покоління, ускладнення блоків TMU і ROP, а також інші приховані модифікації: зміна розмірів кешей і т.п.

PureVideo HD

У G94 вбудований все той же відеопроцесор другого покоління, відомий по G84 / G86 і G92, що відрізняється поліпшеною підтримкою PureVideo HD. Він майже повністю розвантажує CPU під час декодування більшості поширених типів відеоданих, в тому числі H.264, VC-1 і MPEG-2, з роздільною здатністю до 1920x1080 і бітрейтом до 30-40 Мбіт / с, виконуючи роботу по декодуванню повністю апаратно. І хоча декодування VC-1 у рішень NVIDIA не така ефективна, як H.264, невелика частина процесу використовує потужності центрального процесора, але це все одно дозволяє відтворювати всі існуючі HD DVD і Blu-Ray диски навіть на середніх по потужності комп'ютерах. Детальніше про відеопроцесорі другого покоління можна прочитати в наших оглядах G84 / G86 і G92, посилання на які наведені на початку статті.

Ну а ми відзначимо програмні покращення PureVideo HD, які були приурочені до виходу GeForce 9600 GT. З останніх нововведень PureVideo HD можна відзначити двухпоточне декодування, динамічна зміна контрастності і колірної насиченості. Ці зміни не виняткові для GeForce 9600 GT, і в нових версіях драйверів, починаючи з ForceWare 174, вони введені для всіх чіпів, що підтримують повне апаратне прискорення за допомогою PureVideo HD. Крім розглянутої сьогодні відеокарти, в цей список входять: GeForce 8600 GT / GTS, GeForce 8800 GT і GeForce 8800 GTS 512.

Динамічне поліпшення контрастності досить часто використовується в побутовій техніці, в телевізорах і відеоплеєра, воно може поліпшити зображення з неоптимальною експозицією (поєднання витримки і діафрагми). Для цього, після декодування кожного кадру, аналізується його гістограма, і якщо у кадру невдала контрастність, гістограма перераховується і застосовується до зображення. Ось приклад (зліва - початкове зображення, праворуч - оброблене):

Приблизно те ж саме відноситься і до з'явився в PureVideo HD динамічному поліпшення колірної насиченості. Побутова техніка також дуже давно застосовує деякі поліпшують зображення алгоритми, на відміну від комп'ютерних моніторів, які відтворюють все як є, що в багатьох випадках може викликати занадто тьмяну і неживу картинку. Автоматичний баланс компонент кольору в відеоданих, що розраховується також кожен новий кадр, покращує сприйняття картинки людиною, трохи скорегувавши насиченість її квітів:

Двухпоточном декодування дозволяє прискорювати декодування і постобработку двох різних потоків відеоданих одночасно. Це може бути корисно при виведенні в таких режимах, як «картинка-в-картинці», які використовуються в деяких Blu-Ray і HD DVD дисках (наприклад, друге зображення може показувати режисера фільму, що дає свої коментарі до показуваним в основному вікні сценам ), такими можливостями забезпечені видання фільмів WAR і Resident Evil: Extinction.

Ще одним корисним нововведенням останньої версії PureVideo HD стала можливість одночасної роботи оболонки Aero в операційній системі Windows Vista під час програвання апаратно прискореного відео в віконному режимі, що раніше не було можливо. Не сказати, щоб це дуже сильно хвилювало користувачів, але можливість приємна.

Підтримка зовнішніх інтерфейсів

Підтримка зовнішніх інтерфейсів у GeForce 9600 GT аналогічна GeForce 8800 GT, за винятком з'явилася інтегрованої підтримки DisplayPort, хіба що. Наявний на платах GeForce 8800 додатковий чіп NVIO, що підтримує винесені за межі основного зовнішні інтерфейси в G94 також був включений до складу самого чіпа.

На референсних відкритих GeForce 9600 GT встановлені два Dual Link DVI виходу з підтримкою HDCP. Підтримка HDMI і DisplayPort реалізована апаратно в чіпі, і ці порти можуть бути виконані партнерами NVIDIA на картах спеціального дизайну. Причому, як запевняє NVIDIA, на відміну від G92, підтримка DisplayPort тепер вбудована в чіп і зовнішні трансмітери не потрібні. Взагалі, роз'єми HDMI і DisplayPort на відеокарті необов'язкові, їх можуть замінити прості перехідники з DVI на HDMI або DisplayPort, які іноді трапляються в комплекті з сучасними відеокартами.

Подробиці: G96, сімейства GeForce 9400 9500

специфікації G96

  • Кодове ім'я чіпа G96
  • Технологія 65 нм
  • 314 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин і пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, в тому числі шейдерной моделі Shader Model 4.0, генерації геометрії і запису проміжних даних з шейдерів (stream output)
  • 128-біт шина пам'яті, два незалежних контролера шириною по 64 біта
  • Частота ядра 550 МГц
  • ALU працюють на більш ніж подвоєною частотою (1.4 ГГц)
  • 32 скалярних ALU з плаваючою точкою (цілочисельні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD + MUL без втрати тактів)
  • 16 блоків текстурної адресації з підтримкою FP16 і FP32 компонент в структурах
  • 16 блоків білінійної фільтрації (як і для G92, це дає збільшене кількість білінійних вибірок, але без безкоштовної трилинейной фільтрації і ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних і вершинних шейдерах
  • 2 широких блоки ROP (8 пікселів) з підтримкою режимів антиалиасинга до 16 семплів на піксель, в тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігуруються ALU і відповідає за генерацію і порівняння Z, MSAA, Блендінг. Пікова продуктивність всієї підсистеми до 32 MSAA відліків (+ 32 Z) за такт, в режимі без кольору (Z only) 64 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, DisplayPort) інтегровані на чіп

Специфікації референсной карти GeForce 9500 GT

  • Частота ядра 550 МГц
  • Кількість універсальних процесорів 32
  • Кількість текстурних блоків 16, блоків блендінга 8
  • Ефективна частота пам'яті 1.6 ГГц (2 * 800 МГц)
  • Тип пам'яті GDDR2 / GDDR3
  • Обсяг пам'яті 256/512/1024 мегабайт
  • Теоретична швидкість вибірки текстур до 8.8 гігатекселей в сек.
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDMI і DisplayPort з HDCP

Специфікації референсной карти GeForce 9400 GT

  • Частота ядра 550 МГц
  • Частота універсальних процесорів 1400 МГц
  • Кількість універсальних процесорів 16
  • Кількість текстурних блоків 8, блоків блендінга 8
  • Ефективна частота пам'яті 1.6 ГГц (2 * 800 МГц)
  • Тип пам'яті GDDR2
  • Обсяг пам'яті 256/512 мегабайт
  • Пропускна здатність пам'яті 25.6 гігабайти в сек.
  • Теоретична максимальна швидкість зафарбування 4.4 гігапікселя в сек.
  • Теоретична швидкість вибірки текстур до 4.4 гігатекселей в сек.
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDMI і DisplayPort з HDCP

архітектура G96

Архітектурно G96 рівно половина чіпа G94, який, в свою чергу, відрізняється від G92 тільки кількісними характеристиками. У G96 вдвічі менше число всіх виконавчих блоків: ALU, TMU і ROP. Новий відеочіп призначений для рішень найнижчого цінового діапазону, і має два великих шейдерних блоку (всього 32 ALU) і 16 текстурних блоків, а також вісім ROP. Ще у нього урізана шина пам'яті, з 256-бітної до 128-бітної, якщо порівнювати з G94 і G92. Всі апаратні можливості залишилися незмінними, відмінності тільки в продуктивності.

Подробиці: G92b, сімейство GeForce GTS 200

Специфікації референсной відеокарти GeForce GTS 250

  • Частота ядра 738 МГц
  • Частота універсальних процесорів тисяча вісімсот тридцять шість МГц
  • Кількість універсальних процесорів 128
  • Кількість текстурних блоків 64, блоків блендінга 16
  • Ефективна частота пам'яті 2200 (2 * 1100) МГц
  • Тип пам'яті GDDR3
  • Обсяг пам'яті 512/1024/2048 мегабайт
  • Пропускна здатність пам'яті 70.4 ГБ / с
  • Теоретична максимальна швидкість зафарбування 11.8 гігапікселів в сек.
  • Теоретична швидкість вибірки текстур до 47.2 гігатекселей в сек.
  • Два DVI-I Dual Link роз'єму, підтримується висновок в дозволах до 2560х1600
  • Подвійний SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP, HDMI, DisplayPort
  • Енергоспоживання до 150 Вт (один 6-контактний роз'єм)
  • Двослотовою виконання
  • Рекомендована ціна $ 129 / $ 149 / $ 169

В общем-то, ця «нова» відеокарта на основі 55 нм чіпа G92 не відрізняється від GeForce 9800 GTX + нічим. Вихід нової моделі може бути частково виправданий установкою на неї не 512 мегабайт відеопам'яті, як у 9800 GTX +, а гігабайти, що сильно впливає на продуктивність у важких режимах з максимальними настройками якості, високими дозволами з включеним повноекранним згладжуванням. А є ще двухгігабайтние варіанти, але це вже більше маркетингове перевага, ніж реальне.

В таких умовах старші версії GeForce GTS 250 дійсно повинна бути відчутно швидше GeForce 9800 GTX + через збільшеного об'єму пам'яті. А деякі найбільш сучасні ігри отримають перевагу навіть не в самих високій роздільній здатності. Все б нічого, та тільки ж деякі виробники карт випустили GeForce 9800 GTX + з гігабайтом пам'яті ще раніше ...

Виробництво відеочипів G92b по 55 нм технологічним нормам і помітне спрощеного дизайну PCB дозволило компанії NVIDIA зробити рішення, аналогічне GeForce 9800 GTX за характеристиками, але з меншою ціною і зниженими споживанням енергії і виділенням тепла. І тепер, щоб забезпечити GeForce GTS 250 електроживленням, на платі встановлений лише один 6-контактний PCI-E роз'єм живлення. Ось і всі основні відмінності від 9800 GTX +.

Відеокарта 9800 GT від компанії NVIDIA є логічним продовженням плати 8800GT. Два технологічних продукту мають практично ідентичні параметри. Головною ж відмінністю 9800GT від попередньої моделі стала підтримка технології HybridPower. Будь-які інші доробки відсутні. Графічний процесор карти має маркування G92-270. Аналогічної володіла і модель 8800. Мікрочіп має ревізію A2, як і раніше. У відеоплати 9800 GT характеристики тактової частоти залишилися на колишньому рівні: 601/1512 МГц.

Технічні характеристики 9800 GT

З технічної точки зору плата 9800 GT не зазнала жодних серйозних змін з часів моделі 8800.

Параметри відеокарти:

  • GPU: G92.
  • Відеопам'ять: 512 Мб.
  • Шина пам'яті: 256bit.
  • Частота графічного процесора: 601/1512 МГц.
  • Блоки текстур: 56.
  • Блоки ROP: 16.
  • Ефективна частота, на якій працює пам'ять відеокарти: 1800 МГц.
  • Універсальні процесори (ядра): 112.
  • Підтримувані унікальні технології: Hybrid Power.
  • Системна шина і інші інтерфейси комунікації: PCI-E 2.0x16 / 2xDVI / S-Video. HDMI підтримується при наявності перехідника.

Які завдання дозволяє вирішувати відеокарта 9800 GT

Представлена \u200b\u200bвідеокарта добре справляється з іграми попереднього покоління. Якщо користувач не ганяється за новинками, то йому, безсумнівно, підійде 9800 GT. Характеристики карти дозволяють без проблем запускати такі ігри, як «Відьмак 2», S.T.A.L.K.E.R, Crysis 2, Dead Space 3 та інші. Fallout New Vegas, до слова, з даною платою також йде без проблем. А ось четверту версію легендарного проекту запустити вже не вийде.

Сучасні шутери і автосимулятори, випущені після 2013 року, відеокарта також не потягне. Винятки бувають, але дуже рідко. Досить комфортно користувач відчуває себе при роботі з графікою і відеоінформацією, перегляді фільмів у високій роздільній здатності. Якщо людина не є професійним фотографом або 3D-дизайнером, якому необхідна максимальна швидкість роботи, то відеокарта 9800 GT цілком йому підійде.

Плюси і мінуси відеокарти

Вже згадана плата має низку переваг, які роблять її використання все ще актуальним. Хоча і мінуси у даного рішення також є.

Які ж переваги є у 9800 GT? Характеристики моделі свідчать про те, що їх чимало.

  • Відеокарта підтримує режим SLI. Можна купити відразу 4 плати і об'єднати їх в групу, домігшись таким чином суттєвого підвищення продуктивності.
  • У платі передбачена підтримка технології PhysX. Вона служить для відтворення додаткових спецефектів в іграх. Варто відзначити, що при цьому помітно падає загальна продуктивність відеокарти. Щоб нівелювати цей ефект, виробник рекомендує використовуватися додатковий виділений прискорювач PhysX, який доповнить основну плату.
  • За допомогою спеціальних утиліт можна поліпшити штатну продуктивність Nvidia 9800 GT, піднявши її на 5-15%. Конкретний показник залежить від бажань користувача і можливостей системи охолодження карти. При розгоні потрібно ретельно відстежувати робочу температуру пристрою, щоб не допустити надмірного перегріву і, як наслідок, поломки.

недоліки:

  • є застарілим рішенням;
  • відрізняється обмеженою ефективністю в універсальних обчисленнях;
  • на плавність відтворення Blu-Ray дисків і роликів в якості HD, розміщених в інтернеті, буде в значній мірі впливати потужність центрального CPU (крім процесора відеокарти);
  • низька продуктивність 9800 GT, характеристики плати не дозволяють запускати гри, видані після 2013 року;
  • порівняно високе енергоспоживання;
  • недостатня продуктивність відеокарти при роботі з додатковими ефектами PhysX.


Сподобалася стаття? поділіться їй