GeForce 9800 quelle série. Nous définissons un produit de carte vidéo NVIDIA. Carte vidéo avantages et contre

NVIDIA GEFORCE série 9000

Nom de code	G92, G92B, G94, G94B, G96, G98
Niveau d'entrée GPU	GeForce 9300gs, GeForce 9400GT, GeForce 9500GT
GPU moyenne plage	Geforce 9600.
Top GPU.	Geforce 9800.
Version de Direct3D et Shaders	Direct3D 10. Shader Model 4.0.
Version OpenGL	OpenGL 3.3.
Version opencl	Opengl 1.1.
Prédécesseur	Geforce 8.
Successeur	Geforce 100.

NVIDIA GEFORCE 9800 GX2

GigaByte geforce 9500 gt

Spécifications techniques GeForce 9 Series

Modèle	9800					9600				9500	9400	9300
Modèle	Gx2.	Gtx +.	GTX.	Gt.	GT Green.	Gt.	GT Green.	GSO 512.	Gso.	Gt.	Gt.	Gs.
date de sortie	18.03.08	18.07.08	01.04.08	18.07.08	-	21.02.08	-	-	29.04.08	18.07.08	26.08.08	-
Processeur graphique	2 x G92.	G92B.	G92.		G92B.	G94.	G94B.	G94.	G92.	G96.		G98.
Nombre de transistors, million	2 x 754.	754				505			754	314		-
Tehprotersess, nm	65	55	65	65 / 55	55	65 / 55	55		65	55		65
Fréquence principale, MHz	600	738	675	600	550	650	600	650	550			567
Fréquence du bloc de shader, MHz	1500	1836	1688	1512	1375	1625	1500	1625	1375	1400
Nombre de processeurs de streaming	2 x 128.	128		112		64		48	96	32	16	8
Nombre de blocs de texture	2 x 64.	64		56		32		24	48	16	8
Nombre de blocs de rasterisation	2 x 16.	16							12	8		4
Performance, Gflops.	2 x 576.	705	648	504	462	312	288	234	396	134,4	67,2	33,6
Remplir la scène, milliards pixes /	2 x 9.6	11,8	10,8	9,6	8,8	10,4	9,6	7,8	6,6	4,4		2,2
Remplir la scène, milliards de tex /	2 x 38.4	47,2	43,2	33,6	30,8	20,8	19,2	15,6	26,4	8,8	4,4	4,5
Mémoire vidéo standard	Gddr3									DDR2.
Blosomie Pneus Mémoire vidéo, Bit	2 x 256.	256							192	128		64
Fréquence de la mémoire vidéo, MHz	1000	1100		900					800	500
Bande passante de la mémoire, GB /	2 x 64.0.	70,4		57,6					38,4	16,0		8,0
Volume de la mémoire vidéo, MB	2 x 512.	512 / 1024						512	384	512		256
Consommation électrique, W.	265	140	165	105	75	95	60	90	100	50		30
Interface	PCI Express 2.0 x16
Support versions API	Direct3D 10, OpenGL 3.3, opencl 1.1
Version de support du modèle Shader	Shader Model 4.0.

Geforce 9800 Series

NVIDIA GEFORCE 9800GX2.

TIRE PCI Express 2.0;
Deux noyaux graphiques G92-450 (65-Nm) fonctionnant à une fréquence de 600 MHz;
256 (2 × 128) Les processeurs de streaming fonctionnant à une fréquence de 1500 MHz;
1024 MB (2 × 512 MB) Mémoire vidéo GDDR3 avec une interface 256 bits et une fréquence de 1000 MHz;
La consommation d'énergie est de 265 W;
Compatibilité avec DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
Support quad sli.

En fait, une double carte basée sur une paire de 8800gts 512 Mo. Cette carte vidéo est une continuation des concepts d'accélérateurs à deux phases GX2, qui ont été trouvés dans la série NVIDIA GEFORCE 7900.

Nvidia geforce 9800GTX +

TIRE PCI Express 2.0;
Noyau graphique G92B-400 (55-NM) fonctionnant à une fréquence de 738 MHz;
128 processeurs de streaming fonctionnant à une fréquence de 1836 MHz;
1024 MB ou 512 Mo GDDR3
La consommation d'énergie est de 140 W;
Soutenir la SLI 3 voies.

C'est une version de Geforce 9800GTX sur un processus technique de 55 nm avec une fréquence accrue et une consommation d'énergie moins importante. En termes de performance, un peu dépasse AMD / ATI Radeon 4850. Plus tard, a été renommée Geforce GTS 250.

NVIDIA GEFORCE 9800GTX

TIRE PCI Express 2.0;
Noyau graphique G92-400 (65-Nm) fonctionnant à une fréquence de 675 MHz;
128 processeurs de streaming fonctionnant à une fréquence de 1688 MHz;
1024 MB ou 512 Mo de mémoire vidéo GDDR3 avec une interface 256 bits et une fréquence de 1100 MHz;
La consommation d'énergie est de 168 W;
Compatibilité avec DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
Soutenir la SLI 3 voies.

Analogue Nvidia Geforce 8800gts 512 Mo avec des fréquences élevées. Très rapidement perdu sa place sur le marché 9800GTX +, libéré de toute urgence en réponse à la sortie AMD / ATI Radeon 4850/4870, qui ont une productivité plus élevée.

NVIDIA GEFORCE 9800GT.

TIRE PCI Express 2.0;
Le noyau graphique G92-400 (65-nm / 55-nm) fonctionnant à une fréquence de 600 MHz;
112 processeurs de streaming;
1024 MB ou 512 Mo GDDR3
La consommation d'énergie est de 105 W;
Compatibilité avec DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
Soutenir la SLI à double sens.

Analogue NVIDIA GEFORCE 8800GT 512 MB.

Nvidia geforce 9800gt vert

TIRE PCI Express 2.0;
Noyau graphique G92-400 (55-Nm) fonctionnant à une fréquence de 550 MHz;
112 processeurs de streaming;
1024 MB ou 512 Mo de mémoire vidéo GDDR3 avec une interface 256 bits;
La consommation d'énergie est de 75 W;
Compatibilité avec DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
Soutenir la SLI à double sens.

L'adaptateur vidéo NVIDIA GEFORCE 9800 GT d'une capacité de 512 Mo est apparu sur le marché en 2008, remplaçant le modèle précédent. Plus tard, des versions avec 1 Go de GDDR5 ont été libérées et améliorées des fonctionnalités des jeux. Toutes les options de cartes étaient dans la catégorie des prix du budget et étaient destinées à construire des ordinateurs de jeu peu coûteux.

Les paramètres de l'adaptateur graphique sont entièrement conformes aux exigences des applications de jeu 2008-2009. Les principales caractéristiques de Nvidia Geforce 9800 GT sont les suivantes:

Processeur graphique G92-270;
Fréquence GPU - de 550 à 600 MHz;
Fréquence de la mémoire - 1400-1800 MHz;
Bigness - 256 bits;
Taux de transfert de données maximum - 57,6 Go / s;
Résolution d'image prise en charge - jusqu'à 2560x1600.

La carte vidéo prend en charge la technologie SLI NVIDIA pour améliorer les performances, l'hybridepuissance pour passer automatiquement à des graphiques intégrés et de PhysX, ce qui garantit un processus de jeu réaliste maximal. Il fonctionne également avec les packages DirectX 10 et OpenGL 2.0, fournissant des graphismes 3D de haute qualité. Prise en charge d'ensembles plus modernes de l'API de fonctions n'est pas fourni.

GeForce 9800 GT Vue d'ensemble

La consommation d'énergie 9800 GT est assez élevée - à 105 W, elle nécessite donc une puissance puissante. Le fabricant recommande d'utiliser au moins 450 W. Pour lancer des jeux modernes, il vaut la peine de choisir un BP plus productif - de 500 ou 600 W.

Afin de maintenir la température normale de la carte vidéo GeForce 9800 GT, toutes modifications sont complétées avec des systèmes de refroidissement actifs - en règle générale, avec un refroidisseur.

En mode normal, la carte n'est chauffée pas plus de 77 degrés. La valeur maximale est de 105 degrés.

Pour connecter des périphériques de périphériques sur l'adaptateur vidéo, il existe de tels connecteurs:

2 DVI, qui peuvent être connectés via des adaptateurs et des câbles classiques VGA et HDMI;
TV-OUT pour sortir le signal analogique;
MIO, avec lequel vous pouvez combiner deux cartes.

La valeur maximale de la fréquence effective de la carte vidéo est de 2000 MHz, ce qui vous permet d'overclocker de 11 à 30%, en fonction du modèle. Il convient de penser qu'une augmentation notable des indicateurs peut entraîner une surchauffe sévère.

Comment overclocker la carte vidéo NVIDIA GEFORCE 9800 GT

Effectuer une accélération NVIDIA GEFORCE 9800 GT, vous pouvez augmenter la valeur de sa fréquence. Le résultat devient une augmentation de la performance de la carte et de la FPS pendant le gameplay. Bien que les jeux courent, les exigences minimales dont il ne correspond pas, cela ne fonctionnera de toute façon pas.

Assurez-vous que l'accélération de la carte vidéo de Nvidia GeForce 9800 GT aidera les services publics spéciaux de l'inspecteur Afterburner MSI ou NVIDIA.

La fréquence maximale de l'adaptateur vidéo overclocké ne doit pas dépasser 2000 MHz. La carte overclockée fonctionne plus rapidement, mais consomme jusqu'à 120-125 W.

Après l'overclocking mining sur le 9800 GT est possible, mais non recommandé. Même avec l'avènement de la nouvelle cryptocurrence de Bitcoin Gold, qui peut être obtenue à l'aide de processeurs graphiques, les performances seront toujours trop basses, même pour récupérer l'électricité, en particulier avec un TDP aussi élevé.

Quels jeux tireront nvidia geforce 9800 gt

Le test dans les tests GeForce 9800 GT a été passé à une fois montré la possibilité d'utiliser une carte vidéo pour les joueurs budgétaires. Exigences minimales pour un ordinateur correspondant à la carte: carte mère avec PCI-Express 16x, 512-1024 MB de RAM et une alimentation de 500 W. Également recommandé Package d'installation DX10.

Les résultats de vérification sont les suivants:

Dans le jeu Crysys (2009) lors de l'installation d'une résolution de 1280 × 1024 pix. Le modèle de 512 mégaoctets contient de 22 à 30 fps - environ au niveau de la carte vidéo HD 4770.
Lorsque vous démarrez le jeu Stalker (résolution de 1680x1050 pix.) La fréquence de changement des images atteint 13-25 images par seconde, si vous utilisez l'adaptateur avec 512 Mo GDDR5, et jusqu'à 30, si vous installez une version gigaoctet sur le l'ordinateur.
Skyrim avec une carte de 512 MB ne démarrera pas du tout, et la modification du gigaoctet sur les paramètres minimum apparaîtra jusqu'à 65 g.

Les jeux publiés après 2011-2012, fonctionnent à l'aide de GeForce 9800 GT 512 MB, n'est pas recommandé. La plupart d'entre eux ne montreront pas plus de 20 fps, le reste ne fonctionnera pas. La version avec 1 Go de mémoire convient, mais garantira également la qualité valide du gameplay.

Comparaison des fabricants

Au tout début des ventes, le prix NVIDIA GeForce 9800 GT était d'environ 2700 à 3000 roubles par version avec 512 Mo et environ 3,5 000 roubles. Pour les modifications de gigaoctet. Les produits de fabricants plus connus tels que MSI, Palit et Asus ont reçu une fréquence de mémoire de 1800 MHz et un coût plus élevé. Maintenant, il peut être acheté sur le marché secondaire pour seulement 600-700 roubles.

Marque.	Mémoire, MB	Fréquence du processeur, MHz	Fréquence de la mémoire, MHz	Coût, frotter.
Gigaoctet	1024	600	1800	3600
Gigaoctet	512	600	1500	2900
Gigaoctet	512	550	1800	2800
ECS.	512	550	1800	2600
MSI	512	550	1800	2900
Asus	512	600	1800	3000
Inno3d.	1024	600	1800	3500
Club 3D	1024	550	1400	3300
Gagnette.	1024	550	1800	3500
Zotac	1024	550	1600	3400
Palit.	512	600	1800	2700
Palit.	1024	550	1800	3400

Des variantes plus favorables des marques de zotac, du club 3D et des gigaoctets ont géré les acheteurs moins chers, mais ont également travaillé plus lentement. La fréquence de tels adaptateurs graphiques était comprise entre 1400 et 1600 MHz. Maintenant, leur prix est à peu près la même chose que pour les modèles une fois valant la peine - pas plus de 1000 roubles.

Comment réinstaller le pilote vidéo pour GeForce 9800 GT

Pour le fonctionnement normal de l'adaptateur vidéo, vous devez avoir des gestionnaires correctement exécutants. Il existe trois façons de télécharger et d'installer de nouveaux pilotes sur un ordinateur avec une carte de 9800 gt:

Téléchargez à partir de la ressource officielle du fabricant. La seule option qui garantit le bon travail et la sécurité du PC.
Télécharger des ressources tierces. La méthode auquel vous pouvez non seulement télécharger le pilote pour Nvidia Geforce 9800 GT, mais infecte également l'ordinateur avec un virus.
Utilisation de SPÉCIAL PASHTPACK SOLUTION, DriverHUB ou UTILITAIRE FREE PRODUCTEMENT SOMMESTER. Dans ce cas, le conducteur peut être obsolète.

Sur le site officiel de NVIDIA, vous pouvez trouver de nouvelles versions de programmes de contrôle pour les cartes vidéo destinées à divers systèmes d'exploitation. La liste de la carte de plate-forme pris en charge dispose de bits Windows 7 32 et 64, Windows 10 et Linux. Sur d'autres ressources, vous pouvez trouver des conducteurs pour un système d'exploitation rare tel que Solaris.

technologie (NM)90 80 65/55 transistors (m)681 289 210 754 505 314 processeurs universels128 32 16 128 64 32 blocs de texture32 16 8 64 32 16 blocs de mélange24 8 16 8 bus de mémoire.384 (64x6)128 (64x2)256 (64x4)128 (64x2) types de mémoireDDR, GDDR2, GDDR3, GDDR4 puce de pneu du système.PCI-Express 16xPCI-Express 2.0 16x Ramdac2 x 400mgz interfacesSortie TV.
TV-IN (besoin de puce de capture)
2 x DVI Dual Link
HDTV-OUT.Sortie TV.
TV-IN (besoin de puce de capture)
2 x DVI Dual Link
HDTV-OUT.
HDMISortie TV.
TV-IN (besoin de puce de capture)
2 x DVI Dual Link
HDTV-OUT.
HDMI
Displayport. ventex Shaders4.0 pixel shaders4.0 précision du calcul de pixelFP32. précision des calculs de sommetFP32. formats textureFP32)
FP16.
I8.
DXTC, S3TC.
3DC. formats de rendu FP32.
FP16.
I8.
10
Autres Mrt.il y a AntichèreTaa (polygones transparents AA)
CSAA 2X-16x
generation Z.2x en mode sans couleur modèles de tamponbilatéral ombre technologiecartes de quincaillerie d'ombres
Optimisation des ombres géométriques

Spécifications des cartes de référence basées sur la famille G8X

carte	ébrécher pneu	Blocs Alu / TMU	fréquence nucléaire (MHz)	fréquence de la mémoire (MHz)	taille de la mémoire (MB)	PSP (GB)	tEXEL TAUX (MTEX)	philos Taux (MPIX)
Geforce 8500 gt.	G86 Peg16x	16/8	450	400(800)	256 DDR2.	12.8 (128)	3600
Geforce 8600 gt.	G84. Peg16x	32/16	540	700(1400)	256 GDDR3	22.4 (128)	8600	4300
GeForce 8600 GTS.	G84. Peg16x	32/16	675	1000(2000)	256 GDDR3	32.0 (128)	10800	5400
GeForce 8800 GTS 320 Mo	G80 Peg16x	96/24	500	800(1600)	320 GDDR3.	64.0 (320)	12000	10000
GeForce 8800 GTS 640MB	G80 Peg16x	96/24	500	800(1600)	640 GDDR3	64.0 (320)	12000	10000
GeForce 8800 GTX	G80 Peg16x	128/32>	575	900(1800)	768 GDDR3	86.4 (384)	18400	13800
GeForce 8800 Ultra.	G80 Peg16x	128/32	612	1080(2160)	768 GDDR3	104.0 (384)	19600	14700
GeForce 8800 GT 256MB	G92. Peg16x	112/56	600	700(1400)	256 GDDR3	44.8 (256)	33600	9600
GeForce 8800 GT 512MB	G92. Peg16x	112/56	600	900(1800)	512 GDDR3	57.6 (256)	33600	9600
GeForce 8800 GTS 512MB	G92. Peg16x	128/64	650	1000(2000)	512 GDDR3	64.0 (256)	41600	10400
GeForce 8800 gs.	G92. Peg16x	96/48	550	800(1600)	384 GDDR3	38.4 (192)	26400	6600
Geforce 9400 gt.	G96. Peg16x	16/8	550	800(1600)	256/512 GDDR2.	25.6 (128)	4400	4400
Geforce 9500 gt.	G96. Peg16x	32/16	550	800(1600)	256/512 GDDR2 / GDDR3	25.6 (128)	8800	4400
GeForce 9600 GSO.	G92. Peg16x	96/48	550	800(1600)	384 GDDR3	38.4 (192)	26400	6600
Geforce 9600 gt.	G94. Peg16x	64/32	650	900(1800)	512 GDDR3	57.6 (256)	20800	10400
Geforce 9800 gt.	G92. Peg16x	112/56	600	900(1800)	512 GDDR3	57.6 (256)	33600	9600
GeForce 9800 GTX	G92. Peg16x	128/64	675	1100(2200)	512 GDDR3	70.4 (256)	43200	10800
Geforce 9800 gtx +	G92. Peg16x	128/64	738	1100(2200)	512/1024 GDDR3	70.4 (256)	47200	11800
GeForce 9800 GX2.	2xg92. Peg16x	2x (128/64)	600	1000(2000)	2x512 GDDR3	2x64.0. (2x256)	76800	19200
GeForce GTS 250.	G92. Peg16x	128/64	738	1100(2200)	512/1024 GDDR3	70.4 (256)	47200	11800
carte	ébrécher pneu	Blocs Alu / TMU	fréquence nucléaire (MHz)	fréquence de la mémoire (MHz)	taille de la mémoire (MB)	PSP (GB)	tEXEL TAUX (MTEX)	philos Taux (MPIX)

Détails: G80, Family GeForce 8800

Spécifications G80

Nom officiel de la puce GeForce 8800
Nom du code G80.
Technologie 90 nm
681 millions de transistors
Architecture unifiée avec une gamme de processeurs courants pour la diffusion de sommets et de pixels, ainsi que d'autres types de données possibles
Prise en charge du matériel pour les dernières innovations DirectX 10, y compris un nouveau modèle Shader - Shader Model 4.0, générant des données intermédiaires de géométrie et d'enregistrement des shaders (sortie de flux)
384 bits du bus de mémoire, 6 contrôleurs indépendants de largeur 64 bits, support pour GDDR4
Fréquence principale de 575 GHz (GeForce 8800 GTX)
128 Point flottant Scalar Alu (formats entier et flottant, prise en charge de la précision de la FP 32 bits dans le cadre de la norme IEEE 754, MAD + MULL sans perte d'horloges)
Alu fonctionne sur plus de la double fréquence (1,35 GHz pour 8800 gtx)
32 bloc de texture, supporte le composant FP16 et FP32 dans les textures
64 bloc de filtrage bilinéaire (c'est-à-dire un filtrage trilinéaire honnête gratuit, ainsi que deux fois la vitesse de filtrage anisotrope)
- Taille de l'unité de planification - 8x4 (32) pixels.
6 blocs de roupies larges (24 pixels) avec support pour les modes anti-aliasing jusqu'à 16 échantillons de pixels, y compris au format tampon de cadre FP16 ou FP32 (I.E., HDR + AA). Chaque bloc consiste en une matrice d'alu flexiblely configurable et est responsable de la génération et de la comparaison de Z, MSAA, Mélange. Performances maximales de l'ensemble du sous-système à 96 échantillons de MSAA (+ 96 Z) pour le tact, en mode sans couleur (Z uniquement) - 192 Références pour le tact.
Toutes les interfaces sont déposées sur une puce Nvio supplémentaire externe (2 RAMDAC, 2 DVI DIAL DVI, HDMI, HDTV)
Très bonne évolutivité de l'architecture, vous pouvez bloquer un bloc ou enlever des contrôleurs de mémoire et ROP (seulement 6), des blocs de shader (seulement 8 blocs TMU + Alu)

GeForce 8800 GTX Carte de référence Spécifications

Fréquence principale 575 MHz
La fréquence des processeurs universels 1350 MHz
Nombre de blocs de texture - 32, blocs de mélange - 24
Capacité de la mémoire 768 mégaoctets
Bande passante de la mémoire 86.4 gigaoctets en sec.
Vitesse tormale maximale théorique de 13,8 gigapixel en sec.
Vitesse de sélection théorique de 18,4 textures de gigaxel par seconde.
Connecteur SLI
Pneu PCI-Express 16x
Prix \u200b\u200brecommandé 599 $

Geforce 8800 GTS Carte de référence Spécification

Fréquence principale 500 MHz
Fréquence des processeurs universels 1200 MHz
Nombre de processeurs universels 96
Nombre de blocs de texture - 24, blocs de mélange - 20
Type de mémoire GDDR3, 1.1 NS (fréquence régulière 2 * 900 MHz)
Capacité de la mémoire 640 mégaoctets
Vitesse maximale tormale théorique 10.0 Gigapixel en Sec.
Textures d'échantillon d'échantillonnage théorique 12.0 GINGKEKSLE EN SEC.
Deux connecteurs DVI-I (Dual Link, pris en charge dans les autorisations jusqu'à 2560x1600)
Connecteur SLI
Pneu PCI-Express 16x
TV-OUT, HDTV-OUT, Support HDCP
Prix \u200b\u200brecommandé 449 $

Architecture

Transition vers des architectures graphiques unifiées Nous avons attendu longtemps. Maintenant, vous pouvez indiquer le fait - avec l'avènement de GeForce 8800 cette transition s'est produite et le pic essentiel est déjà passé. Suivre en outre la descente progressive de telles architectures dans les segments du milieu et du budget et de leur développement ultérieur, jusqu'à une fusion avec des architectures de processeurs multicœurs au point de vue de la distance. Nous vous familiarisons donc avec la première architecture unifiée de Nvidia:

Avant que nous soit tout le diagramme de la puce. La puce se compose de 8 blocs informatiques universels (processeurs de shader) et bien que NVIDIA parle de 128 processeurs, indiquant que chaque Alu est tel, il est quelque peu incorrect - l'unité d'exécution de la commande est une telle unité de traitement dans laquelle 4 TMU et 16 ALU sont regroupés . Au total, de cette manière, nous avons 128 ALU et 32 \u200b\u200bTMU, mais la granularité de l'exécution est de 8 blocs, chacune pouvant être engagée en un instant, par exemple, pour effectuer une partie d'un sommet ou d'un pixel, ou un Shader géométrique sur un bloc de 32 pixels (ou un bloc du nombre correspondant de sommets et d'autres primitives). Toutes les branches, transitions, conditions, etc. Il est entièrement utilisé à un bloc et donc le logique de tout, et d'être appelé un processeur de shader, laisser et très large.

Chacun de ce processeur est équipé de son propre cache de premier niveau, dans lequel non seulement les textures sont maintenant stockées, mais également d'autres données pouvant être demandées par un processeur de shader. Il est important de comprendre que le flux principal des données, tels que des pixels ou des sommets, qui sont traités, se déplaçant dans un cercle sous la commande du cardinal gris (bloc marqué sur le schéma du processeur de fil) - ne sont pas mis en cache, mais allez à la Stream, qui est le charme principal des architectures graphiques d'aujourd'hui - l'absence d'un accès totalement accidentel au niveau des primitives traitées.

En plus de l'unité de commande et de 8 processeurs de shader informatiques, en stock 6 blocs de rop exécutant des définitions de visibilité, écrivez sur la mémoire tampon de cadre et MSAA (bleu, à côté des blocs de cache L2) regroupés avec des contrôleurs de mémoire, vérifiez des files d'attente et une seconde Niveau de cache.

Ainsi, nous avons eu une architecture très large (8 blocs de traitement de 32 pixels chacune) peut en flageller dans les deux sens. L'ajout ou l'élimination des contrôleurs de mémoire et des processeurs de shader augmente correctement la largeur de bande de l'ensemble du système sans perturber la balance et sans créer de goulots d'étranglement. Il s'agit d'une solution logique et belle qui implémente le principal en détail d'une architecture unifiée est un équilibre automatique et une efficacité élevée de l'utilisation des ressources disponibles.

En plus des blocs de Shader et ROPS, un ensemble de gestionnaires et de blocs administratifs:

Les blocs qui exécutent des données d'exécution de certains formats (émission de filetage de sommet, géométrie et pixel) sont des portiers particuliers, préparant des données pour un couteau numérique dans des processeurs de shader conformément au format de données, au shader actuel et à son état, à des conditions de branche, etc.
Configuration / Raster / ZCull - Un bloc qui transforme les sommets vers les pixels - l'installation est effectuée ici, le triangle du triangle pour bloquer 32 pixels, un bloc préliminaire HSR.
Assembleur d'entrée - Un bloc qui sélectionne des données géométriques et autres sources de la mémoire du système ou de la mémoire locale, en collectant les structures de données source des flux, qui ira de l'extérieur à notre "carrousel". Et à la sortie, après de nombreux cercles sous la commande du sommet du sommet, de géométrie, de pixel Shader et des réglages de mélange, nous serons prêts à l'emploi (et lissé, si nécessaire) des pixels de rops.

À propos, une légère digression: il est clairement vu que, à l'avenir, ces blocs acquierent plus généraux et ne seront pas liés à des types spécifiques de shaders. Ceux. Il se transformera en blocs universels qui exécutent les données sur le calcul et la conversion des formats - par exemple, d'un shader à un autre, du sommet au pixel, etc. Aucun changement fondamental de l'architecture ne contribuera plus, le diagramme aura l'air et travaillera presque aussi, à l'exception d'un plus petit nombre de blocs spéciaux «gris». Déjà, tous les trois blocs de threads sont très probables (réels) par un bloc avec fonctionnalité générale et add-ons contextuels:

Processeur de shader et son tmu / alu

Donc, dans chacun des 8 blocs de shader en présence de 16 scalaires alu. Encore une fois, ce qui nous donne un potentiel d'augmentation de l'efficacité de leurs charges jusqu'à 100%, quel que soit le code de Shader. ALU fonctionne sur la double fréquence et ajusté ainsi ou dépasser (selon les opérations d'un shader) 8 Vecteur à quatre composants Alu Alu de l'ancien échantillon (G70) à une fréquence égale de base du noyau. Nvidia donne un tel calcul des performances de pointe:

Cependant, il est valable pour le plus non rentable pour d'autres options lorsqu'il existe deux multiplications. Dans la vie réelle, il convient de partager cet avantage d'une fois d'environ un an et demi. Mais, dans tous les cas, ces alu scalaires en raison de fréquences d'horloge supérieures et de leurs chiffres dépasseront tous les puces existantes. À l'exception, il peut être, la configuration SLI du G71, dans le cas de la non-rentable de la nouvelle architecture de shaders.

Fait intéressant, la précision de tous les ALU est FP32 et, en tenant compte de la nouvelle architecture, nous ne prévoyons aucun avantage pour les shaders FP16 avec une précision réduite. Un autre point intéressant est le soutien des calculs dans un format entier. Cet article est nécessaire pour mettre en œuvre SM4. Lors de la mise en œuvre de l'arithmétique, la norme IEEE 754 est suivie, ce qui le rend convenable à un calcul sérieux non joueur - scientifique, statistique, économique, etc.

Maintenant sur l'interaction des blocs de texture et alu dans une unité de shader:

Les textures d'échantillonnage et de filtrage ne nécessitent pas de ressources alu et peuvent maintenant être effectuées complètement parallèlement aux calculs mathématiques. La génération de coordonnées texturales (sur le schéma - MAIS) Fait encore partie du temps Alu. Il est logique si nous voulons utiliser les transistors à puce pour 100%, car la génération de coordonnées texturales nécessite des opérations flottantes standard et de commencer séparément alu car elle serait imprévue.

En soi, les modules de texture ont la configuration suivante:

En stock 4 modules pour adresser des textures TA (définitions de coordonnées de l'adresse exacte pour l'échantillonnage) et deux fois plus grand que des modules de filtrage bilinéaire TF. Pourquoi donc? Cela permet aux transistors de dépenses modérés de fournir un filtrage trilinéaire gratuit gratuit ou deux fois la chute de la vitesse du filtrage anisotrope. La vitesse sur les autorisations ordinaires, dans la filtration normale et sans AA, a eu du sens depuis longtemps - et la génération précédente d'accélérateurs s'adapte parfaitement à de telles conditions. Les formats de texture FP16 / FP32, ainsi que la correction de gamma SRGB à l'entrée (TMU) et de sortie (ROP) sont pris en charge.

Nous donnons les spécifications du modèle de shader de nouveaux processeurs répondant aux exigences de SM4:

Il existe des changements quantitatifs et qualitatifs significatifs - moins et moins de restrictions pour les shaders, de plus en plus en commun avec la CPU. Jusqu'à présent, sans un accès très arbitraire (une telle opération est apparue dans SM4, la charge de paragraphe OP dans le diagramme, mais son efficacité à des fins générales est toujours douteuse, en particulier dans les premières mises en œuvre), mais il ne fait aucun doute que dans une courte période Et cet aspect sera mis au point tel qu'il a été développé pour ces 5 années de prise en charge des formats FP - des premiers essais de NV30 à un total, via le convoyeur FP32 dans tous les modes maintenant - en G80.

Comme nous nous souvenons, sauf 8 blocs de shader, en stock 6 blocs de rop:

Le diagramme montre deux chemins distincts pour Z et C cependant, il n'est vraiment qu'un ensemble d'ALU, qui sont divisés en deux groupes lors du traitement de pixels de couleur, ou agissent comme un groupe lors du traitement en mode Z-z, augmentant ainsi la largeur de bande. est deux fois. De nos jours, cela n'a aucun sens de considérer les pixels individuels - ils sont assez importants, il est plus important de calculer le nombre d'échantillons de MSAA pouvant être traités pour le tact. En conséquence, la puce MSAA 16X peut émettre 6 pixels à part entière pour le tact, à 8 fois-12, etc. Fait intéressant, l'évolutivité de travailler avec un tampon de cadre à la hauteur - comme nous nous souvenons, chaque bloc de rop fonctionne avec son propre contrôleur de mémoire et n'interfère pas avec le voisinage.

Et enfin, il existe une prise en charge à part entière des formats de tampon de cadre FP32 et FP16 avec anti-aliasing, il n'y a maintenant aucune restriction pour l'imagerie des développeurs et le HDR tout au long du pipeline ne nécessite pas de changement dans la séquence générale de Construction de cadre Même en mode AA.

CSAA

Il y a une nouvelle méthode de lissage - CSAA. Bientôt sur le site, il y aura son étude détaillée, mais pour l'instant, nous notons que cette méthode est à bien des égards similaire à l'approche ATI et traite également des pseudo-poudre de motifs et la distribution d'échantillons aux zones géométriques voisines (pixel balance, Les pixels n'ont pas une limite nette et comment ils vont un à l'autre avec un TZ. AA, couvrant une certaine zone). De plus, les couleurs des échantillons et de la profondeur sont stockées séparément de leurs informations de localisation et, par exemple, un pixel peut accueillir 16 échantillons, par exemple, seulement 8 valeurs de profondeur calculées, qui permet d'économiser davantage la bande passante et du tact.

On sait que la MSAA classique des modes supérieure à 4X devient très exigeante du point de vue de la mémoire, tandis que la qualité augmente de moins en moins. La nouvelle méthode corrige cela, vous permettant d'obtenir un mode de lissage 16x, mieux que MSAA 16X, avec des coûts de calcul comparables à 4 MSAA.

Nvio.

Une autre innovation dans G80 est l'interface de la puce principale de l'accélérateur. Pour eux, répond maintenant à une puce distincte appelée Nvio:

Dans cette puce intégrée:

2 * 400 MHz Ramdac
2 * DVI DUAL LINK (ou LVDS)
HDTV-OUT.

Le sous-système de sortie ressemble à ceci:

La précision est toujours de 10 bits sur le composant. Bien entendu, dans le segment du milieu et en particulier dans les décisions budgétaires, une puce externe distincte peut ne pas être préservée, mais pour des cartes coûteuses dans une telle solution plus avantages que des minus. Les interfaces occupent une zone de puce importante, dépendent fortement des interférences, nécessitent une nutrition spéciale. En éliminant tous ces problèmes à l'aide d'une puce externe, vous pouvez gagner sous forme de signaux de sortie et de flexibilité de configuration, ainsi que de ne pas compliquer le développement et la puce ainsi complexe des modes optimaux pour le RAMDAC intégré.

Détails: G84 / G86, GeForce 8600 et 8500 familles

Spécifications G84

Nom officiel de la puce geforce 8600
Nom du code G84.
Technologie 80 nm
289 millions de transistors
Fréquence de base jusqu'à 675 MHz (GeForce 8600 GTS)
Alu fonctionne sur plus que la double fréquence (1,45 GHz pour GeForce 8600 GTS)
16 blocs de texture, support FP16 et FP32 Composant dans les textures
16 blocs de filtrage bilinéaire (comparé au G80, il n'y a aucune possibilité de filtrage trilinéaire libre et plus efficace par la vitesse de filtration anisotrope)
La possibilité de branches dynamiques dans les chamaneurs de pixels et de sommets
Enregistrement des résultats jusqu'à 8 tampons de cadre en même temps (MRT)

GeForce 8600 GTS Carte de référence Spécifications

675 MHz Fréquence de base
Fréquence des processeurs universels 1450 MHz
GDDR3 Type de mémoire Type
Capacité de la mémoire 256 mégaoctets
Bande passante de 32,0 gigaoctets en sec.
Vitesse tormale maximale théorique 5.4 gigapixel en sec.
Textures d'échantillon d'échantillonnage théorique 10.8 GIGITXEL EN SEC.
Consommation électrique jusqu'à 71 W
Connecteur SLI
Pneu PCI-Express 16x
TV-OUT, HDTV-OUT, Support HDCP
Prix \u200b\u200brecommandé 199-229 $

Spécifications de la carte de référence GeForce 8600 GT

Fréquence principale 540 MHz
Fréquence des processeurs universels 1180 MHz
Nombre de processeurs universels 32
Le nombre de blocs de texture - 16 (voir synthétique), blocs de mélange - 8
GDDR3 Type de mémoire Type
Capacité de la mémoire 256 mégaoctets
Bande passante de la mémoire 22.4 GigaByte en Sec.
Vitesse tormale maximale théorique 4.3 gigapixel en sec.
Textures d'échantillonnage d'échantillonnage théorique 8.6 GIGITXEL EN SEC.
Consommation électrique jusqu'à 43 W
Connecteur SLI
Pneu PCI-Express 16x
Prix \u200b\u200brecommandé $ 149-159 $

Spécifications G86

Le nom officiel de la puce GeForce 8500
Nom du code G86.
Technologie 80 nm
210 millions de transistors
Architecture unifiée avec un éventail de processeurs courants pour la diffusion des sommets et des pixels, ainsi que d'autres types de données
Support matériel DirectX 10, y compris un nouveau modèle Shader - Modèle Shader 4.0, générant la géométrie et l'enregistrement de données intermédiaires à partir de Shaders (sortie de flux)
Bits de 128 bits du bus de mémoire, deux contrôleurs indépendants 64 bits largeur
Fréquence de base jusqu'à 450 MHz (GeForce 8500 GT)
Alu fonctionne sur la double fréquence (900 MHz pour GeForce 8500 gt)
16 Point flottant alu scalaire (entier et formats flottants, prise en charge de la précision de la FP 32 bits dans le cadre de la norme IEEE 754, MAD + MIL sans perte d'horloges)
8 blocs de texture, support FP16 et FP32 Composant dans les textures
8 blocs de filtrage bilinéaire (comparé au G80, il n'ya aucune possibilité de filtrage trilinéaire libre et plus efficace par la vitesse de filtration anisotrope)
La possibilité de branches dynamiques dans les chamaneurs de pixels et de sommets
2 bloc de roupies large (8 pixels) avec support pour les modes anti-aliasing jusqu'à 16 échantillons par pixel, y compris au format tampon de cadre FP16 ou FP32. Chaque bloc consiste en une matrice d'alu flexiblely configurable et est responsable de la génération et de la comparaison de Z, MSAA, Mélange. Performances maximales de l'ensemble du sous-système jusqu'à 32 échantillons de MSAA (+ 32 z) pour le tact, en mode sans couleur (z uniquement) - 64 Référence
Enregistrement des résultats jusqu'à 8 tampons de cadre en même temps (MRT)
Toutes les interfaces (deux Ramdac, deux DIAL DVI, HDMI, HDTV) sont intégrées à une puce (contrairement à la puce supplémentaire externe NVIO de GeForce 8800)

Spécification de la carte de référence GeForce 8500 GT

Fréquence principale 450 MHz
Fréquence des processeurs universels 900 MHz
Fréquence de mémoire efficace 800 MHz (2 * 400 MHz)
Type de mémoire DDR2
Capacité de la mémoire 256/512 mégaoctets
Capacité de la bande passante de 12,8 gigaoctets par seconde.
Vitesse tormale maximale théorique 3.6 gigapixel en sec.
Textures d'échantillon d'échantillonnage théorique 3.6 GIGATIONXEXEXED en sec.
Consommation électrique jusqu'à 40 W
Deux connecteurs DVI-I Dual Link, pris en charge par des autorisations jusqu'à 2560x1600)
Connecteur SLI
Pneu PCI-Express 16x
TV-OUT, HDTV-OUT, Support HDCP en option
Prix \u200b\u200brecommandé $ 89-129 $

Architecture G84 et G86

Déjà, selon les spécifications, on peut voir que G84 est quelque chose méchant entre une quart et une tiers des parties du phare de la ligne G80. Du point de vue du nombre de processeurs universels, on obtient un quart et du point de vue du nombre de blocs de rops et d'un contrôleur de mémoire - un tiers. Il est plus difficile avec les textures texturales, il semble y avoir un quart, mais pas la moitié, nous en parlerons ci-dessous. G86, à son tour, en général, quelque chose d'intéressant - en calculant seulement 1/8 du G80 et sur Rop - tous les mêmes 1/3. Nvidia n'est pas pressée de réduire les copeaux dans des copeaux bas de gamme, de manière rapide.

La principale question est ici - et sera-t-elle suffisante pour cette quantité et 1/8 afin de faire une concurrence digne des solutions actuelles et des futurs jetons AMD? N'est-ce pas trop élevé dans Nvidia Nombre de blocs? De plus, de ne pas dire que les deux frites étaient trop petites dans le nombre de transistors ... en G84, près de la moitié des transistors G80, en G86 - près d'un tiers. Il semble que la solution soit compromise, s'ils laissaient la moitié des blocs G80, la puce serait trop coûteuse en production et aurait fait une concurrence réussie à sa propre geforce 8800 GTS.

Dans un proche avenir, probablement, sur la base de la technologie, 65 nm peuvent être fabriqués plus de puces productives pour les gammes de prix moyen et inférieur, et c'est juste jusqu'à présent. Nous examinerons la performance de nouvelles puces dans des tests synthétiques et de jeu, mais nous pouvons maintenant dire que le G84 et le G86 ne sont peut-être pas trop rapides en raison de la petite quantité d'Alu, elles sont très susceptibles d'être approximativement ainsi que des solutions actuelles similaires à elles .

Sur l'architecture du G84 et G86, nous n'arrêterons pas trop de détail, les changements par rapport au G80 ici sont un peu, en vigueur, il reste tout ce qui a été dit dans la revue GeForce 8800, avec modification des caractéristiques quantitatives. Mais nous décrivons toujours les points forts qui valent notre attention et donnent plusieurs diapositives dédiées aux spécifications architecturales des nouvelles puces.

Le G80 se compose de huit blocs informatiques universels (processeurs de shader), NVIDIA préfère parler de 128 processeurs. L'unité d'exécution des commandes, apparemment, il s'agit d'une unité de processeur entière entièrement, dans laquelle 4 TMU et 16 Alu sont regroupés. Chacun des blocs à un point peut effectuer une partie d'un sommet, d'un pixel ou d'un shader géométrique au-dessus du bloc de 32 pixels, des sommets ou d'autres primitives, peut également être engagé dans des calculs physiques. Chaque processeur a son propre cache de premier niveau dans lequel les textures et autres données sont stockées. Outre l'unité de commande et les processeurs de shader informatiques, il existe six blocs de roupies qui exécutent des définitions de visibilité, écrivent sur la mémoire tampon de cadre et MSAA, regroupées avec des contrôleurs de mémoire, des files d'enregistrement et un cache de seconde niveau.

Cette architecture est capable de réduire les deux directions, ce qui a été réalisé dans de nouvelles solutions. Nous avons déjà mentionné cette belle solution qui implémente le principal en détail d'une architecture unifiée - balance automatique et une efficacité élevée d'utilisation des ressources disponibles dans l'article de GeForce 8800. Cela s'attendait également à ce que la décision moyenne du niveau consiste en des blocs de demi-calcul, et une La solution basée sur deux processeurs de shader et une ROP deviendra budgétiser. Malheureusement, s'il y avait huit transformateurs qui composent 32 TMU et 128 Alu dans la GeForce 8800, dans les nouveaux puces, leurs quantités étaient plus fortes que prévu initialement. Apparemment, le schéma G84 ressemble à ceci:

C'est-à-dire que tout reste inchangé, en plus du nombre de blocs et de contrôleurs de mémoire. Il y a des changements mineurs associés à des blocs de texture et perceptibles dans cette image, mais nous en parlerons plus loin. Curieux, où se passe tellement de transistors, si seulement 32 transformateurs du G84 sont partis? Le G84 est près de la moitié des transistors, comparés au G80, avec un nombre considérable de canaux de mémoire, de processeurs de rop et de shader. Oui, et les transistors G86 sont très nombreux, avec seulement 16 processeurs ...

Il est également intéressant d'être intéressant à quel point la charge entre l'exécution de sommets, pixels et géométriques sera équilibrée dans des applications réelles, car le nombre de blocs exécutifs universels est devenu beaucoup plus petit. De plus, l'architecture unifiée lui-même propose de nouvelles tâches devant les développeurs, le cas échéant, il devra réfléchir à la manière d'utiliser efficacement la puissance totale entre sommet, pixel et shaides géométriques. Nous donnons un exemple simple - concentrant les calculs de pixels. Dans ce cas, une augmentation de la charge sur les blocs de sommet dans l'architecture traditionnelle ne conduira pas à une baisse de performance et, dans une unifiée, entraînera un équilibre de la balance et de réduire le nombre de ressources pour les calculs de pixels. Nous examinerons certainement la question de la performance et poursuivrons maintenant l'étude des changements de l'architecture du G84 et du G86.

Processeur de shader et TMU / ALU

Le schéma des blocs de shader et l'évaluation de leur performance informatique de pointe G80 ont été donnés dans l'article approprié, pour le régime G84 et G86 n'a pas changé, et leur performance n'est pas affichée. Alu dans des puces fonctionnent également sur une double fréquence et elles sont scalaires, ce qui vous permet d'obtenir une efficacité élevée. Il n'y a pas de différences dans les deux fonctionnalités, la précision de tous les ALU est la FP32, il est nécessaire de prendre en charge les calculs dans un format entier, et lorsqu'il est mis en œuvre, la norme IEEE 754 est essentielle, importante pour les calculs scientifiques, statistiques, économiques et autres.

Mais les modules de texture ont changé par rapport au G80, NVIDIA assure que les modifications architecturales ont été apportées à de nouvelles puces pour augmenter la performance des transformateurs unifiés. Dans le G80, chaque machine de texture pourrait calculer quatre adresses textuelles et effectuer huit opérations de filtrage de la texture pour le tact. Il est fait valoir que dans les nouvelles puces, le premier nombre a été doublé et qu'il est capable de plus de deux fois le nombre d'échantillons de texture. C'est-à-dire que les modules de texture G84 et G86 ont la configuration suivante (pour comparer la gauche, le schéma de bloc G80 est affiché):

Selon Nvidia, chacun des blocs comporte huit modules d'adressage de texture (définitions de coordonnées de l'adresse exacte de l'échantillonnage) TA et exactement le même nombre de modules de filtrage bilinéaire (TF). Le G80 comptait quatre modules TA et huit TF, qui permettaient aux transistors avec une consommation de transistors réduite afin de fournir un filtrage trilinéaire «libre» ou deux fois la chute de la vitesse du filtrage anisotrope, qui est utile pour les accélérateurs de niveau supérieur, où la filtration anisotrope est presque toujours utilisé par les utilisateurs. Nous vérifierons l'exactitude de ces informations dans la partie pratique, assurez-vous d'examiner l'analyse des tests synthétiques correspondants, car ils contredisent ces données.

Tout le reste de la fonctionnalité des blocs de texture est identique, les formats de texture FP16 / FP32 sont pris en charge. Seulement si la filtration FP16 de la texture était également à toute vitesse en raison du double nombre de blocs de filtrage, il n'y a pas de tel solutions des niveaux moyen et inférieur (à nouveau, lorsque les conditions, si les changements ci-dessus sont vraiment disponibles).

Blocs de rops, écriture sur le cadre tampon, lissage

Les blocs de rop, qui, dans le G80, il y en avait six pièces et dans de nouvelles frites, elle est devenue deux, n'a pas changé:

Chacun des blocs traite quatre pixels (16 sous-pixels), total est de 8 pixels par tact pour la couleur et la Z. En mode Z, il est traité deux fois la quantité d'échantillons par tact. La puce MSAA 16X peut émettre deux pixels pour le tact, à 4 fois-8, etc. Comme dans G80, il existe une prise en charge complète des formats de tampon de cadre FP32 et FP16 conjointement avec anti-aliasing.

La nouvelle méthode de lissage est prise en charge par GeForce 8800 - Couverture échantillonnée Antialiasing (CSAA), décrite en détail dans le matériau approprié:

En bref, l'essence de la méthode est telle que les couleurs des échantillons et de la profondeur sont stockées séparément de leurs informations de localisation, un pixel peut avoir 16 échantillons et seulement 8 valeurs de profondeur calculées, qui permet d'économiser la bande passante et le tact. CSAA vous permet de faire avec la transmission et le stockage d'une valeur de couleur ou de Z à chaque sous-écran, en spécifiant la valeur moyenne du pixel d'écran en raison d'informations plus détaillées sur la manière dont ce pixel chevauche les bords des triangles. En conséquence, la nouvelle méthode permet d'obtenir le mode de lissage 16x, sensiblement mieux que MSAA 4X, avec des coûts de calcul comparables à celui-ci. Et dans de rares cas dans lesquels la méthode de la CSAA ne fonctionne pas, il appartient à la MSAA habituelle dans une moindre mesure et non l'absence complète d'antitasières.

Purevideo HD.

Aller aux changements les plus intéressants. Il s'avère que G84 et G86 ont des innovations qui les distinguent même de G80! Ceci s'applique au processeur vidéo intégré, lequel dans les nouvelles puces a reçu un support avancé pour Purevideo HD. Il est indiqué que ces puces déchargent complètement le processeur central du système lors de la décodage de tous les types de données vidéo communes, y compris le format le plus "lourd" H.264.

Le G84 et G86 utilise un nouveau modèle du processeur vidéo PureVideo HD programmable, plus puissant, comparé au G80, et comprend le moteur dit BSP. Le nouveau processeur prend en charge le décodage des formats H.264, VC-1 et MPEG-2 avec une résolution allant jusqu'à 1920x1080 et un débit binaire jusqu'à 30 à 40 Mbps, il effectue tous les travaux sur le décodage du matériel de données CABAC et CAVLC, ce qui vous permet Pour lire tous les DVD HD existants et tous les disques Blu-ray, même sur une puissance de PC à la taille moyenne de taille moyenne.

Le processeur vidéo du G84 / G86 est composé de plusieurs parties: le processeur vidéo de la deuxième génération elle-même (VP2) effectuant des tâches IDCT, la compensation de mouvement et l'élimination des artefacts de blocage pour les formats MPEG2, VC-1 et H.264 prenant en charge le décodage matériel de la Deuxième flux; Processeur de puissance (BSP) exécutant les tâches de décodage statistique CABAC et CAVLC pour le format H.264, et c'est l'un des calculs les plus fastidieux; Décodage des données de décodage du moteur AES128, dont le but est compréhensible de son nom - il est engagé dans la décodage des données vidéo utilisées dans la copie de la protection à Blu-ray et à HD-DVD. Voici comment les différences examinent le degré de support matérielle pour décoder une vidéo sur différentes copeaux vidéo:

Les tâches effectuées par une puce vidéo sont surlignées en bleu et un processeur central vert. Comme vous pouvez le constater, si la génération précédente a aidé le processeur uniquement en termes de tâches, le nouveau processeur vidéo utilisé dans les derniers puces rend toutes les tâches elles-mêmes. Nous allons vérifier l'efficacité des solutions dans les matières futurs pour étudier l'efficacité de la vidéo de décodage vidéo, NVIDIA fournit des matériaux dans les matériaux: lors de l'utilisation d'un processeur double central moderne et de décodage logiciel, les disques Blu-ray et HD-DVD se reproduisent jusqu'à 90 -100% du temps du processeur, lorsque le matériel décodage sur la puce vidéo de la génération passée sur le même système - jusqu'à 60-70%, et avec un nouveau moteur, qu'ils ont développé pour G84 et G86 ne sont que de 20%. Ceci, bien sûr, ne semble pas être déclaré entièrement en décodage matériel, mais toujours très efficace.

Au moment de l'annonce, les nouvelles fonctionnalités qui apparaissent dans Purevideo HD ne fonctionnent que dans la version 32 bits de Windows Vista, et la prise en charge de PureVideo HD dans Windows XP n'apparaîtra qu'en été. En ce qui concerne la qualité de la lecture vidéo, la post-traitement, le désentrelacement, etc., puis avec cette entreprise NVIDIA s'est améliorée à GeForce 8800, et de nouvelles puces ne sont pas particulièrement différentes à cet égard.

Cuda, non-jeu et calculs physiques

L'article sur la GeForce 8800 a mentionné que la productivité maximale accrue de l'arithmétique flottante dans les nouveaux accélérateurs et la flexibilité de l'architecture de shader unifiée est devenue suffisante pour calculer la physique dans les applications de jeu et encore plus graves: modélisation mathématique et physique, modèles économiques et statistiques et Calculs, reconnaissance d'image, traitement d'image, graphiques scientifiques et bien plus encore. Pour cela, une API spéciale s'est concentrée sur le calcul, qui est pratique pour l'adaptation et le développement de programmes, des calculs changeants sur GPU - CUDA (architecture de périphérique unifiée de calcul).

En savoir plus sur Cuda est écrit dans l'article sur le G80, nous nous concentrerons sur une autre direction à la mode récemment - Soutien aux calculs physiques sur le GPU. Nvidia appelle de tels effets quantiques. Il est déclaré que toutes les copeaux vidéo de la nouvelle génération, y compris le G84 et le G86 considéré aujourd'hui, conviennent bien au calcul de ce type, vous permettant de transférer une partie de la charge de la CPU au GPU. Les simulations de fumée, d'incendie, d'explosions, de dynamiques de cheveux et de vêtements, de laine et de liquides sont présentées comme des exemples spécifiques. Mais jusqu'à présent, je veux écrire à propos d'un ami. Cela, alors que nous ne montrons que des images à partir d'applications de test avec un grand nombre d'objets physiques calculés par les copeaux vidéo et les jeux avec ce support ne sentent même pas.

Prise en charge des interfaces externes

Comme nous nous souvenons, dans la GeForce 8800, nous étions un peu surpris par une autre innovation inattendue - une puce supplémentaire prenant en charge les principales interfaces externes effectuées au-delà des interfaces principales. Dans le cas des cartes vidéo supérieures, ces tâches sont engagées dans une puce distincte appelée Nvio, qui intégrée: deux 400 MHz Ramdac, deux DVI double liaison DVI (ou LVDS), HDTV-OUT. Déjà alors nous avons supposé que dans les segments moyens et inférieurs, une puce externe distincte n'est guère préservée et réellement arrivée. En G84 et G86, prenez en charge toutes ces interfaces est intégrée à la puce elle-même.

Sur GeForce 8600 GTS, deux DVI-I DVI-I Sortir avec la prise en charge HDCP est installée, il s'agit de la première carte vidéo du marché avec des fonctionnalités similaires (HDCP et Dual Link ensemble). Quant à HDMI, le support de ce matériel de connecteur est entièrement mis en œuvre et peut être effectué par les fabricants sur des cartes de conception spéciales. Mais les GeForce 8600 GT et 8500 GT prennent en charge HDCP et HDMI en option, mais ils peuvent être mis en œuvre par des fabricants distincts de leurs produits.

Détails: G92, GeForce 8800 Famille

Spécifications G92

Nom du code Chip G92
Technologie 65 nm
754 millions de transistors (plus que G80)
Architecture unifiée avec un éventail de processeurs courants pour la diffusion des sommets et des pixels, ainsi que d'autres types de données
Fréquence du noyau de 600 MHz (GeForce 8800 gt)
Alu fonctionne sur plus de la double fréquence (1,5 GHz pour GeForce 8800 gt)
112 (Ceci est pour la GeForce 8800 GT, et au total, probablement 128) Point flottant Scalar Alu (formats entier et flottant, support de la précision de la FP 32 bits dans le cadre de la norme IEEE 754, MAD + MULL sans perte d'horloges )
56 (64) Blocs d'adressage du texture avec les composants de support FP16 et FP32 dans les textures (explications voir ci-dessous)
56 (64) blocs de filtrage bilinéaire (comme dans le G84 et G86, il n'y a pas de filtrage trilinéaire gratuit et de filtration anisotrope plus efficace)
La possibilité de branches dynamiques dans les chamaneurs de pixels et de sommets
Enregistrement des résultats jusqu'à 8 tampons de cadre en même temps (MRT)
Toutes les interfaces (deux Ramdac, deux DIAL DVI, HDMI, HDTV) sont intégrées à une puce (contrairement à la puce supplémentaire externe NVIO de GeForce 8800)

Geforce 8800 GT 512MB Carte de référence Spécification

Fréquence principale 600 MHz
Fréquence de mémoire efficace 1,8 GHz (2 * 900 MHz)
GDDR3 Type de mémoire Type
Capacité de la mémoire 512 mégaoctets
Consommation électrique jusqu'à 110 w
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support HDCP
Prix \u200b\u200brecommandé $ 249

GeForce 8800 GT 256MB Carte de référence Spécifications

Fréquence principale 600 MHz
Fréquence des processeurs universels 1500 MHz
Nombre de processeurs universels 112
Nombre de blocs de texture - 56, blocs de mélange - 16
Fréquence de mémoire efficace de 1,4 GHz (2 * 700 MHz)
GDDR3 Type de mémoire Type
Capacité de la mémoire 256 mégaoctets
Bande passante de la mémoire 44.8 gigaoctet en sec.
Vitesse tormale maximale théorique 9.6 gigapixel en sec.
Taux de sélection théorique des textures jusqu'à 33,6 GIGATIONXEL en SEC.
Consommation électrique jusqu'à 110 w
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support HDCP
Prix \u200b\u200brecommandé $ 199

GeForce 8800 GTS 512MB Spécification de la carte de référence

Fréquence principale 650 MHz
Nombre de processeurs universels 128
Fréquence de mémoire efficace 2.0 GHz (2 * 1000 MHz)
GDDR3 Type de mémoire Type
Capacité de la mémoire 512 mégaoctets
Bande passante de la mémoire de 64,0 gigaoctets en sec.
Taux de sélection théorique des textures jusqu'à 41,6 GIGATIONXEL en SEC.
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support HDCP
Prix \u200b\u200brecommandé $ 349-399 $

Architecture de puce G92.

L'architecture G92 de G80 n'est pas différente. Par ce que nous savons, nous pouvons dire que le G92 est le produit phare de la ligne (G80) traduit dans un nouveau processus technique, avec des modifications mineures. Nvidia souligne ses matériaux que la puce dispose de 7 grands blocs de shader et, en conséquence, 56 blocs de texture, ainsi que quatre larges rops, le nombre de transistors dans la puce provoque des soupçons qu'ils ne négocient pas quelque chose. Dans les solutions initiales annoncées, tous les blocs existants dans la puce sont physiquement impliqués, leur nombre en G92 est plus grand que celui actif dans GeForce 8800 GT. Bien que la complexité accrue de la puce soit expliquée par l'inclusion d'une puce Nvio distincte précédemment, ainsi que du processeur vidéo de la nouvelle génération. De plus, le nombre de transistors a affecté les blocs TMU compliqués. En outre, il était également susceptible d'augmenter les caches pour augmenter l'efficacité de l'utilisation d'un bus de mémoire de 256 bits.

Cette fois, pour faire une concurrence digne avec les puces AMD correspondantes, Nvidia a décidé de laisser un nombre assez important de blocs à mi-fin. Notre hypothèse a été confirmée à partir de l'examen G84 et G86, qui, basé sur la technologie, 65 NM produira des puces beaucoup plus productives pour la gamme de prix moyens. Les changements architecturaux dans la puce G92 sont un peu, et nous ne nous arrêterons pas en détail dessus. Toutes les solutions mentionnées ci-dessus sur la série GeForce 8 restent en vigueur, nous ne répéterons que certains des principaux points dédiés aux spécifications architecturales de la nouvelle puce.

Pour la nouvelle solution NVIDIA, ce système conduit à ce document:

C'est-à-dire de tous les changements - seul un nombre réduit de blocs et quelques modifications apportées à la TMU, écrite ci-dessous. Comme décrit ci-dessus, il y a des doutes que physiquement, mais nous donnons une description, basée sur ce que Nvidia écrit. Le G92 se compose de sept blocs informatiques universels (processeurs de shader), NVIDIA indique traditionnellement 112 processeurs (au moins dans les premières solutions GeForce 8800 gt). Chacun des blocs dans lesquels 8 TMU et 16 alu sont regroupés peuvent effectuer une partie du sommet, de pixels ou de shader géométrique au-dessus du bloc de 32 pixels, des sommets ou d'autres primitives, peuvent également être engagés dans d'autres calculs (non photographiques). Chaque processeur a son propre cache de premier niveau dans lequel les textures et autres données sont stockées. Outre l'unité de contrôle et les processeurs de shader informatiques, il existe quatre blocs de roupies qui exécutent des définitions de visibilité, écrivent sur la mémoire tampon de cadre et MSAA, regroupées avec des contrôleurs de mémoire, de la caisse et du cache de second niveau.

Processeurs universels et TMU

Le schéma des blocs de shader et l'évaluation de leur performance de calcul de pointe G80 ont été donnés dans l'article approprié, pour le G92, il n'a pas changé, leur performance est facile à convertir, sur la base des modifications de la fréquence de l'horloge. Alu dans des puces travaillent plus que la double fréquence, elles sont scalaires, ce qui permet d'obtenir une efficacité élevée. À propos des différences fonctionnelles n'est pas encore connue si la précision des calculs de la FP64 est disponible dans cette puce ou non. Il est définitivement de prendre en charge l'informatique dans un format entier et lors de la mise en œuvre de tous les calculs, IEEE 754 est suivi, important pour les calculs scientifiques, statistiques, économiques et autres.

Les modules de texture de G92 ne sont pas comme dans le G80, ils répètent la solution TMU dans le G84 et G86, dans lesquelles des modifications architecturales ont été apportées pour augmenter la productivité. Rappelez-vous que dans le G80, chaque machine à texture pourrait calculer quatre adresses de texture et effectuer sur huit opérations de filtrage de la texture pour le tact, et dans le G84 / G86 TMU, sont capables de plus de deux fois le nombre d'échantillons de texture. C'est-à-dire que chacun des blocs comporte huit modules d'adressage de texture (définitions de coordonnées de l'adresse exacte de l'échantillonnage) TA et exactement le même nombre de modules de filtrage bilinéaire (TF):

Ne pensez pas que les blocs de GeForce 8800 GT dans des applications réelles seront plus forts que 32 blocs dans la GeForce 8800 GTX. Avec un filtrage trilinéar et / ou anisotropique activé, ce dernier sera plus rapide, car ils peuvent effectuer un peu plus de travail sur les échantillons de texture filtrant. Nous vérifierons ces informations dans la partie pratique en apportant les résultats des résultats des tests synthétiques correspondants. Tout le reste de la fonctionnalité de bloc de texture n'a pas changé, les textures FP16, FP32 et autres sont prises en charge.

Blocs de rops, écriture sur le cadre tampon, lissage

Les blocs de rop eux-mêmes n'ont pas non plus changé, mais leur nombre est devenu différent. En G80, il y avait six Rops et dans une nouvelle solution, il y en avait quatre, afin de réduire les coûts de production de copeaux et de cartes vidéo PCB. De plus, cette coupe peut être due à ne pas créer une concurrence trop forte pour les solutions de niveau supérieur existantes.

Chaque blocs traite quatre pixels ou 16 sous-pixels, et tout allume 16 pixels pour le tact pour la couleur et la Z. En mode Z, il est traité deux fois la quantité d'échantillons par une. La puce MSAA 16X peut émettre deux pixels pour le tact, à 4 fois-8, etc. Comme dans le G80, le tampon de cadre FP32 et FP16 et les formats FP16 sont entièrement supportés avec anti-aliasing.

Une nouvelle méthode de lissage connue des puces précédentes est prise en charge - la couverture échantillonnée antialiasing (CSAA). Et une innovation de plus était que dans la GeForce 8800 GT, l'anti-algorithme des surfaces translucides a été mis à jour (antialiasing de transparence). Le choix de l'utilisateur a été proposé deux options: multisampling (TRMS) et SUPER MELLING (TRSS), la première était une très bonne performance, mais elle a été effectivement fonctionne loin de tous les jeux, et la seconde était de haute qualité, mais lente. La GeForce 8800 GT a déclaré une nouvelle méthode multi-sentinct de surfaces translucides qui améliorent sa qualité et sa performance. Cet algorithme donne presque la même amélioration de la qualité, ainsi que le supercamplacement, mais diffère en haute performance - seulement quelques pour cent pires pour le régime sans la surface anti-aliasing translucide.

Purevideo HD.

L'un des changements attendus dans le G92 était le processeur vidéo de deuxième génération intégré, connu par G84 et G86, qui a reçu une prise en charge étendue pour Purevideo HD. Il est déjà connu que cette version du processeur vidéo décharge presque complètement la CPU lors du décodage de tous les types de données vidéo, y compris les formats "lourds" H.264 et VC-1.

Comme dans G84 / G86, le G92 utilise un nouveau modèle du processeur vidéo Purevideo HD programmable, qui comprend le moteur dit BSP. Un nouveau processeur prend en charge les formats de décodage H.264, VC-1 et MPEG-2 avec une résolution allant jusqu'à 1920x1080 et un débit binaire allant jusqu'à 30 à 40 Mbps, effectuant des travaux sur le matériel de décodage CABAC et CAVLC Data Data, ce qui vous permet de jouer Tous les disques HD-DVD HD-DVD et BLU existants, même sur une puissance de PC unique de taille moyenne. Le décodage VC-1 n'est pas aussi efficace que H.264, mais il est toujours soutenu par un nouveau processeur.

En savoir plus sur le processeur vidéo de deuxième génération peut être trouvé dans la partie sur les copeaux G84 et G86. Le travail des rapports vidéo modernes a été partiellement testé dans le dernier matériau pour étudier l'efficacité du décodage vidéo des données vidéo.

PCI Express 2.0

Dans ces innovations en G92, vous pouvez mettre en évidence le support du bus PCI Express 2.0. La deuxième version de PCI Express augmente la bande passante standard de deux reprises, passant de 2,5 Go / s à 5 Gbps, par conséquent, le connecteur X16 peut transmettre des données à une vitesse maximale de 8 Go / s dans chaque direction, contrairement à 4 Go. / s. Pour la version 1.x. Il est très important que PCI Express 2.0 soit compatible avec PCI Express 1.1 et les anciennes cartes vidéo fonctionnent dans de nouvelles cartes mères et de nouvelles cartes vidéo avec le support de la deuxième version resteront effectuées dans les charges sans support. Sous réserve de l'adéquation de la nutrition externe et sans augmenter la largeur de bande d'interface, naturellement.

Pour assurer une compatibilité ascendante avec les solutions PCI Express 1.0 et 1.1 existantes, Spécification 2.0 prend en charge à la fois un taux de transmission de 2,5 GB / S et 5 GB / S. La compatibilité en retard PCI Express 2.0 vous permet d'utiliser des solutions de 2,5 Gbps passées dans des emplacements de 5,0 Gbit / s qui fonctionnera à une vitesse inférieure et que le périphérique développé par la version 2.0 Spécifications peut prendre en charge une vitesse de 2,5 Gbps et 5 Go / s. Dans la théorie avec une compatibilité, tout va bien, mais dans la pratique avec certaines combinaisons de systémiques et de cartes d'expansion, des problèmes peuvent survenir.

Prise en charge des interfaces externes

Comme prévu, une puce Nvio supplémentaire sur les cartes GeForce 8800, prenant en charge les interfaces externes principales (deux 400 MHz Ramdac, deux dvi (ou LVDS), HDTV-OUT), dans ce cas, dans ce cas, a été inclus dans la puce elle-même. Toutes ces interfaces sont intégrées au G92 lui-même.

Sur GeForce 8800 GT Graphics, deux liens DVI-I de la prise en charge DVI-I avec support HDCP sont généralement installés. En ce qui concerne HDMI, le support de ce connecteur est entièrement mis en œuvre, il peut être effectué par les fabricants sur des cartes de conception spéciales pouvant être libérées légèrement plus tard. Bien que la présence du connecteur HDMI sur la carte vidéo soit complètement optionnelle, elle sera remplacée avec succès par l'adaptateur avec DVI sur HDMI, qui est inclus dans l'ensemble des cartes vidéo les plus modernes.

Contrairement aux cartes vidéo AMD Radeon HD 2000 Series, la GeForce 8800 GT ne contient pas de puce audio intégrée requise pour prendre en charge la transmission audio via DVI à l'aide d'un adaptateur vers HDMI. Cette possibilité de transmettre un signal vidéo et audio à un connecteur est à la demande, d'abord, sur les cartes moyennes et inférieures, installées dans de petits médias, et que GeForce 8800 GT est peu susceptible de s'acquitter de ce rôle.

Détails: G94, GeForce 9600 Famille

Spécifications G94

Nom du code Chip G94
Technologie 65 nm
505 millions de transistors
Architecture unifiée avec un éventail de processeurs courants pour la diffusion des sommets et des pixels, ainsi que d'autres types de données
Support matériel DirectX 10, y compris un modèle de shader - Modèle de shader 4.0, générant la géométrie et l'enregistrement de données intermédiaires de Shaders (sortie de flux)
Bus de mémoire de 256 bits, quatre contrôleurs indépendants 64 largeur de batte
Fréquence principale de 650 MHz (GeForce 9600 gt)
Alu fonctionne sur plus de la double fréquence (1,625 GHz à GeForce 9600 gt)
64 Point de flottement Alu Scalar Alu (entier et formats flottants, prise en charge de la précision FP 32 bits dans le cadre de la norme IEEE 754, MAD + MULL sans perte d'horloges)
32 bloc d'adressage de la texture avec le composant de support FP16 et FP32 dans les textures
32 bloc de filtrage bilinéaire (comme dans le G84 et le G92, il donne une quantité accrue d'échantillons bilinéaires, mais sans filtrage trilinéaire gratuit et filtrage anisotrope efficace)
La possibilité de branches dynamiques dans les chamaneurs de pixels et de sommets
4 blocs de roupies large (16 pixels) avec support pour les modes antipositions jusqu'à 16 échantillons par pixel, y compris au format tampon de cadre FP16 ou FP32. Chaque bloc consiste en une matrice d'alu flexiblely configurable et est responsable de la génération et de la comparaison de Z, MSAA, Mélange. Performances maximales de l'ensemble du sous-système à 64 échantillons de MSAA (+ 64 z) pour le tact, en mode sans couleur (z uniquement) - 128 Référence
Enregistrement des résultats jusqu'à 8 tampons de cadre en même temps (MRT)

Spécification de la carte de référence GeForce 9600 GT

Fréquence principale 650 MHz
Fréquence des processeurs universels 1625 MHz
Nombre de processeurs universels 64
Nombre de blocs de texture - 32, blocs de mélange - 16
Fréquence de mémoire efficace 1,8 GHz (2 * 900 MHz)
GDDR3 Type de mémoire Type
Capacité de la mémoire 512 mégaoctets
Bande passante de la mémoire de 57,6 gigaoctets par seconde.
Vitesse tormale maximale théorique 10.4 Gigapixel en sec.
Vitesse de sélection théorique des textures jusqu'à 20,8 GIGITXEL en SEC.
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
Consommation électrique jusqu'à 95 W
Prix \u200b\u200brecommandé 169-189 $

Architecture G94.

Du point de vue architectural, G94 diffère de G92 uniquement avec des caractéristiques quantitatives, il a un plus petit nombre de blocs de direction: Alu et TMU. Oui, et des différences G8X ne sont pas tant. Comme il a été écrit dans des matériaux précédents, la ligne de puce G9X est légèrement modifiée par la ligne G8X, traduite par un nouveau processus technique avec de petits changements architecturaux. La nouvelle puce mi-fin contient 4 grands blocs de shader (seulement 64 alu) et 32 \u200b\u200bblocs de texture, ainsi que quatre larges rops.

Ainsi, les changements architecturaux dans la puce sont un peu, presque tout est écrit ci-dessus et tous précédemment déclaré pour des décisions précédentes restent en vigueur. Et ici, nous donnons uniquement le diagramme principal de la puce G94:

Les blocs de texture dans le G94 sont exactement les mêmes que dans le G84 / G86 et le G92, ils savent choisir deux fois plus grand que des échantillons filtrés bilinéré de la texture, par rapport au G80. Mais 32 Les blocs de texture GeForce 9600 GT dans des applications réelles ne fonctionneront pas plus rapidement que 32 blocs de GeForce 8800 GTX uniquement en raison de la fréquence de fonctionnement GPU plus importante. Cela ne peut être observé que lorsque le filtrage trilinéar et anisotrope est éteint, qui est extrêmement rare, uniquement dans ces algorithmes dans lesquels il est utilisé, par exemple, dans la cartographie de Parallax.

Un autre avantage de G9X et de GeForce 9600 GT en particulier, NVIDIA considère une nouvelle technologie de compression mise en œuvre dans des blocs de rops, ce qui, selon leur évaluation, fonctionne de 15% de plus efficacement pour être utilisé dans des puces précédentes. Apparemment, ce ne sont que des mêmes modifications architecturales de G9X, conçues pour assurer une plus grande efficacité du bus de mémoire 256 bits, contre 320/384-Bit, que nous avons écrites plus tôt. Naturellement, dans de vraies applications, une telle grande différence ne sera pas, même selon la NVIDIA, l'augmentation des innovations dans ROP est la plus souvent environ 5%.

Malgré toutes les modifications de l'architecture G9X, en ajoutant la complexité de la puce, sur laquelle nous allons toujours parler ci-dessous, le nombre de transistors dans la puce est assez important. Cette complexité du GPU est probablement due à l'inclusion d'une puce Nvio NVIO, un nouveau processeur vidéo de nouvelle génération, une complication des blocs TMU et ROP, ainsi que d'autres modifications cachées: modifier la taille des caches, etc.

Purevideo HD.

Le G94 construit dans le même processeur vidéo de deuxième génération, connu par G84 / G86 et G92, caractérisé par une prise en charge améliorée de Purevideo HD. Il décharge presque complètement la CPU lors du décodage des types de données vidéo les plus courants, y compris H.264, VC-1 et MPEG-2, avec une résolution à 1920x1080 et un débit binaire jusqu'à 30 à 40 Mbps, effectuant une opération de décodage complètement du matériel. Et bien que le décodage VC-1 dans les solutions NVIDIA ne soit pas aussi efficace que H.264, une petite partie du processus utilise la puissance du processeur central, mais il vous permet toujours de lire tous les DVD HD existants et les disques Blu-ray, même sur des ordinateurs de taille moyenne. Pour plus d'informations sur le processeur vidéo de deuxième génération, vous pouvez lire nos avis G84 / G86 et G92, les références auxquelles sont présentés au début de l'article.

Eh bien, nous notons les améliorations du programme de Purevideo HD, qui se sont limitées à la libération de la GeForce 9600 GT. Dans les dernières innovations, Purevideo HD peut être noté décodage à double sens, changement dynamique de contraste et saturation des couleurs. Ces modifications ne sont pas exclusivement pour la GeForce 9600 GT et dans les nouvelles versions des pilotes, commençant par Forceware 174, elles sont entrées pour toutes les puces prenant en charge l'accélération matérielle complète à l'aide de Purevideo HD. En plus des cartes graphiques à l'étude d'aujourd'hui, cette liste comprend: GeForce 8600 GT / GTS, GeForce 8800 GT et GeForce 8800 GTS 512.

L'amélioration de contraste dynamique est assez couramment utilisée dans les appareils ménagers, dans les téléviseurs et les lecteurs vidéo, il peut améliorer l'image avec l'exposition non optimale (combinaison d'exposition et de diaphragmes). Pour cela, après avoir décodé chaque image, son histogramme est analysé et si le cadre a un contraste infructueux, l'histogramme est recalculé et appliqué à l'image. Voici un exemple (à gauche - l'image initiale, droite - traitée):

À peu près la même chose s'applique à l'amélioration dynamique de la saturation des couleurs apparu dans Purevideo HD. Les appareils ménagers appliquent également une longue période d'algorithmes d'image d'amélioration, contrairement aux moniteurs informatiques, qui reproduisent tout, ce qui, dans de nombreux cas, peut provoquer une image trop terne et non vivante. Balance automatique du composant de couleur dans les données vidéo, calculée également chaque nouveau cadre, améliore la perception de la photo par une personne, ajustant la saturation de ses couleurs:

Le décodage à deux flux vous permet d'accélérer le décodage et le post-traitement de deux flux de données vidéo différents en même temps. Cela peut être utile lors de l'affichage dans de tels modes comme "image in-image", qui sont utilisés dans certains DVD Blu-ray et HD (par exemple, la seconde image peut afficher le directeur du film, qui donne à leurs commentaires à La scène présentée dans la fenêtre principale.), De telles caractéristiques sont équipées de publications de la guerre et du film Evil Resident: Extinction.

Une autre innovation utile de la dernière version de Purevideo HD a été la possibilité de travailler simultanément la coquille Aero dans le système d'exploitation Windows Vista lors de la lecture de la vidéo accélérée du matériel dans le mode Window, qui n'était pas possible auparavant. Pour ne pas dire que ces utilisateurs très inquiets, mais la possibilité est agréable.

Prise en charge des interfaces externes

Prise en charge des interfaces externes sur GeForce 9600 GT est similaire à celle de GeForce 8800 GT, à l'exception du support DisplayPort intégré qui apparaît, sauf. La puce NVIP supplémentaire de NVIO disponible supportant les principales interfaces externes du G94 également incluses dans la puce elle-même.

Les cartes de référence GeForce 9600 GT sont installées deux sorties DVI à double liaison avec support HDCP. Le support HDMI et DisplayPort est mis en œuvre du matériel dans la puce, et ces ports peuvent être exécutés par NVIDIA Partners sur des cartes de conception spéciales. De plus, comme l'assure Nvidia, contrairement à G92, la prise en charge de DisplayPort est maintenant intégrée à la puce et aux émetteurs externes ne sont pas nécessaires. En général, les connecteurs HDMI et DisplayPort sur la carte vidéo sont facultatifs, ils peuvent être remplacés par des adaptateurs simples de DVI sur HDMI ou DisplayPort, qui rencontre parfois des cartes vidéo modernes.

Détails: G96, GeForce 9400 et 9500 familles

Spécifications G96

Nom du code Chip G96
Technologie 65 nm
314 millions de transistors
Architecture unifiée avec un éventail de processeurs courants pour la diffusion des sommets et des pixels, ainsi que d'autres types de données
Support matériel DirectX 10, y compris un modèle de shader - Modèle de shader 4.0, générant la géométrie et l'enregistrement de données intermédiaires de Shaders (sortie de flux)
Bits 128 bits du bus de mémoire, deux contrôleurs indépendants 64 bits large
Fréquence principale 550 MHz
Alu fonctionne sur plus de la double fréquence (1,4 GHz)
32 Point de flottation scalaire Alu (entier et formats flottants, prise en charge de la précision de la FP 32 bits dans le cadre de la norme IEEE 754, MAD + MULL sans perte d'horloges)
16 blocs d'adressage de la texture avec prise en charge du composant FP16 et FP32 dans les textures
16 pâtés de maisons de filtrage bilinéaire (comme pour le G92, il donne une quantité accrue d'échantillons bilinéaires, mais sans filtrage trilinéaire gratuit et filtrage anisotrope efficace)
La possibilité de branches dynamiques dans les chamaneurs de pixels et de sommets
2 bloc de roupies large (8 pixels) avec support pour les modes anti-aliasing jusqu'à 16 échantillons par pixel, y compris au format tampon de cadre FP16 ou FP32. Chaque bloc consiste en une matrice d'alu flexiblely configurable et est responsable de la génération et de la comparaison de Z, MSAA, Mélange. Performances maximales de l'ensemble du sous-système jusqu'à 32 échantillons de MSAA (+ 32 z) pour le tact, en mode sans couleur (z uniquement) - 64 Référence
Enregistrement des résultats jusqu'à 8 tampons de cadre en même temps (MRT)
Toutes les interfaces (deux RAMDAC, deux DIAL DVI, HDMI, DisplayPort) sont intégrées à la puce

Spécification de la carte de référence GeForce 9500 GT

Fréquence principale 550 MHz
Nombre de processeurs universels 32
Nombre de blocs de texture - 16, blocs de mélange - 8
Fréquence de mémoire efficace 1,6 GHz (2 * 800 MHz)
GDDR2 / GDDR3 Type de mémoire
Capacité de la mémoire 256/512/1024 mégaoctet
Vitesse de sélection théorique des textures jusqu'à 8,8 gîtes en SEC.
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support pour HDMI et DisplayPort avec HDCP

Spécification de la carte de référence GeForce 9400 GT

Fréquence principale 550 MHz
Fréquence des processeurs universels 1400 MHz
Nombre de processeurs universels 16
Nombre de blocs de texture - 8, blocs de mélange - 8
Fréquence de mémoire efficace 1,6 GHz (2 * 800 MHz)
Type de mémoire GDDR2
Capacité de la mémoire 256/512 mégaoctets
Bande passante de la mémoire de 25,6 gigaoctet par seconde.
Vitesse tormale maximale théorique 4.4 gigapixel en sec.
Textures d'échantillon d'échantillonnage théorique jusqu'à 4.4 GIGATIONXELS en Sec.
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support pour HDMI et DisplayPort avec HDCP

Architecture G96.

Architectural G96 - exactement la moitié de la puce G94, qui diffère à son tour de G92 uniquement avec des caractéristiques quantitatives. G96 deux fois le nombre de tous les blocs de direction: Alu, TMU et ROP. La nouvelle puce vidéo est conçue pour des solutions de la gamme de prix la plus basse et dispose de deux grands blocs de shader (seulement 32 alu) et de 16 blocs de texture, ainsi que huit rops. Il couvre également le bus de la mémoire, avec un 256 bits à 128 bits, le cas échéant avec le G94 et le G92. Toutes les fonctionnalités matérielles sont restées inchangées, des différences que dans la performance.

Détails: G92B, GeForce GTS 200

GeForce GTS 250 Carte de référence Spécifications de la carte vidéo

Fréquence principale 738 MHz
Fréquence des processeurs universels 1836 MHz
Nombre de processeurs universels 128
Nombre de blocs de texture - 64, blocs de mélange - 16
Fréquence de mémoire efficace 2200 (2 * 1100) MHz
GDDR3 Type de mémoire Type
Capacité de la mémoire 512/1024/2048 mégaoctet
Bande passante de la mémoire 70,4 gb / s
Taux de rideau maximum théorique de 11,8 gigapixels en sec.
Taux de sélection théorique des textures jusqu'à 47,2 GIGATIONXEXEX EN SEC.
Deux connecteurs DVI-I Dual Link, appuyé la conclusion en permis jusqu'à 2560x1600
Connecteur Double SLI
Pneu PCI Express 2.0
TV-OUT, HDTV-OUT, Support HDCP, HDMI, DisplayPort
Consommation électrique jusqu'à 150 W (un connecteur à 6 broches)
Exécution de deux feuilles
Prix \u200b\u200brecommandé 129 $ / 149 $ / 169 $

En général, cette "nouvelle" carte vidéo basée sur 55 nm Chip G92 ne diffère pas de GeForce 9800 GTX +. La sortie d'un nouveau modèle peut être partiellement justifiée par l'installation de la mémoire vidéo et non de 512 mégaoctets vidéo, comme dans 9800 GTX + et des gigaoctets, qui affecte grandement la productivité des modes lourds avec des réglages de qualité maximale, des autorisations élevées avec le lissage plein écran. . Et il y a encore deux options à deux échelles, mais c'est un avantage marketing plus que le vrai.

Dans de telles conditions, les versions senior de GeForce GTS 250 devraient vraiment être considérablement plus rapides que la GeForce 9800 GTX + en raison de la quantité de mémoire accrue. Et certains des jeux les plus modernes recevront un avantage non dans les plus hautes autorisations. Tout ce qui n'est rien, mais seulement après tout, certains fabricants de cartes ont libéré une geforce 9800 GTX + avec un gigaoctet de mémoire, même plus tôt ...

La production de copeaux vidéo G92B pour les normes technologiques de 55 nM et une simplification notable de la conception PCB a permis à Nvidia de faire une solution similaire à celle de GeForce 9800 GTX en fonction des caractéristiques, mais avec moins de prix et de la consommation d'énergie réduite et de la production de chaleur. Et maintenant, afin de fournir à GeForce GTS 250 avec une alimentation, un seul connecteur d'alimentation PCI-E à 6 broches est installé sur la carte. C'est toutes les principales différences entre 9800 gtx +.

La carte vidéo de 9800 gt de Nvidia est une continuation logique de la carte 8800GT. Deux produits de fabrication ont des paramètres presque identiques. La principale différence entre 9800GT du modèle précédent consistait à soutenir la technologie hybridepuger. Il n'y a pas d'autres modifications. Le processeur graphique de la carte est étiqueté G92-270. Le modèle 8800 est également possédé. La micropuce a une révision A2, comme auparavant. Les cartes vidéo 9800 GT ont une fréquence d'horloge des caractéristiques restent au même niveau: 601/1512 MHz.

Spécifications 9800 GT

En termes techniques, les frais de 9800 gt n'ont subi aucun changement majeur depuis le modèle 8800.

Paramètres de carte vidéo:

GPU: G92.
Mémoire vidéo: 512 Mo.
Bus de mémoire: 256bit.
Fréquence du processeur graphique: 601/1512 MHz.
Blocs de textures: 56.
ROP: 16 blocs.
La fréquence effective sur laquelle la mémoire du paiement vidéo fonctionne: 1800 MHz.
Processeurs universels (noyaux): 112.
Technologies uniques prises en charge: puissance hybride.
Pneumatique et autres interfaces de communication: PCI-E 2.0X16 / 2xDVI / S-Video. HDMI est pris en charge en présence d'un adaptateur.

Quelles tâches vous permet de résoudre une carte vidéo de 9800 gt

La carte vidéo présentée s'oppose bien aux jeux de la génération précédente. Si l'utilisateur ne remplace pas de nouveaux éléments, cela conviendra sans aucun doute à 9800 GT. Caractéristiques de la carte vous permet d'exécuter de tels jeux comme "Witcher 2", S.T.A.L.K.R.R, Crysis 2, Space mort 3 et autres. Fallout NOUVEAU VEGAS, au fait, avec cette cotisation va également sans problème. Mais la quatrième version du projet légendaire ne sera pas lancée.

Des tireurs modernes et des autostimulants libérés après 2013, la carte vidéo ne tirera pas non plus. Les exceptions sont, mais très rare. Un utilisateur assez confortable se sent lorsque vous travaillez avec des graphiques et des informations vidéo, en regardant des films en haute résolution. Si une personne n'est pas un photographe professionnel ou une concepteur 3D qui a besoin de la vitesse maximale de travail, la carte vidéo de 9800 GT convient parfaitement à celle-ci.

Carte vidéo avantages et contre

Le conseil à l'étude a un certain nombre d'avantages qui le font que l'utilisation est toujours pertinent. Bien que les décisions des contre soient également.

Quels avantages ont 9800 gt? Les caractéristiques du modèle indiquent qu'ils sont beaucoup beaucoup.

La carte vidéo prend en charge le mode SLI. Vous pouvez acheter 4 frais à la fois et les combiner dans un groupe en améliorant une augmentation significative de la productivité.
La carte fournit un soutien à la technologie Physx. Il sert à reproduire des effets spéciaux supplémentaires dans les jeux. Il convient de noter que la performance globale de la carte vidéo tombe sensiblement. Pour niveler cet effet, le fabricant recommande d'utiliser un accélérateur de Physx en surbrillance supplémentaire qui complétera les frais principaux.
Avec l'aide d'utilitaires spéciaux, il est possible d'améliorer les performances standard de NVIDIA 9800 GT, le soulevant de 5 à 15%. L'indicateur spécifique dépend des désirs de l'utilisateur et des capacités du système de refroidissement de la carte. Une fois overclocké, vous devez surveiller avec précaution la température de fonctionnement de l'appareil pour éviter une surchauffe excessive et, par conséquent, des pannes.

Désavantages:

est une solution obsolète;
caractéristique efficacité limitée dans les calculs universels;
sur la douceur de la lecture Blu-ray de disques et de rouleaux en tant que HD placée sur Internet influencera largement la puissance de la CPU centrale (en plus du processeur de paiement vidéo);
faible niveau de rendement 9800 GT, les caractéristiques du carton ne permettent pas de courir Jeux publiés après 2013;
consommation d'énergie relativement élevée;
performances de carte vidéo insuffisantes lorsque vous travaillez avec des effets supplémentaires physiques.