|
Écrit par adminWPS
|
|
11-03-2007 |
|
Cet
article est dédié essentiellement pour faire une mise au point sur ce
que l'on sait à l'heure actuelle des GPUs "next gen" (de prochaine
génération en francais) et de DirectX 10.
Dans cet article certaines
informations divulguées n'ont pas encore été vérifiées. En
effet, ATI n'ayant pas encore sorti son R600, n'a pas encore donné
beaucoup d'informations à ce sujet. On supposera donc que ces
informations sont vraies du moment ou on pourra les justifier ou
effectuer un lien logique avec les technologies actuelles utilisées par
chaque fondeur. On notera que la gamme du R600 devrait
s'appeler, en théorie Radeon X2k, cependant aucune précision de la part
d'ATI à ce sujet n'a été communiquée.
MAJ
: A l'heure d'aujourd'hui des caractéristiques ont été confirmées par
la nouvelle firme ATI/AMD. Le noms de ces caractéristiques sont suivi
d'une "*". Le reste des
caractéristiques devraient être précisé d'ici 15 jours. Quand aux
caractéristiques des GeForces 8, elles sont déjà connues.
Comme le
veut la tradition sur WPS on va essayer de comparer les
caractéristiques sur les 2 très haut de gamme de chaque fondeur.
Description
|
GeForce 8800 series
|
Radeon X2900 series
|
Nom de code *
|
G80
|
R600
|
Nombre de transistors *
|
680millions
|
700 millions
|
Gravure *
|
90nm
|
80nm
|
Fréquence GPU
|
575MHz
|
>= 700MHz
|
Fréquence interne GPU
|
1350MHz
|
-
|
Unités de shaders unifiés
|
128
|
320 (sur 64 pipes)
|
Unités de texturing
|
32
|
16
|
Type de mémoire *
|
GDDR3
|
GDDR3/GDDR4
|
Fréquence mémoire (DDR)
|
1800MHz
|
2400MHz
|
Capacité mémoire *
|
768 Mo
|
1024Mo
(soit 1Go)
|
Interface mémoire *
|
384 bits
|
512 bits
|
Bande passante mémoire
|
86.4Go/s
|
128Go/s
|
Version du DirectX *
|
10
|
10
|
Version de l'OpenGL *
|
2.0
|
2.0
|
|
Type de sortie *
|
DVI
|
HDMI 1.3
|
|
Longueur de la carte *
|
27 cm
|
24 cm
|
- Mise au point sur DirectX 10
DX10...comment ca fonctionne?
DirectX
10 devrait être très différent des versions précédentes. En effet cette
version comportera des librairies spécifiques dédiées. DirectX 10
n'utilisera donc pas les librairies DirectX 9 et n'aura aucun lien avec
ce deriner. Afin de mieux comprendre comment ca se passe d'un point de
vue hardware on va décomposer les fonctions DirectX.
DirectX 9 fonctionne grâce à 3 types d'unités différentes :
* Texturing
* Pixel Shader (PS)
* Vertex Shader (VS)
Sous DX10, il y a 2 types d'unités possibles :
* Texturing
* Shaders unifiés comportant :
Pixel Shader (PS)
Vertex Shader (VS)
Geometry Shader (GS)
Qu'est ce que les unités de shaders unifiés?
On
peut considérer les shaders unifiés comme un nouveau type de gestion
des unités. Plutot que de créer des unités spécialisées pour chaque
type, ATI en partenariat avec Microsoft ont inventé les shaders
unifiés. Ces unités sont généralistes et peuvent effectuer n'importe
quel type de calcul shader spécifique (PS, VS ou GS). Ainsi grâce à ces
unités on peut effectuer des calculs permettant la correction des
couleurs sur les pixels (pixels shaders), des calculs permettant les
mouvements (vertex shaders) et enfin la nouveauté pour décharger la
partie vertex, des calculs permettant le relief sur objets appellé
Geometry Shaders. Le système de shaders unifiés peut être utilisé aussi
bien sous DX9 que sous DX10. La XBOX360 possède déjà un GPU ATI
utilisant les shaders unifiés et pourtant étant en DX9. Les shaders
unifiés ont été créés avant tout dans le but d'utiliser pleinement
toutes les unités de calculs car dans une scène 3D on a pas toujours
besoin de toutes ses unités de vertex ou de pixels shaders. On ne
parlera pas du Geometry Shader étant donné que ce type est né avec les
shaders unifiés et DirectX 10.
Exemple pour mieux comprendre les shaders unifiés:
J'effectue 3 calculs de PS et 20 calculs de VS le tout en simultané.
On admet que l'on possède une carte quelconque possédant 24 unités de texturing, 20 unités de PS et 8 unités de VS.
En Shaders non unifiés cela donne :
PS : 3 calculs nécessaires alors que j'ai 20 unités. On peut donc effectuer tous les calculs.
VS
: 20 calculs nécessaires alors que j'ai 8 unités. Il faudra attendre un
3eme cycle d'horloge pour effectuer le dernier calcul.
En shaders unifiés cela donne :
On
possede un nombre 20+8 = 28 unités de calculs alors que j'ai 3+20 = 23
calculs à effectuer. Les 23 calculs sont inférieurs aux 28 unités
utilisables en 1 cycle, on peut donc réaliser tous les calculs en un
seul cycle contrairement aux shaders non unifiés.
- La position de nVidia
La nouvelle architecture de carte graphique
Les
GeForces 8800 possèdent une architecture différente des actuelles
GeForces 6 et 7. On notera que sur les GeForces 6 et 7, les unités de
texturing sont liées aux unités de pixels shaders.
Les GeForces 8 se
basent sur les principes des actuelles Radeon X1k. Ainsi nVidia
découple les unités de texturing avec le reste des unités et passe à un
rapport de 4:1 (unités de shaders unifiés/unités de texturing). Les
actuelles GeForces 7 possèdent 6 cores et traitent sur 4 pixels. On
notera que 4 pixels est la base et que chacun de ces pixels est un
vecteur de 4 composantes (RGBA soit rouge, vert, bleu et luminance). On
notera que l'information sur les pixels n'est pas forcément une
couleur. Cependant, les GeForces 8 possedent 8 cores et permettent de
traiter sur 16 pixels (4 * 4 pixels).
Le bus mémoire
La
GeForce 8800GTX traite ces données sur un bus de 384 bits se qui
correspond à 256 bits + 128 bits. On va essayer d'analyser pourquoi un
tel bus. La GeForce 8800 possedent 12 puces mémoires sur la carte et
chaque puce possede 64 Mo et est adressable sur 32 bits.
Ainsi si on réalise les calculs on obtient pour :
* La capacité mémoire :
capacité d'une puce * nombre de puces = 64 * 12 = 768Mo
* Le nombre de bits total :
nombre de bits adressables * nombre de puces = 32 * 12 = 384 bits
La mémoire
nVidia
n'ayant pas encore abouti à un contrôleur mémoire pouvant supporter la
GDDR4, le G80 se voit donc accompagner de GDDR3 900MHz (1.8GHz DDR) en
1.1ns.
D'ou la bande passante :
nb bits/8 * fréquence mémoire (en GHz) = 384/8 * 1.8 = 86.4Go/s.
Cependant
nVidia devrait nous gratifier d'ici peu d'un G81 supportant la GDDR4.
Il est donc à prévoir une augmentation de la bande passante sur ce qui
devrait être une GeForce 8900.
- La position d'ATI

Le nombre de transitors encore flou
Le
nombre de transistors du GPU devrait être inférieur à une GeForce 8800
series contenant près de 700 millions de transistors. Cependant la
dernière information à ce sujet fait état de 720 millions de
transistors pour le R600.
La nouvelle architecture de carte graphique
Les
actuelles Radeons X1k possedent un rapport de 3:1 (unités de shaders
unifiés/unités de texturing) et traitent sur 12 pixels (3 * 4 pixels).
Les
Radeon X2k devraient posseder comme la GeForce 8 d'un rapport de 4:1
soit un traitement sur 16 pixels (4 * 4 pixels). Elles ne devraient
avoir 8 cores, on obtient 8 * 16 = 128 unités.
Le Ring Bus
ATI
garde son bus principal de communication entre les différentes unités,
j'ai nommé le ring bus (bus en anneau en francais). Cependant ATI
compte bien l'améliorer. En effet, les radeon X1k possèdent un ring bus
de 512 bits.
En
réalité il s'agit de 2 bus de 256 bits tournant en sens opposés afin de
prendre le chemin le plus court quand 2 unités communiquent ensemble.
Les Radeon X2k devraient disposer d'un ring bus de 1024 bits soit 2 *
512 bits. Ce ring bus permettrait ainsi d'apporter un traitement
efficace des filtrages de haut niveau.
Le bus mémoire
Rien
ne devrait changer quant à la structure du bus mémoire il sera de 512
bits puisque ATI ayant décidé de relier les puces mémoires en full
c'est à dire sur 32 bits pour chaque puces. Par conséquent, la Radeon
X2k haut de gamme devrait disposer de 16 puces mémoire.
La mémoire
ATI
dispose déjà de mémoire de type GDDR4 sur son R580+, donc logiquement
la GDDR4 devrait être de la partie. Seulement ATI devrait opter pour un
modèle plus rapide. Cependant, les premières cartes à sortir devraient
avoir de la GDDR3. On ne sait toujours pas s'il s'agit de mémoire à
1.2GHz (2.4GHz DDR) ou de mémoire à 1.4GHz (2.8GHz DDR) ou même de
mémoire Samsung à 2GHz (4GHz DDR). Samsung ayant fait état de cette
mémoire très récemment. Cependant ATI (aux dernières nouvelles mais
sans confirmation) fait état d'une bande passante de 128Go/s.
Si on prend une fréquence de 2.4GHz :
nb bits/8 * fréquence mémoire (en GHz) = 512/8 * 2.4 = 153.6Go/s
Si on prend une fréquence de 2GHz :
nb bits/8 * fréquence mémoire (en GHz) = 512/8 * 2 = 128Go/s.
Quoiqu'il en soit il y a donc fort à parier que cette bande passante était destinée pour les premières cartes en GDDR3.
- Conclusion
Comme on peut le constater les GPUs DX10 devraient apporter beaucoup, aussi bien en hardware qu'en software. L'apparition du Geometry Shader et aussi des shaders unifiés devraient permettre aux développeurs d'améliorer et d'optimiser leurs codes.
Selon certaines sources ATI finaliserait encore son GPU et ses cartes afin d'en réduire la taille et aussi pouvoir augmenter les fréquences du core (on parle d'un minimum de 800MHz et que des tests ont été fait à 1.2GHz sur le core). Comme on a pu le constater beaucoup d'informations manquent pour définir les réelles caractéristiques du GPU. Cependant certaines informations sont des rumeurs et peuvent être vraies comme fausses. Il est a noté que les déclinaisons bas et milieu de gamme du R600 devraient apparaitre plus tard et que les versions haut de gamme de apparaitre en mars/avril 2007 pour la version GDDR3 et au mois de mai pour la version GDDR4. ATI promet un GPU stable et plus puissant que la conccurence. Le récent rachat de la firme a t il quelque chose avoir avec ce retard. Les performances seront t elles boustées grâce au département R&D d'AMD.
nVidia quand a eux, choisissent de sortir le haut de gamme en avance et la firme compte bien rester indépendante. ATTENTION comme je l'ai précisé avant, GPU DirectX 10 ne veut pas dire incompatible avec DirectX 9. Cependant aucune plateforme actuelle ne prend en compte DirectX 10 et ce, pas avant la sortie officielle de windows Vista (Janvier 2007). MAJ : il est à noter que les drivers DX10 posent toujours problèmes et nVidia sort un driver chaque mois pour parer ce problème.
Il est a noté que les déclinaisons bas et milieu de gamme, respectivement G84 et G86, devraient apparaitre en mars/avril 2007. A l'heure ou j'écris la version professionnelle (Quadro FX5600 et 4600) pointent le bout de leurs nez.
(0) |