パソコン工房
パソコン工房ビジュアライズノート
パソコン工房










上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
[ --/--/-- --:-- ] スポンサー広告 | TB(-) | CM(-)

GeForceとRadeonの違いとは? 現行と次世代でどう変わる? Radeon編

次はRadeon
こっちも同じく現行のRadeon(VLIW4)から

現行のRadeonはCayman(VLIW4)、Barts(VLIW5)と2種類あります
とりあえずCayman(VLIW4)の概要図から ※サムネイル画像をクリックで拡大します
cayman.jpg
GeForceとは違い、RadeonではSIMD Engineクラスタ(アレイ)で構成されてます
2つのSIMD Engineクラスタと言う構成なので2コアのようなものだと言って良いでしょう。
1基のSIMD EngineクラスタにはSIMD Engineが12基搭載されており
SIMD Engine1基辺りに16基のVLIW4プロセッサが搭載されてます
SIMD EngineそれぞれにL1キャッシュなどが接続されており、
SIMD EngineクラスタにはGraphics EngineとL2キャッシュ、メモリコントローラーなどが繋がってます。
VLIW4プロセッサはBranch Unit1基、SPが4基という構成になってます
以前のアーキテクチャで使われたVLIW5では更にSFUが1基搭載されていました。
VLIW4ではSFUの役割を他に振り当てたのでSFUは搭載されていません。

ここで整理すると
Cayman(VLIW4) HD6970など
・VLIW4プロセッサ:SP数4
・1SIMD Engine:VLIW4 16基、SP数 64
・1SIMD Engineクラスタ:SIMD Engine12基、テッセレータ1基、VLIW4 192基、SP数 768
・2SIMD Engineクラスタ:SIMD Engine24基、テッセレータ2基、VLIW4 384基、SP数 1536

Radeonは最初からフルスペックで出てるのでHD6970は1536SPになってます。
そこから派生するのはどちらも一緒ですね。
ミドルレンジ~ローエンドでは以前のVLIW5を採用してるのが違いですかね。
上で説明したとおりSIMD EngineクラスタにはGraphics Engineが1基あるんですが
VLIW5では2SIMD EngineクラスタでGraphics Engine1基でした。
また、Graphics Engineにテッセレータが内蔵されているので
テッセレータの数で言えば最大でも2基となります。


では、ここでもう再度GF110の図
GF110.jpg
図で見ると分かりやすいかと思いますが、同じGPUでもアーキテクチャは別物です。
これが現行のGeForce、Radeonの大きな差と言えるでしょう。

キャッシュ階層、内部バスも大きく異なり、この辺はGeForceの方が高性能になってます。
その分、アンコア部分が増えているので実際に演算を行うSIMD(CUDA Core)の占める比率が少なくなってます
一方でRadeonはアンコア部分の改良は小改良に留めているので
ダイ全体での演算効率が良いともいえます

ただし、それはグラフィック用途向けの単精度演算の話で
GPGPU向けの倍精度演算ではGeForceの方が優れた性能を出します。
これはRadeonのVLIW4が4基のSPで倍精度演算を行うのに対し
GeForceのCUDA Coreは全て倍精度演算を行えます(GF114、104では単精度専用の比率が増えた)
Radeonでは倍精度演算1/単精度演算4と言うスループット比になり
GeForce(GF110)では命令発行に制約があるとはいえ、
倍精度演算1/単精度演算2と言うスループット比になっており倍精度演算能力の高さが分かります
GF114では単精度の比率を増やした為、Radeonと同じく
倍精度演算1/単精度演算4と言うスループット比になりグラフィック性能が効率よく上がってます
この倍精度/単精度のスループット比は今後も注目点になると思われます


参考記事
AMD,Northern Islands世代のハイエンドGPU「Radeon HD 6900」を発表。コアアーキテクチャの刷新がキモ
AMDの新フラッグシップGPU「Radeon HD 6970」のアーキテクチャ
AMD「Cayman」はなぜマルチコア+VLIW 4になるのか
独自構造となる次期AMDハイエンドGPU「Cayman」
AMDの新GPU「Radeon HD 6800」のアーキテクチャ

では、最後に次世代Radeonの新アーキテクチャについて
AMDの次世代GPUは年内に「出荷開始」。複数ラインナップで次世代アーキテクチャを採用
見えてきたAMDの次世代GPUアーキテクチャ。なぜAMDはVLIWを捨てるのか
AMDが革新的な次世代GPUアーキテクチャの概要を発表

主な特徴は以下の通り
・VLIWアーキテクチャから一新。SIMD方式へ変更
・Southern Islands(HD7000)の上位モデルで,次世代GPUアーキテクチャを採用
・2012年の次次世代GPU Central Islandsでメインストリームまで展開
・2013年にはFusion APUで採用
・ハイエンドクラスのGPUにシンプルなCPUを統合する,“GPU版Fusion”という可能性も
・最小単位はCompute Unit(CU)
 構成は16-wayベクトル演算器をまとめたSIMD Unitを4基&スカラ演算ユニット1基
・ベクトル演算器は浮動小数点積和算、整数演算、64bit倍精度演算、超越関数演算をサポート
・フル機能のスカラ演算機によってオーバーヘッドの解消
・L1データキャッシュ:16KB
・L2キャッシュ:64KB ライトスルー&ライトバック
・4基のCUで共有する命令キャッシュ:32KB
・4基のCUで共有するスカラユニット専用L1キャッシュ:16KB
・GPUとCPUで同じ64bitポインタでメモリアクセスが可能

GF110と似たように1CU→4CUと言った括りになりそうです。
GF110ではSFUで超越関数演算などをサポートしているのに対し、
新アーキテクチャでは全てSIMD Unitでサポートしている点も違いますね
Wavefrontが64スレッドのままなので、グラフィックの効率も良く
GPGPUとグラフィック性能のバランスが取れていると解説されています
ですが、GeForceのSMよりRadeonのCUの方が大きくなるとの予測や
内部バス、メモリ階層に手を加えたので、以前のように単純に効率よく性能が上がらない
(GeForceよりSP数がかなり多い)と言う風にはなりません。

新しいアーキテクチャのRadeonはGeForceに近くなってはいますが
SMとCUで異なる点が多いので、実際の性能はどうなるのか依然として分からないと言うのが結論でしょうか。
大きくアーキテクチャが変われば予測もしにくいので。。
両者ともに28nmの新アーキテクチャが楽しみですね
関連記事
[ 2011/11/26 22:03 ] AMD GPU | TB(0) | CM(0)

コメントの投稿













管理者にだけ表示を許可する

トラックバック:

この記事のトラックバック URL
http://pcniigata.blog.fc2.com/tb.php/45-341053ff










上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。