パソコン工房
パソコン工房ビジュアライズノート
パソコン工房










上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
[ --/--/-- --:-- ] スポンサー広告 | TB(-) | CM(-)

GeForceとRadeonの違いとは? 現行と次世代でどう変わる? GeForce編

まずは現行のGeForceから

現行のGeForceはGF110、GF114と2種類あります
とりあえずGF110の概要図から ※サムネイル画像をクリックで拡大します
GF110.jpg
赤い枠で囲ったのをGPCと呼びます。GPCは4基のSMで構成されてます。
そのSM(Streaming Multi-Processor)は32CUDA coreで構成されてます。
つまり、1GPCはSM4基×32CUDA Coreとなり1GPCで128CUDA core
4GPCで512CUDA coreとなります。
テクスチャユニットは1SM辺り4基積んでるので、4GPCだと64テクスチャユニットを搭載することになります
テッセレータは1SM辺り1基なので、4GPCだと16基ということになります

ここで整理すると
GF110(GTX580、GTX570など)
・1SM:テッセレータ1基、テクスチャユニット4基、32CUDA core
・1GPC:4SM、テッセレータ4基、テクスチャユニット16基、128CUDA core
・4GPC:16SM、テッセレータ16基、テクスチャユニット64基、512CUDA core

GF100では一部を無効にしていたので、GTX480だとこの通りにはなりませんでした。
GF110でフルスペックで出せるようになったので、GTX580はこの通りのスペックになってます
GF110を使ったラインナップはGPCやSMを無効にしてるVerとなります。


GF104、GF114はミドルレンジ~ローエンド用のコアです。
大きな違いとしてはSMの構成がGF110とは大きく異なることです。
SM1基辺り、32CUDA coreだったのをGF114では48CUDA coreに変更されています
他にSFUを4個、テクスチャユニットを4個増加されてます
SM、GPCとしては大きくなってますが、GF114のラインナップは2GPCまでになっているので問題ありません。
また、命令発行を2から4に増加させてIPCを向上させています
更に48CUDA core全てを倍精度演算に対応するのではなく、
32CUDA Coreを単精度演算専用。残りの16CUDA Coreを倍精度演算に対応させてます
この変更点はGPGPU向けからグラフィック用途向けに最適化した結果です。
グラフィック用途では倍精度演算よりも単精度演算の性能を求められるからです。

GF114(GTX560Tiなど)
・1SM:テッセレータ1基、テクスチャユニット8基、48CUDA core
・1GPC:4SM、テッセレータ4基、テクスチャユニット32基、192CUDA core
・4GPC:16SM、テッセレータ16基、テクスチャユニット64基、384CUDA core
こちらもGF110と同様にGF104ではフルスペック版は出ず、GF114でフルスペック版が登場しました


他にも色々記載する点は多いのですが、とりあえず現行のGeForceをまとめると
GPGPUで高い性能を発揮する為にGF110(GTX580など)では全てのCUDA Coreを倍精度演算に対応した
一方でミドルレンジ~ローエンドでは一般向けにグラフィック用途に合わせるようにアーキテクチャを変更した
と言うことになります。
また、両方に共通する特徴として内部バスの改良、キャッシュ階層の改良があるでしょう。
キャッシュが増え、双方向のバスが増えたことによって高い演算性能を引き出すことが出来る様になってます
これもどちらかと言えば、GPGPU向けと言えるでしょう。

グラフィックに注目するとテッセレータがSMに1基積んであるので、
現行のRadeonとは比較にならないほどテッセレータの数は多くなってます。
こういった点でDirectX11の性能が高くなっているのも現行GeForceの特徴と言えるでしょう。
一方で、内部バス、キャッシュ階層の改良によりアンコアの占める割合が増えてしまいました
恐らくですが32nmで出ていれば、ワットパフォーマンスは良好だったのではないかと思います
急遽、TSMCの32nmがキャンセルになった為、Fermiアーキテクチャを40nmで投入した結果
ワットパフォーマンスはあまり芳しくない結果になったのかと。
従来のGPUコアではGPGPU用途で飛躍的に性能を伸ばすのは難しかったので、
GPGPUに活路を見出したいNVIDIAにとっては、この選択しかなかったように思います。


参考記事
GeForce GTX 400アーキテクチャ徹底解説
NVIDIA,「GeForce GTX 580」を発表。これが“本物のGTX 480”だ!?
基本アーキテクチャの柔軟さが産んだGeForce GTX 460
Fermiバージョン2と言えるGF104の正体
GF100を大幅拡張したGeForce GTX 460アーキテクチャ
NVIDIAのGeForce GTX 580に隠された設計上の秘密
NVIDIAの新ミッドレンジGPU「GeForce GTX 560 Ti」
再び500平方mmを超える巨大チップとなったNVIDIAのGTX 480



では、最後に次世代GeForce「Kepler」について
足音が聞こえてきたNVIDIAの次世代GPU「Kepler」と次世代Tegra「Wayne」。現時点の情報を整理してみる

•GK110:GK104×2構成,PCI Express Gen.3対応
•GK104:パフォーマンスGPU,PCI Express Gen.3対応
•GK106:メインストリームGPU,PCI Express Gen.3対応
•GK107:エントリーGPU(OEM専用?),PCI Express Gen.2対応


他に特徴をまとめると
・GF100、GF110のようなビッグダイはしばらく登場しない見込み
・単精度浮動小数点演算性能を大幅に向上
・SM、GPCの構成を見直し
・演算効率が1.5~2倍に向上
・64bit整数演算にも対応予定(Keplerの次の可能性も)
・GK104では単精度浮動小数点演算性能は2TFLOPSを大きく超える
・GK104を2基搭載するハイエンドでは4TFLOPSを超える
・GK104の消費電力は250Wを超える?

基礎となるCUDA Coreの改良で演算性能は上がるとしても
ここまで大幅に演算性能が上がるということは、1SM辺りのCUDA Coreが多くなるのかもしれませんね。
GTX580で1.581TFLOPS。GTX590で2.488TFLOPSなので、演算効率が大幅に増加するわけですが
良く考えたらGTX580が244Wなので、ワットパフォーマンスはとりあえず向上すると見て良いようです。
ただ、どの程度よくなるのかが分からないって感じなので、
こればかりは詳細な情報が出るのを待つしかありませんね。

非常に長くなりましたが、色々と不備があったらコメントなどでお願いします。
関連記事
[ 2011/11/26 10:23 ] NVIDIA GPU | TB(0) | CM(0)

コメントの投稿













管理者にだけ表示を許可する

トラックバック:

この記事のトラックバック URL
http://pcniigata.blog.fc2.com/tb.php/44-bdd74ff0










上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。