Radeon RDNA対GCN：AMDの次世代アーキテクチャはどれくらい速くなりますか？

これは私が長い間取り組みたいと思っていたプロジェクトです。実際、AMDの新しいNavi Architectureが次世代のコンソールで登場することが明らかになったからです。 PS4およびXbox Oneから、強化されたコンソールを通じて、Google Stadiaの公開まで、グラフィックパワーは、やや任意のユニットであるTeraflopによって測定されています。そして、明確にしましょう。新しいコンソールがいくつのテラフロップを持っているのかは、多くのオブザーバーにとって先入観のままであり、PlayStation 5またはProject Scarlettが今日のハードウェアに対抗できるものについてのアイデアを得たいと熱望しています。しかし、おそらく焦点を変える必要があり、おそらく新しいAMD Navi Architecture自体を詳しく調べる必要があります。簡単に言えば、Navi ComputeのTeraflopは、昔ながらのGCN相当よりもはるかに高速なゲームパフォーマンスを生み出すはずですが、それを定量化できますか？

NaviとそのTeraflopsのテスト - 比較的単純なタスクのように聞こえます。 AMDの歴史の過去7年間でグラフィックカードを追跡することから始めて、現在の世代のコンソールで見つかったGPUの建築基盤であるGCN 1.0でさかのぼります。そこから、さまざまなGCN反復全体にシェーダーカウント、コアクロック、メモリ帯域幅を均等にし、同様に仕様のNAVIに対してそれらを積み重ねます。徹底的な範囲のベンチマークを完了した後、GCNの夜明けから真新しいRDNA製品までのAMDパフォーマンスの改善が進むことになります。 1.0 Teraflopは、RDNA 1.0相当と比較します。

残念ながら、この手順を実行することはやや困難です。なぜなら、周波数、計算ユニット、メモリ帯域幅を本質的に不可能にするため、やや困難です。 GCN時代はTahitiで始まりました-32コンピューティングユニットGPU、Naviの最低端部の提供には36のCUがあります。さらに複雑な問題は、NaviのGDDR6 VRAMが帯域幅の広大な448GB/sを提供していることです。しかし、華麗なスティーブバークからのヒントゲーマーネクサス私を向けたmorepowertool、私が見つけたできた256GB/sへのアンダークロックメモリ - 以前のGCN製品のGDDR5の機能の上端。このハードルが克服されると、この表が示すように、いくつかの数学的なシェナンガンが私たちが必要な場所に連れて行くことができます。

GCN 1.0対RDNA 1.0テストのビデオ崩壊 - これは、コンピューティングの最終世代のテラフロップが次世代のナビの同等物によって簡単に打ち負かされることを示しています。YouTubeをご覧ください

	建築	シェーダー/cus	帯域幅	打ち上げ	使用される製品
タヒチ	GCN 1.0	2048/32	288GB/s	2011年12月	R9 280X
ポラリス10	GCN 4.0	2048/32	211-224GB/s	2016年6月	RX 570
ポラリス10	GCN 4.0	2304/36	224-256GB/s	2016年6月	RX 580
ナビ10	RDNA 1.0	2304/36	448GB/s	2019年7月	RX 5700

GCN 1.0をRDNA 1.0と直接比較することはできませんが、次に最良のことをすることができます。オリジナルのグラフィックコアネクストシリコン、コードネームのタヒチは、32のコンピューティングユニットを備えたRadeon R9 280Xで表されています。その384ビットメモリインターフェイスは、帯域幅の288GB/sでトップになり、256GB/sに簡単に下着することができます。 Evergreen Polaris Architectureに移動するRadeon RX 570は同じCuカウントを持ち、そのRAMは256GB/sにオーバークロックできます。計画は一緒になり始めています - GCN 1.0とGCN 4.0を直接比較できます。

ただし、トップエンドから戻ると、RX 5700には36の計算ユニットがあり、問題が発生します。 GDDR6を下着して256GB/sの帯域幅に達することができますが、他のカードよりも4つのCUがあります。これは、最終的なGPUが重要であることを証明する場所です - ポラリス駆動のRX 580はNAVIと同じCUカウントを持ち、必要な256GB/sのメモリ帯域幅を箱から直接搭載しています。要するに、GCN 1.0をRDNA 1.0と比較することはできませんが、タヒチとポラリス、ポラリスとナビを比較し、アーキテクチャの間にチェーンを確立し、それらの2つの数字を使用することができます。。

これにより、もう1つのマイナーな課題が残ります - コア周波数のマッチング。 MSI R9 280Xは1050MHzでトップになっているため、すべてのカードのラウンド1.0GHz時計に落ち着きました。 RX 5700クロックは、このレベルに劇的に下着していても、結果を過度に妥協する可能性が高い程度ではありません。ゲームオン - しかし、次の課題は、4つのカードすべてで実際にテストするものを把握することです。

	Tahiti/32cus	Polaris/32cus	Polaris/36Cus	Navi/36cus
3DMARK FIRESTRIKE DX11	9197	11299	11991	14153
3DMARK Timespy DX12	2279	3149	3696	5035

ここには多くのことがあり、ステージを設定するためにいくつかの合成ベンチマークから始めています。しかし、先に進む前に、これは建築パフォーマンス分析であり、実際の製品を代表するものではないことを強調しましょう。 AMDのグラフィックテクノロジーは、過去7年間にわたって進化してきました。

確立されたFirestrike DX11およびTimespy DX12ベンチマークの3DMARKのグラフィックスコアは、最初の呼び出しポートです。 Firestrikeは、TahitiとPolarisの間のスループットが23％増加し、PolarisからNaviへの18％の隆起を示しています。これらの2つのパーセントの利益を積み重ねることにより、全体的に改善は約45％です。 3DMARKの有用性は疑問視されることがよくありますが、次のページでわかるように、この数字はDirectX11の実際のゲームパフォーマンスに近いものです。

Timespyストレステストは、カードのDX12資格情報をテストし、目を見張るような結果を生み出します。ポラリスはタヒチを38％下回り、ナビはポラリスを36％超えています。 AMDの最近のGPUの歴史の一方の端からもう一方の端まで、Naviの余分なCUを考慮して、NaviはTahitiよりも88％の大幅な改善を提供します。これも、DX12ゲームの結果の多くに反映されています。問題は、ここで本物の建築改善を見ているのか、それともタヒチが今日の基準ではまともなDX12の実装を欠いているのかということです。

	Tahiti/32cus	Polaris/32cus	Polaris/36Cus	Navi/36cus
gfxbenchテッセレーション	111fps	711fps	718fps	947fps
gfxbench alu2（計算）	655fps	825fps	913fps	1178fps

ネタバレ：GCN 1.0テクノロジーがPolaris、特にNaviの両方に達していない次の数ページで、AMD世代全体で同じワークロードを実行しているいくつかのクレイジーな結果が見られます。生の馬力のセットとより低いレベル。そして、それは上記のGFXBench OpenGLベンチマークが照明を証明するかもしれません。 Polaris vs Tahitiは、定格計算とメモリの帯域幅の同一のレベルにもかかわらず、計算能力が28％増加しています。 Navi vs Polarisは、同じ大きさの別の飛躍を見ています。タヒチからナビまで、新しいアーキテクチャに基づいた想定的な32 Cu部品は、コンピューティングパワーの62％の改善をもたらします。

また、AMDが長年にわたってジオメトリ処理を強化した例として、テッセレーションの結果を含めました。コンピューティングパワー、ROPS、またはメモリ帯域幅によってゲームベンチマークが制限されていることを知っていますが、ゲームが単純にトライアングルのセットアップによって抑制されているのを見ることができますか？はい確かに。数字はここでそれ自体を物語っていますが、本質的には32 Cu Tahitiから36 Cu Naviまで、AMDのアーキテクチャのこの側面は7年間で8.5倍の増加を見ました - 世代から世代への建築的利益を引き上げ、745がありますパフォーマンスの隆起パーセント。

今度は、同じ方法論をさまざまなゲームに適用する時が来ました。結果は興味深いものですが、想像するほど一貫性がなく、明確ではありません。

AMD RDNA対GCN分析：