Doom 2016 RebootのPCバージョンには、ついに待っていたVulkan APIアップデートがあります。より高いパフォーマンスの面では誰もが勝者ですが、特にAMDの所有者にとっては、ゲームを変える改善がいくつかあります。私たちの最初のテストは、Radeonユーザーのゲームパフォーマンスが30〜40%増加するものを示唆していますが、これらは大まかな初期数です。実際には高くなる可能性があります。
では、Vulkanとは正確には何ですか?さて、同じ利点の多くがDirectx 12に相当するOpenGLと考えてください。主に、GPU非同期計算の実装とともに、マルチコアCPUのはるかに優れた利用です。特に後者の要素は、Radeonハードウェアの大きな改善を見ており、Doomで広範囲に使用されています。 IDソフトウェアのリードレンダリングプログラマーのTiago Sousaは最近、ゲームのコンソールバージョンでフレームあたり3〜5msの効率の改善を明らかにしました。これは、フレームあたり16msレンダリング予算がある場合、非常に大きなことです。
Digital Foundryとの技術インタビュー(今週末は完全に公開される予定)で、IDチームはVulkanの利点と特に非同期計算の可能性について話します。
「はい、Async Computeは、AMDハードウェアで実行されているPC Vulkanバージョンで広く使用されます」とリードプログラマーのBilly Khan氏は語ります。 「Vulkanは、最終的に「金属」にもっと多くをコーディングすることができます。厚いドライバー層はVulkanで排除されます。これにより、OpenGLまたはDXで達成できない大幅なパフォーマンスの改善が得られます。」
シニアエンジンプログラマーのJean Geffroyは、Async Computeがテーブルにもたらす深遠な利点について深く入り込みます。
「GPUのパフォーマンスを見ると、すぐに非常に明白になるのは、一部のレンダリングパスはコンピューティングユニットをほとんど使用していないことです。例として、シャドウマップレンダリングは、通常、固定パイプライン処理(ラスター化など)と生のコンピューティートではなくメモリ帯域幅によってボトルネックされています。パフォーマンスは、シャドウマップをレンダリングするとき、並行して実行されていない場合、多くのGPU処理能力を無駄にしていることを意味します。
「より集中的なシェーディング計算でジオメトリが合格すると、内部グラフィックスパイプラインに関連するさまざまな理由でコンピューティングユニットを一貫して最大限にすることができない可能性があります。これが発生するたびに、非同期シェーダーは他のタスク用に使用されていないコンピューティングユニットを活用できます。たとえば、私たちが運命を取り、トーンマッピングを使用して、これはグラフィックスの重要な部分と並行して実行されます。キューはマルチMSの利益をもたらす可能性があります。
「これはほんの一例ですが、一般的に言えば、Async ComputeはGPUを最大限に活用するための優れたツールです。いくつかのメモリ集約的な作業をコンピューティング集約的なタスクと重複させることができる場合はいつでも、パフォーマンスの向上の機会があります。両方のコンソールで同じようにAsync Computeを使用します。
それでは、IDソフトウェアがPCユーザーに配信した実際のVulkanコードに関して、これはどのようにパンアウトしますか?さて、私たちはパフォーマンステストにFCATを使用します。これは、色付きの境界線を持つGPUによってすべてのフレーム出力をマークするシステムです。それは、内部のメトリックに依存するのではなく、実際にあなたが実際に見るものを実際に追跡する最良の方法です。
ここには1つの問題だけがあります。現在、Doom自体やVulkan全般を介してFCATのサポートはありませんが、ゲームのOSD累積GPUレンダリング時間平均はAMDハードウェアでは機能しなかったようです。いくつかの数字をまとめるために、私たちは非常に簡単なアプローチを使用しました - 3つの非常に異なるシーンにアクセスし、GPUの範囲でパフォーマンスの差を測定します。
それは潜在的な微分を判断するための非常に基本的な方法とのみ考慮することができますが、それらが立っているときの結果は厳しいです。 4つの非常に有能なGPU -GTX 1080、GTX 1070、GTX 980 TIおよびR9 Fury Xの1440p/Ultra/8x TSSAA比較から始めます。 :Radeonハードウェアは、OpenGLの下で最寄りの競合他社であるGTX 1070およびGTX 980 TIに対して大幅に低下しますが、実際にはVulkanが従事しているときに両方を前に移動します。
平均FPS | GTX 1080 | GTX 1070 | GTX 980 Ti | R9フューリーx |
---|---|---|---|---|
GLを開きます | 134.0 | 107.7 | 109.3 | 88.7 |
バルカン | 149.0 | 115.0 | 115.0 | 123.7 |
パフォーマンスが向上します | +11.2% | +6.8% | +5.2% | +39.5% |
また、AMDの新しいPolarisテクノロジーがVulkanでどのようにチェックアウトするかを見たかったので、RX 480(同じ設定、同じパフォーマンスポイント)でまったく同じテストを繰り返しました。今、理想的な世界では、今後のGTX 1060と直接比較していましたが、それは禁輸措置のままであるため、次に最高のことを行い、GTX 970とGTX 980で考慮に入れました。直接交換します。
結果は、AMDのOpenGLドライバーの品質における明確な不利益を再び強調しています。 GTX 970はRX 480よりも7%高速ですが、GTX 980は24%の利点を持っています。しかし、もう一度、Vulkanによって状況は著しく変化します。 RX 480はGTX 970を跳躍させ、GTX 980でエラーのマージン内を移動します。
そして、ここでは、比較的軽いシーンのほんの一部でしかテストしていないことを強調する必要があります。明らかなことは、AMDのCPU使用率が大幅に低下しているため、より多くのアクション満載のシーンでさらに大きな利益があるかもしれないということです。 Doomのベンチマークは非常に困難です - OSDのGPU平均フレームタイムメトリックがAMDを使用して適切に機能したとしても、ゲームの非常にダイナミックな性質により、正確なベンチを引き出すことがほとんど不可能であるために反復可能なゲームプレイが必要になるということです。
平均FPS | RX 480 | GTX 970 | GTX 980 |
---|---|---|---|
GLを開きます | 69.7 | 75.7 | 86.6 |
バルカン | 89.7 | 77.3 | 90.7 |
パフォーマンスが向上します | +28.7% | +3.4% | +4.7% |
Vulkan FCATインジェクターがすぐに表示されることを願っています。そうしないと、開発者自体によって追加されたコマンドラインモードが表示されます。このゲームのルーツを念頭に置いて、Old -School TimeDemoサポートも統合されていることをお勧めします。ただし、ここと現在、結果は明らかです。誰もがハードウェアに関係なく、Vulkanの勝者です。そして、私たちのテストは、4.6GHzで実行されているオーバークロックされたCore i7 6700Kで実行されたことを指摘する価値があります。 NVIDIAまたはAMD GPUで実行しているかどうかにかかわらず、CPUの最適化により、プロセッサが能力が低い人には大きな改善がもたらされるはずです。
ただし、生のGPUパフォーマンスの改善の観点から、私たちの数字は、VulkanがAMDにとって大したことであることを示しています。特にR9フューリーXのターンアラウンドは注目に値します - GPUパワーに関してGTX 1080年代の純粋なブルートフォースは山の頂上に快適に保ちますが、GTX 1070と980 TIの両方を前に引っ張るフューリーXは非常に印象的な結果ですソフトウェアのみのアップグレード用。
IDソフトウェア自体は、VulkanとAsync Computeの利点について非常に明確です。チームに、非同期コンピューティートがプラットフォーム全体のすべてのエンジンの主要な要因になる時間を見るかどうかを尋ねました。
「実際には、Doomはすでに、Async Computeが適切に使用すると、ゲームのパフォーマンスと外観を劇的に強化できるという明確な例です」とBilly Khanは思います。 「今後、ComputeおよびAsync ComputeはIDTECH6にさらに広範囲に使用されます。ゲームで効果的に使用する方法を発見する際に、より多くの開発者がコンピューティングと非同期の計算を利用することはほぼ確実です。」