とにかくテラフロップとは何ですか?

いつPlayStation 4とXbox Oneの最初の仕様が漏れました、グラフィカルパフォーマンスの明らかな格差が1つの厳しい比較で強調されました。 Microsoftコンソール - 最初は、スペックが調整される前に、GPUパワーの1.23テラフロップスを備えていましたが、ソニーマシンはそれを大幅に高い1.84TFでフランプしました。紙の上では、比較は膨大に見えました。単一のコンソールが販売される前に、Microsoftはトラブルに陥っているように見えました。生の数字は、PS4がグラフィカルパワーの50%をさらに50%持っていることを示唆しています。これは、次世代のコンソールが可能な限り最も強力なハードウェアを提供することを目指しているゲーマーにとって非常に重要なメトリックです。

今では、Specsの優位性の位置は、後継者の公開とともに手を変えたようです。PlayStation 4K Neo現在、4.2TFのムーティングがありますMicrosoftのプロジェクトScorpio約6TFでそれをトランプします - 43%の利点。もちろん魅力的ですが、問題は、テラフロップは、これらの一見広大な仕様の微分は、実際にパフォーマンスと実際にゲームプレイエクスペリエンスをどの程度示していますか?

基本レベルでは、「フロップ」は浮動点操作であり、計算能力の基本単位です。 MicrosoftとSony Consolesの中心にあるAMDグラフィックステクノロジーに適用されると、計算は非常に簡単です。 GPUのシェーダーコアの量にクロック速度を掛けます。 AMDハードウェアを使用すると、コンピューティングユニットごとに64個のシェーダーがあります。 Xbox Oneには12個のCUがあり、PS4には18個があり、合計768と1152のシェーダーが与えられます。 2つのコンソールの時計速度は、それぞれ853MHzと800MHzです。

PlayStation 4K Neoは、GPU計算電力のかなりの4.2テラフロップスを提供しています。 Neo Spec全体に関するRichの見通しは次のとおりです。YouTubeをご覧ください

それはかなり基本的な数学ですが、その後、結果に2を掛けます - それは、各クロックで2つの異なるタイプの命令(1つの乗算、1つの蓄積操作)が同時に実行されるためです。これにより、めちゃくちゃに多数が生成され、典型的なハードドライブの膨大な量のストレージが消化可能な人物に合理化される方法と同様に、同じことがフロップで起こります。したがって、私たちの最終的な数字は100万で分割されており、最終的なものを与えてくれますテラフロップ図[アップデート:以下の例を訂正した例、フロップはメガフロップでなければなりません]。

Xbox One、PlayStation 4、および現在のPlayStation 4K Neo Specの数学がどのように機能するかを次に示します。

  • Xbox One:768シェーダーX 853MHz x 2クロックあたりの指示= 1,310,208 MegaFlops/1.31TF
  • PlayStation 4:1280シェーダーX 800MHz x 2クロックあたりの指示= 1,843,200 MegaFlops/1.84TF
  • ネオ:2304シェーダーX 911MHz x 2クロックあたりの指示= 4,197,888 MegaFlops/4.2TF

Microsoftは最近、新しいプロジェクトScorpio Consoleが約6TFの計算能力を持つグラフィックコアを備えていることを明らかにしましたが、GPU仕様についてはほとんど明らかにしませんでした。実際には、方程式の最後の部分がありますが、時計速度またはシェーダーカウントに関して他の情報はありません。最近ではScorpio Spec分析、コンソールデザインに関する既存の知識の組み合わせを使用し、AMDの今後のGPUであるCodeNead Vegaに関するリーク情報を使用して、Microsoftの新しいハードウェアのハードウェアメイクアップに関する最良の推測を考え出しました。

  • SASORPIOシナリオ#1:3584シェーダーX 840MHz x 2クロックあたりの指示= 6,021,120 MegaFlops/6.02TF
  • Scorpioシナリオ#2:3840シェーダーX 800MHz x 2クロックあたりの指示= 6,144,000メガフロップ/6.13TF

ここでの私たちの推測では、Scorpioのクロック速度が低いことを想定しています。プロセッサはPlayStation Neoよりも大幅に大きくなる可能性が高いためです(より大きなプロセッサはより多くの熱を生成し、一般的に低クロックで動作するのを見ます)。そして、Microsoftが今後のAMD Radeon Vegaパーツを使用していると仮定しています。64の計算ユニットまたは4096シェーダーを使用するためにリークを介して確認されました、PlayStation Neoと同じPolarisテクノロジーを使用して6TFを打つには、プロセッサに極端なクロックスピードが必要であるためです。

  • SASORPIOシナリオ#3:2304シェーダーx1302MHzx 2クロックあたりの2命令= 5,999,616 MegaFlops/6TF

実際、プロセッサは、NEO GPUの基礎となる元のRadeon RX 480 PCハードウェアよりも速い時計速度で実行する必要があります。要するに、MicrosoftがRadeonのロードマップにない次世代AMD GPU部品にアクセスできる場合を除き、Vegaのカットバックバージョンを検討する必要があります。

生のハードウェア機能の観点から、MicrosoftのProject Scorpioに何を期待すべきでしょうか?これがリッチの考えです。YouTubeをご覧ください

Teraflopsはどの程度システムのパフォーマンスを定義していますか?

Teraflopsは、計算能力の非常に基本的な尺度であり、GPU設計の他のすべての側面とは異なります。たとえば、AMDのGCN(Graphics Core Next)アーキテクチャは、Nvidiaのライバルと比較して、生の計算能力で常に重いです。RadeonGPUがうまくいった理由の1つ暗号通貨ゴールドラッシュ時代。ただし、これが必ずしもゲームのパフォーマンスにつながるとは限らないことを強調することが重要です。

この良い例は、NVIDIAのGTX 1080を9TF対AMDのRadeon R9 Fury Xと8.6TFと比較することです。計算能力だけに基づいて、これらの2つのグラフィックカードが広く同等のパフォーマンスを提供することを期待していますが、以下の4Kベンチマークが示すように、GTX 1080は少し速いだけではありません。たくさん1つのタイトルを除くすべてのタイトルでより速くテストしました。確かに、6.5TFの電力を備えた低いGTX 1070でさえ、多くのゲームでFury Xを快適に上回ることができます。さらに、Teraflopsの観点から、GTX 1070はNvidia自身のTitan X(7TF)に遅れをとっていて、再びそれに合わせたり、アウトパフォームしたりすることができます。

ドライバー - ハードウェアに電力を供給するソフトウェアは重要ですが、より重要なことですが、メモリ帯域幅やオンチップメモリ​​キャッシュなど、ハードウェアの他の側面は言うまでもなく、グラフィックアーキテクチャ自体の設計も重要です。ただし、コンソール部品間の比較は、2つの理由で広く示唆している可能性があります。1つ目は、PS4とXbox One GPUの両方が同じファミリーから来て共有するため、GPUの周囲の要素は計算パフォーマンスに沿って必要に応じてスケーリングする傾向があるため非常によく似たコアデザイン。

トップ層GPUハードウェアの4Kパフォーマンスをご覧ください。 AMDのR9 Fury Xには8.6TFの電力がありますが、全体的な計算リソースが低いNVIDIAハードウェアに追いつくのに苦労しています。YouTubeをご覧ください
3840x2160(4K)GTX 1070GTX 1080タイタンXR9フューリーx
アサシンクリードユニティ、ウルトラハイ、FXAA25.432.525.622.6
特異点の灰、極端、0xMSAA、DX1243.153.340.949.0
Crysis 3、非常に高い、SMAA T2X31.540.131.331.4
部門、ウルトラ、SMAA31.037.330.731.1
Far Cry Primal、Ultra、Smaa33.542.433.534.5
墓の襲撃者のライズ、ウルトラ、SMAA、DX1235.645.835.929.6
ウィッチャー3、ウルトラ、ポストAA、ヘアワークなし37.343.734.032.8
プロジェクトカー、ウルトラ、SMAA33.638.529.820.9

ただし、Xbox OneとScorpioとPS4 vs Neoとともに、Xbox OneとScorpioの間の世代間の比較はそれほど示されていない可能性があります。 AMDは、古い世代との完全な互換性を備えたグラフィカルコンポーネントを提供していますが、GPUハードウェアの新しい波にはアーキテクチャの改善もあります。要するに、私たちはより効率的なパフォーマンスを見ることを望んでいます。これは、AMDが今後のRX 460グラフィックスカードをリリースしたときにテストできるものです。これは、Radeon HD 7850と同じ16の計算ユニットを備えていますが、新しいPolaris設計に基づいています。 2つの間の時計速度とメモリ帯域幅を均等にすると、それらのペアをベンチマークすることは、理論的には、AMDの第4世代GCNが提供する効率の改善について良いアイデアを与えるはずです。

一番下の行はこれです。紙の上では、ScorpioにはXbox Oneの計算電力が4.6倍、NeoにはPS4の電力が2.3倍あります。ただし、AMDが新しいテクノロジーで提供する改善されたデザインは、Teraflopsの評価だけに基づいて、実際には、私たちが思っていたよりも高いパフォーマンスを向上させる可能性があります。ただし、計算の40%の増加が実際のパフォーマンスの40%の増加につながらないことを強調することが重要です。

GPUのパフォーマンスは計算能力に完全に沿ってスケーリングされません

一般的に言えば、より多くのAMD計算ユニットをGPUに詰め込むと、より高いレベルのパフォーマンスが生成されます。ただし、粗い例を使用するために、TeraFlopsは2倍のフレートに変換されません。これには多くの潜在的な理由がありますが、一般的に言えば、ここではメモリ帯域幅の制約が主要な要因です。

を取るRadeon R9 380Xたとえば、グラフィックカード。 AMDのTongaチップデザインの32コンピューティングユニットバージョンで完全に有効になっています。カットダウンR9 380に対してベンチマークされている場合(28個のコンピューティングユニットを備えた同じチップを使用)、ゲームフレームレートが10〜15%増加していることがわかります。これは、より多くのシェーダーに加えて、より高いGPUコアクロックとより高速なメモリにもかかわらずです。実際のパフォーマンスと定格のテラフロップの格差は増加GPU仕様間でギャップが広がると。 MicrosoftはScorpioでできる限り最善を尽くしており、6TF GPUをNEOで見つかった218GB/sを320GB/sの帯域幅/sと提供しています。

Teraflopsとゲーム内のパフォーマンスの格差は、PS4とXbox Oneでもある程度見られます。コンソールのGPUパフォーマンスの生のベンチマークはほとんど存在しません。ゲームはフレームレートキャップで実行される傾向があります。さらに、開発者はさまざまなレンダリングコンポーネントで品質設定を調整するか、実際にネイティブレンダリング解像度を変更してパフォーマンスをより密接に導きます。しかし、例外があります:IO Interactiveのヒットマン。これは、PS4とXbox Oneの両方で同じ1080pの解像度で実行され、同じビジュアルを使用して実行されます。また、ロック解除されたフレームレートで、理想的なベンチマーク条件にかなり近いことで実行されます。

IO InteractiveのHitmanは、同一の解像度、視覚的機能、ロック解除されたフレームレートを特徴としています。PS4とXbox Oneでの唯一のゲームであり、同一シナリオで相対的なパフォーマンスのアイデアを提供します。YouTubeをご覧ください

最終結果は、GPUが主要な制限要因であるゲームの領域で、PlayStation 4は40%のコンピューティングアドバンテージ(1.84TF対1.31TF)を持っているにもかかわらず、パフォーマンスの30%増加を提供します。メモリ帯域幅も(IOがXbox Oneの埋め込みESRAMを使用している方法に応じて)。そして、ここにあります:ヒットマンは実際に走ることができますXbox Oneでより速くいくつかのシナリオでは、次のポイントに到達します。

ゲームのパフォーマンスもCPUに制限される可能性があります

ヒットマンは、GPUバインドと同様に、ゲームパフォーマンスがどのようにCPUに制限されるかの興味深い例です。ゲームのパリステージにはNPCキャラクターが豊富で、すべての動作をシミュレートする必要があり、アニメーションを処理する必要があります。この作業はCPUにより適しており、PS4とXbox Oneの両方が同じ比較的弱いAMDジャガープロセッサコアを使用しています。これは、元々モバイルデバイス向けに設計されたCPUアーキテクチャです。パフォーマンスの弱いことを補うために、両方のプラットフォームホルダーはコアカウントで2倍になりました - 正直に言うと、少しファッジです。違いは、Microsoftコンソールが1.75GHz対PS4の1.6GHzでCPUコアを実行していることです。これは、ヒットマンの一部の領域の画面で実際に見ることができる9.4%の利点です。

ソニーは、NEOでこの問題に対処しようとしました。 AMDの次世代「Zen」CPUテクノロジーは、GPUと単一のプロセッサへの統合には利用できないようです。そのため、プラットフォームホルダーは次の最高のことを行いました。クロックスピード:NEOの2.1GHzとPS4で1.6GHz -31.3%のパフォーマンスが向上します。 CPU Architecture Project Scorpioが何を使用しているかは正確にはわかりませんが、確率のバランスに基づいて、Microsoftが既存のJaguarコアやそれらのバリエーションをアップクロックするのと同じ戦略を使用している可能性が非常に高いです。

これは、NeoとScorpioの主な関心事です。私たちは、より強力なGPUといくつかの非常識なフロップカウントを備えたグラフィックパワーに対するゲームを変える増加ですが、CPUパワーと同様のブーストとは一致していません。これは、フレームレートが大幅に高くなるのではなく、4K解像度に焦点を当てている理由を説明するかもしれません。30fpsから60fpsから60fpsまでのパフォーマンスを2倍にするには、CPUからさらに多くを求める必要があります。少なくともNEOでは、スペックを知っている場合、必要なパフォーマンスの倍増のようなものは見られません。

CPUのパフォーマンスによって一貫して制限されるゲームはほとんどありませんが、Assassin's Creed Unityもその1つです。これは、一貫したXbox Oneパフォーマンスの優位性を示す現在の世代で唯一のタイトルの1つです。YouTubeをご覧ください

結論:TeraFlopsはコンソールのグラフィカルパワーを完全に定義していません

Teraflopsで測定されたゲーム内のパフォーマンスと計算能力の間には直接的な線形関係はありません。また、相対的なGPUパフォーマンスのアイデアを得ることができますが、これは同じコアアーキテクチャに基づいて異なるグラフィックスハードウェアを比較する場合にのみ実際に機能します。そして、それでも、たとえば、他の40%の利点を備えたGPUは、純粋なパフォーマンスの観点から線形方法でそのアドバンテージスケールを見ることはありません。グラフィックプロセッサの機能は、単なる計算能力以上のものにも依存しています。特に、メモリ帯域幅は非常に重要です。

ただし、Xbox Oneの12コンピューティングユニット1.31TF GPUは、PS4の18コンピューティングユニット1.84TFグラフィックスコアに対して不利な点があることです。これは、マイクロソフトコンソールの低いメモリ帯域幅によってしばしば悪化する状況です。ただし、スペックの大きな格差を念頭に置いて、開発者は多くのマルチプラットフォームタイトルで広く同等の経験をもたらすことに見事に対処しており、大きな差別化要因はゲーム内解像度(たとえば1080p対900p)です - 一般的にはPS4しばしば、より安定したフレームレートも手渡されています。

すべての兆候は、PlayStation 4K NeoとProject Scorpioの間の同様の仕様の格差を指しており、今回はMicrosoftの好意でカードを積み重ねています。マイクロソフト自体は、ネイティブの4Kゲームプレイをターゲットにすることを意図しているようです。これは、ソニーも検討している戦略ですが、低解像度からのアップスケーリングの可能性が高くなります。しかし、より強力なライバルのハードウェア、おそらくソニー、そして実際にゲーム開発者に直面して、完全なHD、1080pエクスペリエンスからより多くのより多くを獲得することを目指していますか?最近述べたように、より高い解像度を超えた新しいコンソールには他のオプションがあります...