Digital Foundry vs. Xbox One Architects

次世代のコンソールのリリースから2か月離れて、多くの人がすでに1つのゲームがリリースされる前にどのマシンがより多くのゲームパワーを提供するかについてすでに決心しています。基本的なグラフィックスとメモリ帯域幅の仕様を並べて比較すると、それは洗浄のように見えます - プレイステーション4は、両方のコンソールのそれぞれのメリットの賢明な議論を程度まで包括的にベストします。彼らは同じコアAMDテクノロジーを使用していますが、ソニーはより速いメモリとはるかに大きなグラフィックチップを持っています。しかし、それは本当に簡単ですか?

PS4がXboxのカウンターパートよりも大きな利点があることを示唆する無名の情報源からのストーリーをきっかけに、Microsoftはレコードをまっすぐに設定したいと考えていました。先週の火曜日、Digital Foundryは電話会議にダイヤルして、Xbox Oneプロジェクトの背後にある2人の主要な技術者と話をしました。すべての論争に対処できる深い技術的な議論にストーリーを置く機会を望んでいた情熱的なエンジニアです。会話の瞬間の中で、バランスがテーマになることがすぐに明らかになりました。

「優れたバランスの取れたコンソールを設計するには、ソフトウェアとハ​​ードウェアのすべての側面を考慮する必要があります。パフォーマンスの面で良いバランスをとるために2つを組み合わせることです」

「私たちは実際にデザインについてあなたと話す機会を持っていることを非常に嬉しく思います。そこには多くの誤った情報があり、それを手に入れていない人がたくさんいます - 私たちは実際に私たちのデザインを非常に誇りに思っています。バランスは非常に優れており、非常に優れたパフォーマンスがあり、生のALU [GPUコンピューティングパワー]以外のものを処理できる製品があります。安定したフレームレートと、タイトルがシステムやそのようなものによって中断されていないことになります。

「アンドリューはそれをかなりよく言った。私たちは本当に高性能で電力効率の良い箱を構築したかった」とハードウェアアーキテクチャチームマネージャーのニックベイカーは付け加えた。 「私たちはそれを現代のリビングルームに関連させたかったのです。AVについて話して、私たちはあなたのエンターテイメントの中心であるメディアハードウェアにするためにAVに出入りする唯一の人です。」

Xbox One Dashを見てきましたが、メディア機能はかなりクールですが、何よりもまずゲームがすべてです。 Xbox Oneの設計をめぐる論争の2つの主要な領域、特にPlayStation 4:The Memory SetupとTAPのGPU電力の量よりも弱いと見なされる領域があると言っても安全です。どちらのシステムも8GBのRAMを持っていますが、ソニーは176GB/sのピークスループットを備えた8GBの幅、高速GDDR5を選択しましたが、MicrosoftはDDR3を選択しました。ただし、これは204GB/sで覆われているオンチップエスラムによって補完されます。理論的には、2つのメモリプール間でリソースをマーシャリングして分割することが要因になりますが、Xbox Oneには、システム全体で適切な帯域幅を確保するための独自のアプローチが明らかにあります。

最終的なハードウェアを手に入れるまで、WiredのプリプロダクションXbox Oneの内部写真は、ボックス内の唯一の外観のままです。 Rumour -Mongersは、個別のGPUの不足に注意する必要があります - 追加の処理ハードウェアの最後の追加はありません。 Xbox Oneの主要システムはすべて、右側の単一のチップに組み込まれており、2133MHz DDR3モジュールに囲まれています。

メモリ管理は、2つのシステムを分離する最も分裂的なポイントの1つです。問題は、GDDR5が優先されたセットアップである場合、Microsoftがそれを選択しなかったのはなぜですか?まだ極端に現金が豊富であり、明らかに会社はGDDR5の保険料を支払う余裕があります。このより高い帯域幅RAMが生産プロセスの非常に早い段階で除外されたと仮定するのは公平だったのではないかと思いました。もしそうなら、なぜですか?

「ええ、それは正しいと思います。パフォーマンス、メモリサイズ、パワー、GDDR5の可能な限り最高の組み合わせを得るという点では、あなたを少し不快な場所に連れて行ってくれます」とニック・ベイカーは言います。 「ESRAMのコストは非常に少なく、非常に高い帯域幅を提供する機会があります。外部メモリの帯域幅を減らすことができます - 多くの消費電力を節約し、商品のメモリもより安価です。その背後にある原動力...あなたが高いメモリ容量、比較的低い電力、多くの帯域幅が必要な場合、それを解決する方法はそれほど多くありません。」

組み合わせたシステムの帯域幅の論争

ベイカーは、チームがESRAMとDDR3のメモリプールに同時にアクセスできないデザインを作成したという誤解に取り組むことに熱心です。批評家は、彼らが彼らの数字を膨らませるために利用可能な帯域幅を一緒に追加していると言い、これは実際のシナリオでは単に不可能だと言います。

「ESRAMとDDR3を8つの合計メモリコントローラーと考えることができるので、DDR3に行く4つの外部メモリコントローラー(64ビット)があり、256ビットの4つの内部メモリコントローラーがあります。それはEsramに行くので、これらはすべてクロスバーを介して接続されているので、実際には、ドラムとエスラムに直接行くことができます」と彼は説明します。

エスラムをめぐる論争は、デザインチームを非常に驚かせました。 Xbox Oneが協力するのが難しいという概念は、特に現在のコンソールの世代の初期には、Xbox 360を生産した同じチームをはるかに容易に開発するのと同じチームを飲み込むのが非常に難しいでしょう。

「この論争は私にとってかなり驚くべきことです。特に、Xbox 360からのEdramの進化とEsramと見なしている場合は、Xbox 360には、システムメモリから出てくる帯域幅と同時にエドラム帯域幅を得ることができるかどうかについての質問はありません。実際、システムの設計にはそれが必要でした」とAndrew Goossenは説明します。

「レンダリングターゲット、色、深さ、エドラムにあるステンシルバッファーを使用することと同時に、システムメモリからすべてのテクスチャをすべて引く必要がありました。もちろん、私たちはXbox Oneを使用します。 ESRAMには、Xbox 360でEdramと同じ自然な拡張機能があり、両方がXbox 360の素晴らしい進化であるということです。

「Xbox 360は開発するのが最も簡単なコンソールプラットフォームでした。開発者がEdramに適応するのはそれほど難しくありませんでしたが、私たちが言った場所がたくさんありました。ターゲットはEdramに住む必要がなかったので、ESRAMからDDR3にオーバーフローする機能があるXbox Oneでそれを修正したため、ESRAMはページテーブルに完全に統合されているため、混合して一致させることができます。 EsramとDDRメモリはあなたが行くのです...私の観点からは、それは非常に進化と改善です - Xbox 360でのデザインよりも大きな改善です。私はこれに非常に率直に言って驚いています。」

「Xbox 360は開発するのが最も簡単なコンソールプラットフォームでした。開発者がEdramに適応することはそれほど難しくありませんでした... [Esram]は非常に進化と改善です... Xboxで持っていたデザインよりも360.」

実際、ESRAMとDDR3メモリプールの間の一貫性のレベルは、以前に考えられていた多くのものよりもはるかに柔軟に聞こえます。多くの人は、32MBのESRAMがレンダリングターゲットにとって厳しい制限であると信じていました。グーセンが示唆するように、開発者は本当に「ミックスして一致する」ことができますか?

「ああ、絶対に。そして、あなたはそれを作ることさえできます。たとえば、あなたのレンダリングターゲットの一部が非常に少ないようになります...たとえば、あなたがレースゲームをしていて、あなたの空のオーバードロウがほとんどない場合、あなたはそれらのサブを貼り付けることができます-ESRAMの利用を改善するためにDDRへのリソースのセット」と彼は言い、その貴重な32MBからより多くを得るためにカスタム形式が実装されていることも説明しています。

「GPUでは、6E4 [コンポーネントごとに6ビットマンティッサと4ビットエクスポーネント]や7E3 HDRフロート形式[6E4形式]などの圧縮レンダリングターゲット形式を追加しました。コンポーネント64bppレンダリングターゲットごとに16ビットフロートがあり、32ビットを使用して同等のことを行うことができます。そのため、そのESRAMの効率と利用率を本当に最大化することに重点を置いています。」

ESRAMの帯域幅が生産ハードウェアでどのように2倍になったか

さらなる懐疑論は、初期の102GB/sから現在の場所までのエスラムの帯域幅の突然の飛躍を取り囲んでいます-204GB/s。私たちは物語を実行しました最初にブログ投稿の開発者リークに基づいて、Microsoft Techチームは4月に書き戻しましたが、「The Internet」のセクションは確信していませんでした。批評家は、数字が合計されないと言います。では、帯域幅の大幅な増加はどのようにして生まれたのでしょうか?

「私たちが始めたとき、私たちは仕様を書きました」とニック・ベイカーは説明します。 「実装の詳細に実際に入る前に、シリコンを使用する前に、テープアウトの前にシミュレーションを実行する前に、開発者に計画するものを提供する必要がありました。 102GB/sは109GB/sになりました。

大きな啓示は、エスラムが実際に同時に読み書きできるということでした。漏れたホワイトペーパーから利用可能な情報に基づいて、これは単に不可能だと信じている人もいました。

「4つの8MBレーンがありますが、それぞれのレーン内の8MBのメモリの連続的な8MBの塊ではありません。各レーン、8MBが8つのモジュールに分割されていること。 「ベイカーは言う。

「はい、できる - 実際にはエスラム全体を構成する多くの個別のブロックがあるので、並行して人と話すことができます。もちろん、同じ領域を何度も繰り返した場合は、帯域幅を広げるので、実際のテストでは、ピーク204GB/sではなく140-150GB/sを取得する理由の1つですそれらを同時に使用できるようにします誤解私たちは掃除したかった。」

Goossensは収益を下げます:

「読み物だけをしている場合、109GB/sで締めくくられている場合は、109GB/sでキャップされた書き込みだけをしている場合です」と彼は言います。 「それを乗り越えるには、読み取りと書き込みを組み合わせる必要がありますが、レンダリングターゲットや深さバッファーなど、通常ESRAMにあるものを見ると、本質的に多くのものがあります。読み取りされた方法で、ブレンドと深さのバッファーの更新が行われています。

マイクロソフトの議論は当時非常に簡単に思えます。理論的には、Xbox Oneの「現実」帯域幅の200GB/sがPS4の176GB/sのピークスループットに勝ります。問題は、比較的速いEsramの比較的小さな32MBを通じてリソースをどの程度チャネリングしているかが、開発者に問題を引き起こすことです。 Microsoftのポイントは、ゲームメーカーがXbox 360でのEDRAMのセットアップにより、すでにこれの経験があるということです。ESRAMは同じシステムの自然な進化です。

Microsoftは、ゲームのパフォーマンスは、持っているコンピューティングユニットの数で拡大しないと言います。 2GB Radeon 7850を2GB Radeon 7870 XTと比較することにより、その理論をテストにしました。 10のテストで、コンピューティングパワーが50%増加すると、ゲームフレームレートが平均24%改善されることがわかりました。YouTubeをご覧ください

メモリの帯域幅は1つのことですが、グラフィック機能は明らかに別のことです。 PlayStation 4は、オンボードGPUコンピューティングユニットという点で明確な利点を享受しています。これは疑いの余地のない生統計であり、PS4のうらやましいスペックシートを大幅に向上させます。 Andrew Goossenは、Microsoft Consoleの見かけのGPU欠乏症に詳細に取り組む前に、Xbox OneとPS4グラフィックスターの両方が同じAMD「島」ファミリーから派生していることを最初に確認します。

「私たちの友人と同じように、私たちはシーアイランドファミリーに基づいています。私たちは地域のさまざまな部分でかなりの数の変更を加えました...計算ユニットの数に関して最大​​のことです。非常に焦点を合わせています。それとも、実際にいくつかのベンチマークを実行しますか?」彼は言う。

「まず、ゲームはありません。ゲームが見えません。ゲームを見ると、「パフォーマンスの違いは何ですか」と言っているのです。ゲームはベンチマークです。 VEは、Xbox Oneが私たちのバランスの多くをチェックする機会がありました。 「

Xbox Oneのバランスとパフォーマンスを微調整します

マイクロソフトのアプローチは、最終シリコンからのパフォーマンスを向上させるためのヘッドルームがあることを知って、生産に入ることでした。 Goossenは、それをシステムに「屈する」と説明しています。次に、実際の生産ゲームを使用して、利用可能なヘッドルームを使用する方法を決定しました。

「バランスは実際の効果的なパフォーマンスの鍵です。Xbox OneでNickと彼のチームと一緒に本当に素晴らしいことでした。システム設計の人々は、システムのバランスを確認し、それに応じて調整する機会があるシステムを構築しました。 「グーセンが明らかにします。 「数年前にすべての分析とシミュレーションを行ったとき、そしてゲームがどこにあるのかを推測したとき、私たちは良い仕事をしましたか。当時は適切なバランスの決定を下しましたか?私たちのバランスに入って微調整した結果。」

「ヘッドルームがあることはわかっていました。テストする実際のタイトルがあるまで、私たちはそれをどうしたいのかわかりませんでした。GPUをいくら増やしますか?CPUをいくら増やしますか?」ニック・ベイカーに尋ねます。

「私たちはヘッドルームを持っていました。コンソールの発売で輝かしいことです。通常、あなたはダウンクロックしなければならないことについて話しています」とグーセンは言います。 「私たちは一生に一度の機会に行って、パフォーマンスを改善したいスポットを選ぶ機会がありました。パフォーマンスの改善に関する情報に基づいた決定を促進する方法として使用するローンチタイトルを使用することは素晴らしいことでした。ヘッドルーム。」

Goossenはまた、Xbox Oneシリコンに実際に追加のコンピューティングユニットが含まれていることを明らかにしています - 以前に推測していたように。その冗長ハードウェア(小売コンソールで2つのCUが無効になっている)の存在により、Microsoftは電力とクロック速度の計算の重要性を判断することができました。

「Xbox One Devキットのすべてが実際にシリコンに14のCUを持っています。これらのCUの2つは製造業の冗長性のために予約されていますが、実際に14 CUであれば、実験を行うことができます。私たちは12と、GPUの時計を上げた場合、私たちは実際にローンチのタイトルで見ましたか? 6.6%のクロックアップグレードほど効果的ではありませんでした。」

2つの追加のCUを追加して計算能力のレベルスケーリングを想定すると、数学はここでは鳴らないかもしれませんが、最近の分析は言うまでもなく、PCベンチマークは言うまでもなく、AMDコンピューティングユニットは線形方法で拡張しません。リターンを減少させる法律があります。

「Xbox One Devキットのすべてが実際にシリコンに14のCUを持っています...そして、私たちは実際に発売タイトルで見ました... 14 CUSに行くことは6.6%のクロックアップグレードほど効果的ではないことがわかりました。私たちはしました。」

「誰もがインターネットから14 CUに行くことを知っていることを知っていますが、私たちに17%近くのパフォーマンスを与えてくれるはずです」と彼は言います。クロックを上げます。

「周波数を増やすとGPU全体に影響を与えますが、CUSビーフをシェーダーとALUに追加すると、ニックベイカーは挿入します。

「正しい。クロックを修正することにより、ALUのパフォーマンスを向上させるだけでなく、頂点レートを上げ、ピクセル速度を上げ、皮肉なことにEsramの帯域幅を増やします」とGoossenは続けます。

「しかし、パイプラインを流れるドローコール、GPRプールからGPRSを読むことのパフォーマンスなどのボトルネックを取り巻くエリアでのパフォーマンスも向上します。GPUは、パイプラインにボトルネックになることができるパイプラインには数十億のエリアがあります。 AluとFetch Performanceだけに加えます。」

GPU計算とCPUの重要性

グーセンはまた、VgleaksのSony文書を漏らしたと考えています。

「ソニーは実際に私たちに同意していました。彼らは、彼らのシステムは14 CUのバランスが取れていると言いました。彼らはその用語を使用しました:バランス。バランスはあなたの実際の効率的な設計に関して非常に重要です。私たちは実際に、CUSにヘッドルームがあることを示しました私たちのタイトルがCU利用の観点から時間の経過とともに成長する余地があります。」

非同期GPUコンピューティングに対するMicrosoftのアプローチは、Sonyのアプローチとは多少異なります。しかし、本質的には、生の計算力に広く集中するのではなく、CPUとGPUの両方が同じメモリへのより低いレイテンシアクセスが必要であるという哲学です。 Goossenは、Xbox 360のKinectの模範的な骨格追跡システムを指しています。

「皮肉なことに模範的にはあまり必要ありません。それは、メモリフェッチの点であなたが持っているレイテンシについてはるかに多くのことですので、これは私たちにとって一種の自然な進化です」と彼は言います。 「それは、OK、特定のGPGPUワークロードにとってより重要なメモリシステムのようなものです。」

チームはまた、CPUクロック速度への150MHzのブーストが、実際に多くの人が信じているよりもはるかに重要であることを強調したいと考えています。

「興味深いことに、フレームレートドロップの最大のソースは、実際にはGPUではなくCPUから来ています」とGoossenは明らかにします。 「CPUにマージンを追加する...実際には、コアスレッドの観点からCPUに拘束されていたため、主にフレームを失っていたタイトルがありました。コンソールで安定したフレームレートを取得することを確認する際に。」

これは、一部のカスタムハードウェアブロック(データ移動エンジン)がCPU時間の解放に向けられている理由を部分的に説明しています。プロファイリングは、これが本物の問題であり、クロック速度ブーストと固定機能シリコンの組み合わせとバランスが取れていることが明らかになりました。

「多くのCPUオフロードが進行中です。標準設計と比較して、形状、より効率的なコマンドプロセッサがあります。クロックブーストがあります。 Goossenは続けますが、システムのデータ移動エンジンもGPUを支援できるようです。

1920x1080
1600x900
次世代のゲームでサブ1080pまたは動的解像度を見ることを期待してください。 CrytekのRyseは900pで実行されていることが確認されているので、ピクセル密度のこの低下で画質はどのようにしていますか?この比較をご覧ください。
1920x1080
1600x900
次世代のゲームでサブ1080pまたは動的解像度を見ることを期待してください。 CrytekのRyseは900pで実行されていることが確認されているので、ピクセル密度のこの低下で画質はどのようにしていますか?この比較をご覧ください。
1920x1080
1600x900
次世代のゲームでサブ1080pまたは動的解像度を見ることを期待してください。 CrytekのRyseは900pで実行されていることが確認されているので、ピクセル密度のこの低下で画質はどのようにしていますか?この比較をご覧ください。
1920x1080
1600x900
次世代のゲームでサブ1080pまたは動的解像度を見ることを期待してください。 CrytekのRyseは900pで実行されていることが確認されているので、ピクセル密度のこの低下で画質はどのようにしていますか?この比較をご覧ください。

「Esramの深さバッファーにレンダリングしたと想像してみてください。そして今、あなたは別の深度バッファーに切り替えています。今ではテクスチャになって、後でテクスチャをすることができるようにしてください。あなたはそのテクスチャーからたくさんの読み取りをしていないので、実際にはDDRでより理にかなっています。移動して、DMAエンジンはそれを行い、すぐにビットを移動するのではなく、次のレンダリングターゲットで動作します。

カスタムシリコンの他の領域は、グラフィックパフォーマンスを支援するように設計されています。

「ハードウェアオーバーレイでもGPU側で物事を行い、より一貫したフレームレートを確保しています」とGoossen氏は付け加えます。 「3Dコンテンツになることができるタイトルに2つの独立したレイヤーがあります。1つはHUDになります。Xbox 360よりも高品質のスケーラーがあります。これにより、実際に変更できることです。フレームごとのパラメーターに基づいてスケーラーパラメーター。」

動的解像度のスケーリングは新しいものではありません - 多くの現在のタイトルで実装されていることがわかりました。実際、現在の世代の最初の例は、ソニーのタイトルであるWipeout HDでした。画質への影響は720pで大まかになる可能性がありますが、より高い解像度で優れたスケーリングと協調して、実行可能なパフォーマンスイコライズ測定値になる可能性があります。

「私はCPUのグリッチについてフレームグリッチを引き起こすことについて話しました... GPUワークロードは、フレームにより首尾一貫したフレームになる傾向があります。CPUに乗るような大きなスパイクはありません。

「私たちがタイトルで見ているのは、フレームレートのグリッチを避けるために動的解像度のスケーリングの概念を採用することです。 、彼らは解像度で動的にスケーリングを開始することができ、彼らは真の解像度の観点から彼らのHUDを維持することができ、3Dコンテンツは再び絞ります。フレームレートのグリッチを持っているよりもピクセル数。」

「パワー/効率の観点からも、固定機能は固定機能ユニットでよりパワーフレンドリーです」とNick Baker氏は付け加えます。 「そこにもデータ圧縮を置くので、LZ圧縮/減圧と動きJPEGデコードがあり、Kinectに役立ちます。したがって、メモリのブロックから別のブロックに移動するよりも、データ移動エンジンにははるかに多くのことがあります。」

私たちは1時間以上詳細に話し合ってきましたが、私たちの時間は終わりに近づきます。議論全体は完全にハイテク中心であり、Xbox Oneの11月の発売がNick BakerとAndrew Goossenにとって個人的に非常に重要である可能性がほとんどないことを忘れていたところまで、私たちはほとんど忘れていました。開発中の数年後にコンソールが生産ラインからロールオフし始めるのを見るのはどのように感じられますか?

「ええ、何かを手に入れることは常に素晴らしい気持ちです[しかし]私のチームは並行して複数のプログラムに取り組んでいます - 私たちは常に建築チームで働いています」とベイカーは言います。

グーセンには最後の言葉があります:

「私にとって最大の報酬は、ゲームに行って、彼らが見栄えが良く、そうだと思うことを見ることです。これが私たちがすべての努力をした理由です。グラフィックスの男として、画面上でそれらのピクセルを見るのはとてもやりがいがあります。 「