それは始まったDOOM 2016- 野心的なスイッチポート、それは単に不可能と思われました。しかし、それ以来、技術的に野心的な現在のコンソールタイトルの行列が任天堂のコンソールハイブリッドに移行し、素晴らしいものの到着に至りましたメトロレッドックス4Aゲームから - 非常に印象的なコンバージョンと、おそらく私たちが見た中で最も近い、最も本物の一人称シューティングゲームポートです。それで、秘密は何ですか?開発者は、5年前のNvidiaモバイルハードウェアからこのような印象的な結果をどのように達成できますか?
「最初は、パフォーマンス面では本当に大きな懸念がありました」と4Aの最高技術責任者であるオレス・シシコフストフは認めています。 「ご覧たとえば、ゲームシミュレーションコードよりもはるかに簡単です。」
変換作業の結果は、CPU仕様のあくびのギャップを念頭に置いて、確かに印象的なベアリングです。 4aは、PS4およびXbox Oneから既存のMetro Reduxゲームを翻訳することから始めました(そして、ポイントを強調するには、切り替えそうではありません最後の世代のポートを入手してください)、プロセス4Aチームが非常に迅速に実行しましたが、このゲームの初期バージョンは、1秒あたり約7〜15フレームのフレートしか管理できませんでした。ゲームは完全にCPUバウンドでした。
PS4およびXbox Oneの60fpsから30fpsまでのターゲットフレームレートを半分にすることは、システムを最適化するタスクを開始する前に必要でした。 「最初に、出エジプト記からReduxコードベースまでのいくつかの最適化をバックポートしました」とShishkovstov氏は説明します。 「その後、高レベルでのアニメーション処理と、A57から低レベルでA57からILP(命令レベルの並列処理)を抽出することに焦点を当てました。拘束された後、骨の留め具が到着しました。
そのように説明されているのは、スイッチのCPU制限に対する4Aの解決策はかなり簡単に思えますが、アセンブリレベルでのコーディングプロセス - 文字通りスイッチアームcortex -A57 CPUクラスターの母国語 - は公園を散歩することはできませんでした。アニメーションは多くのプロセッササイクルを吸い上げているため、システムへの詳細レベル(LOD)の遷移を追加するというアイデアは非常に理にかなっています。
この後、4AはGPUの最適化に移行し、すべてグラフィックスAPIの選択から始まりました。同社は、最もパフォーマンスのある低レベルのAPIをサポートしている長い歴史を持っています。メトロ出エジプト記DX11、DX12、Vulkan、およびGNMでさまざまなマルチプラットフォームリリースで実行されます。 Switch自体はOpenGLとVulkanをサポートしますが、最適なパフォーマンスのために、4AはSwitchで最高のパフォーマンスのためにNvidia自体が開発したAPIを選択しました。
「NVNはNXで可能な限り最低のグラフィックスAPIです」とShishkovstov氏は説明します。 「CPUのオーバーヘッドは無視できます。ほとんどの場合、GPUコマンドバッファーに書かれたほんの数個のdwordです。ハードウェアが能力を高め、清潔で公開します。たとえば、Vulkanよりもはるかに優れています。」
そして、私たちが特に興味を持っているのはここですどうやってスイッチは非常に少ないことから非常に多くを配信します。任天堂のハードウェアが最初に発表されたとき、Tegra X1プロセッサの唯一の経験は、最終世代のコンソール変換が通常パフォーマンスが低いShield Android TVから来ました。 NVNはここで本当に重要な違いをもたらし、4AはNvidia Maxwellアーキテクチャに直接アクセスできることを示唆しているようです。では、どのMaxwell機能がMetro Reduxで使用されているのでしょうか。
「私はそれについて話すことができるかどうかはわかりませんが、私たちはそれらすべてを使用しているようです」とShishkovstovは説明します。 「当社のGPUの最適化の多くは、メモリ帯域幅/オフチップトラフィックの削減に焦点を合わせていました。たとえば、NVNはメモリ圧縮、タイルキャッシュの動作とビニング、メモリレイアウト、エイリアシングのために多くのコントロールを公開しています。たとえば、ストレート即時モードのレンダリングG-Bufferの作成とシャドウマップレンダリング中にのみ使用されます。
この世代の多くのゲームと一般的に、Metro Reduxは、4Aが呼ぶように、開発者が時間的なスーパーサンプリングまたは時間的スーパー解像度を使用することにジャンプするのを見ます。アイデアは非常に簡単です。従来のスーパーサンプリングは、開発者が選択したピクセルカウントにダウンサンプリングする前に、ネイティブよりも高い決議でレンダリングするプロセスです。 TSRは同じ基本的なアイデアですが、代わりに過去のフレームから追加の詳細が収集されます。この技術は広く使用されていますスマートフォンカメラの品質の向上、しかし、ゲーム以外にも、他の用途もあります。
「これは、宇宙衛星から車のプレート番号を読むための有名なFBIソリューションです」とオールズ・シシコフストフは言います。 「問題は、スイッチのGPUにとって非常にテクスチャサンプリングと数学が重いことです。はるかに安価で大きな品質の妥協がないものを導き出さなければなりません。それは簡単ではありませんでした。 Maxwell GPU ISAは今の私の母国語です。
「最終結果は1080pで約2msのテクスチャサンプルとトリッキーな数学のみで約2msかかります。また、副産物としてアンチエリアシングを行います。そして、AAの品質だけがやや劣化しますが、訓練された目でもほとんど見えません。」
一時的なスーパー解像度を使用して、シシコフストフは、ネイティブ解像度のレンダリングの概念が特に関連性がないことを知っているため、いくつかの興味深い質問を提起すると考えています。分析を振り返ると、個々のフレームから数ピクセルのカウントを引くことができたことがわかります。ただし、このようなゲーム、Modern Warfare 2019など、画質について何らかの尺度を取得する新しいテクニックを考慮している他の多くのゲームです。 SwitchでのReduxは、PS4バージョンほどきれいに見えませんが、最終世代のバージョンのロックされた720pからMetroのようなイメージを引くと、画質は別のレベルにあります。
ドッキングされているかハンドヘルドモードで実行しているかにかかわらず、蓄積された出力はそれぞれ1080pまたは720pですが、明確さコンテンツに応じて、画像が調整されます。全体的な明確さの観点から、選択されたテクニックは、ポータブルでプレイすると特に印象的に見えます。これは、4Aがドッキングされたモードとハンドヘルドモードでゲームをどのようにスケーリングしたかという問題を提起します。
「ドッキングして、2倍の速い2枚のGPUを取得しますが、帯域幅は適度にしかありません。そのため、魔法のように2倍高速ではありませんが、それでもかなり速いです」とシシコフストフは説明します。 「それにより、たとえば、より多くのオブジェクトのピクセルあたりの速度をレンダリングすることで、わずかに正しいTSRとAAが得られました。ハンドヘルドモードでは、HUD/武器の速度のみを描画します。
「また、Reduxコンテンツは多くのメッシュのジオメトリロッドが不足していました。アートチームがExodusで忙しかったため、巨大な)DLC -Glusmed Oneをプログラム的に生成しました。積極的なLODスイッチングは、ユーザー/ゲーマーの観点からはほとんど目立ちませんが、ハンドヘルドは常に720p、ドッキングは常に1080pです。
また、Metro Reduxポートの印象的なのは、ターゲット30fpsフレームレートを維持する際の完全な一貫性です。 ID Tech 6コンバージョンについて話しているかどうか、それは重要なポイントです。ウィッチャー3、ウォーフレームまたは、他の「不可能なポート」のほとんどがスイッチに向かっているため、一貫したパフォーマンスレベルを見つけることはまれです。
「私たちが打ってよかったです一貫性のある30fps、「Shishkovstov。」60近くを打つ唯一の方法は、1つのシミュレーションフレームごとに2つのレンダリングフレームを実行することです。根本的に品質の低下と一貫性のない入力遅延。それは私が支払いたい価格ではありません。 30fpsで実行することで、品質の妥協はありませんでした - 素材や照明シェーダーでさえ、PS4やXbox Oneとまったく同じです。」
ゲームが30fpsで非常に頑固に実行される方法については、4aはそれを下げます以上-最適化。 「TSRがなくても、ゲームはゲーム全体で99%以上のフレームでハンドヘルドモードで720pで一貫した30fpsを生成し続けます。TSRは、1080p/ドックモードでより[有用]です。」
開発中のスイッチハードウェアの改善という継続的な噂で、任天堂とNvidiaがどこで革新を選択するかを見るのは面白いと思いました。結局のところ、PlayStation 4のデザインの成功の多くは、Sony Shifting Focusとオンボード開発者のフィードバックを採用しています。
「私たちは一般的にCPUバウンドであるため、追加のコアは間違いなくリストに載っています。帯域幅とGPUパワーも傷つくことはありません」とシシコフストフは提供します。最前線にCPUのパワーを置くことは驚くべきことかもしれませんが、グラフィックスはコアゲームコードよりもはるかに簡単にスケールします - そして私たちのスイッチオーバークロックテスト、CPUの周波数を増やすことは、グラフィックコアをアップクロックするよりも多くのゲームに影響を与えることが判明しました。
そして、私たちが新しいハードウェアのテーマにいる間、SonyとMicrosoftの次世代コンソールはどうですか?開発者はNDAの下にいるので、ハードウェアの技術的な詳細について話すことはできません。ただし、新しいマシンの重要な側面は、PS5とXboxシリーズXの両方が、リアルタイムレイトレースのGPUでサポートを加速したという事実など、一般の知識です。
「私たちは完全にレイの追跡に興味があり、古い学校のコードパス/テクニックを完全に落としています」とシシコフストフは明らかにします。 「私たちは内部的に多くの実験をし、これまでに壮大な結果をもたらしました。私たちが将来のプロジェクトに実装するものを見るのを待つ必要があります。」