2つの重要なPCテクノロジーが2018年の終わりに向かって出現し始めました。ハードウェアアクセラレーションレイトレースと機械学習ベースのスーパーサンプリングです。 Nvidiaのブランドの変化の基礎をGTXからRTXに形成することで、テクノロジーは長年にわたって洗練され続けてきました。新しいRTX 4000グラフィックスラインが到着すると、パフォーマンスブーストテクノロジーに新しいイノベーションがあります。 DLSS 3は、既存のDLSS 2ベースの空間アップスケーリングにAIフレーム生成を追加します。私たちは過去10日間、テクノロジーをそのペースを通じて配置してきましたが、結果に感銘を受けました。
Nvidiaは、3つのDLSS 3対応タイトルの不完全なプレビュービルドとともに、GeForce RTX 4090を事前に提供しました。サイバーパンク2077。後者は、新しいRTオーバードライブバージョンと混同しないでください。DLSS3を追加しただけで、既存の小売バージョンと共通点があります。 RTX 4090およびDLSS 3を実行している場合でも、これらのゲームは4K 120Hz画面で完璧に走ることができます。 Nvidiaは、DLSS 3について次世代の経験のイネーブラーとして話しています。ゲームのパストレースの演出。マーベルのスパイダーマン? Nvidiaは、RTX 4090が200fpsでゲームを実行しているプロモーションビデオを示しています。残念ながら、このコンテンツに独自のフレームレート数を表示することはできません - パフォーマンスの乗数のみです。
ナッツとボルトのレベルでは、DLSS 3は実際には、Nvidiaが何年も開発してきた3つの異なるテクノロジーのスイートです。これは、既存の非常に成功したDLSS 2から始まります。現在、画像再構築に基づくアップスケーリングのためのトップピック(Intel XessとAMD FSR 2.xが近づいています)。これには、DLSSフレーム生成が加わります。基本的に、GPUは2つのフレームをレンダリングし、2つのフレーム間に新しいフレームを挿入します。これは、モーションベクトルなどのゲームデータの混合と光フロー分析など、新しいADA Lovelaceアーキテクチャの修正された固定機能ブロックによって配信されます。最後の世代のアンペアの3倍速いと言います。
フレームは現在バッファリングされているため、パイプラインに追加のレイテンシが追加されます。これは、Nvidiaが遅延削減技術であるReflexで軽減しようとしています。せいぜい、反射は余分なバッファリングによって引き起こされる余分な遅延を無効にし、おそらくさらにミリ秒をノックオフすることさえあります。最悪の場合、ゲームには追加のレイテンシが追加される可能性があります。最初の調査結果を後で共有します。フレーム生成をまったく使用していないことを止めるものは何もありません。それがあなたが望むものであれば、ラグ削減反射のオファーを単に銀行するだけです。 Ada Lovelaceの光フローアナライザーの速度のため、以前のチューリングとアンペアカードはDLSSフレームの生成を実行できません。 RTX 2000およびRTX 3000シリーズカードの所有者の場合、これはDLSS 3のサポートされたタイトルがDLSS 2のアップスケーリングと反射潜時の利点を提供することを意味しますが、フレームの生成はテーブルから外れています。
バッファリングがフレームジェネレーションでどのように機能するかを見ると、SLIで使用される古いAFR(代替フレームレンダリング)テクニックを思い出します - 2つのグラフィックカードが他のすべてのフレームをレンダリングするタンデムで機能します。これにより、レイテンシが同様に増加しましたが、反射の緩和はありませんでした。したがって、実際には、同じGPUのDLSSフレーム生成がSLI時代から2番目のグラフィックカードの代わりになっています。それでも、肝心なのは、DLSS 2/FSR 2.x/XESSのスピードアップレンダリングとレイテンシの削減 - フレーム生成のようなものがそうではないということです。私たちが持っていたテストゲームに遅れをとることへの影響は問題ではありませんが、このテクノロジーは、ラグのミリ秒ごとにトッププレーヤーにカウントされる超高速のeSportsタイトルに適しているとは思いません。
また、生成されたフレームは、伝統的にレンダリングされたフレームほど「完璧」ではないという概念に対処する必要があります。非常に速い動き - 特にカメラに近い - はアーティファクトを引き起こす可能性があります。また、HUD要素には、テクノロジーを追跡するためのモーションベクトルがありません。これにも問題があります。ただし、実際のゲームプレイでは、問題は最小限です。加速は、ほとんどのゲームを120FPSまたはそれを超えるものにしているため、フレームごとの持続性は非常に低いことを意味します。一方、これらの生成されたフレームは、伝統的にレンダリングされたものに挟まれていることを忘れないでください。ビデオコンテンツでは、120FPSキャプチャがハーフスピードで実行されていることがわかります。そこでも、視覚的な不連続性を取り上げるのは難しいです。 DLSS 3フレームの生成が不足している場所を知ることができるのは、長期にわたる目玉でのみです。




それでも、GPUによって3MSでレンダリングされた新しいテクニックの結果は、そこにあるオフラインのフレームレートアップスカラーの最高をはるかに超えています。それをテストするために、DLSS 3を使用してMarvelのSpider-Manから同じコンテンツをキャプチャし、Adobe After Effects 'Pixel Motion TechnologyとTopaz Video Enhing AIのChronos Slowmo V3モデルを使用して60fpsキャプチャに対して積み重ねました。 RTX 3090に裏打ちされたRyzen 9 5950xのフレームごとの計算コストは、それぞれ750msと125msです。 DLSS 3はゲームに統合されており、重要なエンジンデータにアクセスし、シリコンでの特定のハードウェアアクセラレーションに裏付けられているため、優れた結果が得られます。言うまでもなく、これらのテクニックはすべて、今日のテレビで使用されている「モーションスムージング」よりも優れているということです。リアルタイムのフレーム補間に限定されているため、結果はここに示されているAdobeおよびTopazのショットよりも避けられないほど貧弱です。 3はすでに改善された結果を提供しています。
パフォーマンスの向上は演習のポイントですが、新しいエクスペリエンスを可能にするための応用もあります。 Portal RTXは、Nvidiaの新しいRTX Remixプラットフォーム上に構築されています。基本的に、Remixは古いタイトルに統合されており、古典的なPCゲームの完全にパストレースの演出が可能になります。基調講演では、Morrowindがどのように新しいRTの外観を受け取ったかを見ましたが、実際にはPortal RTXを実践してきました。これは、ゲームを見るための本当に美しい新しい方法です。
パストレースがリリースに近いポータルとどのように統合されるかについて話しますが、その間に、テストでは、すべての最大のパフォーマンスの増加が明らかになりました。 PATHトレースはGPUで非常に重く、ワークロードが重いほど、DLSS 3フレームの生成だけでなく、DLSS 2のアップスケーリングによってもパフォーマンスの隆起が大きくなります。以下の表は、DLSS 2からの3.19倍のパフォーマンスアップリフトをそれ自体で示しており、フレーム生成を追加すると5.29倍に上昇します。スクリーンショットには、「最悪のシナリオ」が水と2つのポータルをまとめたものが表示されます。また、レイテンシー数に注意してください。この場合、Nvidia反射は、フレーム生成バッファリングによって導入された余分な遅延を実際に無効にしています。 DLSS 2バージョンと同じように感じます。これは、ネイティブレンダリングよりもはるかに反応が良いです。
ポータルRTXテストチャンバー14 | パフォーマンス微分 | 反射 | 反射 |
---|---|---|---|
ネイティブ4K | 100% | 129ms | 95ms |
DLSS 2パフォーマンス | 317% | 59ms | 53ms |
DLSS 3フレーム生成 | 529% | - | 56ms |
Marvel's Spider-Manは、まったく異なる課題を提示します。コアi9 12900Kであっても、ゲームのレイトレースされた反射が有効になったときに、今日のGPUはCPUによって簡単にボトルネックすることができます。すぐ下のスクリーンショットを見ると、このQuickTimeイベントでは、DLSS 2でフレームレートが15.2%増加していることがわかります。はるかに高いパフォーマンス。ここで実際に起こっているのは、ネイティブ4KではGPUが制約されているのに対し、DLSS 2はCPUの制限に到達するのを見ているということです。
DLSS 3フレーム生成は、作成するフレームの指示の準備をCPUに依存していないため、パフォーマンスの増加が始まりますにもかかわらずCPUは完全にタップアウトされています。プロセス全体は、プロセッサの完全に独立しています。これを動いているのを見るには、チェックしてくださいNvidiaのプロモーションビデオ、都市のトラバーサルに集中する - ゲームの最もCPU集約型の部分。そのトレーラーのアクションの大部分は、約100〜120FPSでCPUが制約します。 DLSS 3フレーム生成は、フレームレートを効果的に2倍にしています。
以下の表については、GPUに可能な限り課税しようとしました。奇妙なことに、ピーターパーカーのFeast HQへの訪問はグラフィックスにはるかに影響を与えます。それでも、パフォーマンスが36%増加しているだけで、CPUの制限に達しました。ただし、フレーム生成はフレームレートを増加させ続けています。また、ここで注目に値するのは、反射がDLSS 3でレイテンシをあまり助けないことです - CPUとGPUの関係を最適化することで技術は機能します。それでも、ゲームは非常に速いため、レイテンシの数値は全面的に非常に低くなっています。
マーベルのスパイダーマンフィーストHQ | パフォーマンス微分 | 反射 | 反射 |
---|---|---|---|
ネイティブ4K | 100% | 39ms | 36ms |
DLSS 2パフォーマンス | 136% | 24ms | 23ms |
DLSS 3フレーム生成 | 219% | - | 38ms |
テストに提供された最終タイトルは、からのサイバーパンク2077のプレビュービルドでしたCD Projekt Red。ビデオでは、チェリーブロッサム市場を通過して、夜の街から砂漠へのより長いドライブをカバーする2つのテストがあります。 4Kの解像度とフルRTの設定が整っていると、サイコ照明の設定まで、そしてベースフレームレートが低いほどパフォーマンスが大きくなるという証拠が増えています。
この場合、フレームレートは4倍に増加します - 繰り返しますが、最も要求の厳しいPCビデオゲームの1つを4K 120Hzディスプレイで美しく再生するエクスペリエンスに変換します。ページの上部に埋め込まれたビデオでは、60fpsのビデオで動作するために50%の速度が低下したかなりの量の4k 120fpsキャプチャが速度が低下したことがわかります。そこに流動性があるという考えが得られます。
このプレリリースプレビューコードでは、DLSS 3のNVIDIA反射潜伏率数値は、DLSS 2を反射と一致させることができません。これは「非公式」ターゲットになると予想しています。それでも、ここで記録された12msの赤字は、サイバーパンク2077を含むほとんどのトリプルA運賃の経験にそれほど有害ではないことはほとんどありません。より多くのDLSS 3タイトルの潜伏運賃を今後どのように確認する必要があります。
サイバーパンク2077市場 | パフォーマンス微分 | 反射 | 反射 |
---|---|---|---|
ネイティブ4K | 100% | 108ms | 62ms |
DLSS 2パフォーマンス | 258% | 42ms | 31ms |
DLSS 3フレーム生成 | 399% | - | 54ms |
テストをまとめて、RTX 4090が最終世代のアンペアアーキテクチャのシリコンチャンピオンであるRTX 3090 TIに対してパフォーマンスの順調にどのように形成されるかについてのデータが限られています。フレームレート数値を開示していないこととは別に、NVIDIAが求めていた他の制限は、古いカードのGen-on-Gen比較を古いカードのDLSS 2に制限することでした。理論的根拠は、レビューデイの禁輸のために純粋なパフォーマンス数を抑制する必要があるということです。ここでは、ユーザーはPC Press全体で提供される数値とパフォーマンスを比較できます。限られたDLSS 2対DLSS 3の比較は完全に理想的ではないかもしれませんが、これらのカードの使用の可能性のあるシナリオを表していると思います。
最初にポータルRTXを見ると、テストチャンバー14から召集できる最高のGPU負荷を設計した静的シーンからの画像があります。 Ada LovelaceのAmpere vs DLSS 3のDLSS 2は、基本的に全体的に3倍のパフォーマンスを提供します。最も基本的なレベルでは、4K 60Hz変数のリフレッシュレート画面での優れたエクスペリエンスが、4K 120Hzディスプレイで完璧に実行されるという点でゲームを変えることです。
私たちがプレイしたサイバーパンク2077のプレビュービルドについても同じことが言えます。パフォーマンス乗数Gen-on-genはポータルRTXほど大きくないかもしれませんが、RTX 3090 Ti側のベースフレームレートは大きくなります。繰り返しになりますが、RTX 4090の素晴らしい120Hzエクスペリエンスに対して、古いカードの60Hz VRRエクスペリエンスの違いです。
RTX 3090 Ti DLSS 2 | RTX 4090 DLSS 3 | |
---|---|---|
ポータルRTXストレステスト | 100% | 291% |
サイバーパンク2077市場 | 100% | 247% |
明白な質問に取り組んで、真鍮のタックに取り掛かることで作品を締めくくりましょう。まず第一に、AI生成されたフレームの画質は持ちこたえますか?これは、アクションの速度と、動きを追跡するためのDLSS 3アルゴリズムの能力に依存します。ムーブメントが速いほど、生成されたフレームの正確性が低くなります。各画像のフルスクリーンビューに切り替えて、フレーム1、2、3のフレーム間を移動します。 2番目のAI生成フレームの不連続性は簡単に表示されますが、各フレームがわずか8.3ミリ秒間持続すると簡単にわかりますか?答えは...そうではありません。また、スパイダーマンの腕と脚がフレームからフレームへの腕と脚の様子に注意してください。これは、合計24.9msのゲーム時間にわたって、これら3つの画像のモーションがどれだけ速いかを示します。
次に、Zoomerブロックの左側とのサードパーソンマン画像の比較を見てください。繰り返しますが、合計24.9msでキャプチャされたように、3つのフレーム間のフルイメージモードとサイクルに切り替えます。これは、ゲーム内の通常の動きに近いものを表しています。このシナリオでは、DLSS 3生成されたフレームは完全に近く、黄色のHUD要素のみが問題を抱えています。 120Hzの画面で演奏されますが、これはちらつきのようなものです。
明白な質問の次の次:DLSS 3フレーム生成がRTX 2000および3000カードで利用できないのはなぜですか? Nvidiaによると、Ada Lovelaceの光フローアナライザーは、Ampere同等物の3倍高速であり、これはDLSS 3の3MS世代コストに大きな影響を与えると言います。別のメモでは、アナライザーはRTX 4000カードで同じくらい速く実行される固定機能ブロックです。私が想像できる古いカードの唯一の選択肢は、古いカードの品質の低いバージョンです。 AdobeのPixel MotionおよびTopazビデオがAIのChronos Slowmoモデルを拡張するアレックスバタリアと私が気づいたことの1つは、フレームあたり8.3msで120fpsで再生することであり、見た目の悪いAIフレームでさえ、実際に再生されるマスターを渡すことができるということです。時間。
次に、フレーム生成がCPU制限をどのように克服するかに取り組みましょう。 MarvelのSpider-Manでは、コアi9 12900Kでのテストはパフォーマンスを2倍にし、ゲームはまだSomoothを感じました - ベースフレームレートはCPUによって完全に抑制されました。ただし、フレーム生成はフレーム増幅とも呼ばれます。 CPUが良いフレームタイムを供給していない場合、st音も拡大することができます。私自身の好奇心のために、私は、一貫したフレームタイムを供給する機会がないCPUである低いRyzen 3 3100で、RTでマーベルのスパイダーマンを演奏しようとしました。フレームレートはフレーム生成とともに劇的に増加しましたが、st音も増幅されました。 CPU制限ゲームを克服するには、DLSS 3に最適なアプリケーションがあります - たとえば、Microsoft Flight Simulatorのように- しかし、CPUからの良好な一貫したフレームタイムがまだ必要です。
このテストに参加する計画は、完全なレビューをあまり台無しにすることなく、DLSS 3を広範なストロークでカバーすることでした。しかし、この作業は、私たちが想像していたよりも包括的であることになりました。問題は、DLSS 3が提供するものとテストする方法の表面をまだ引っ掻いていないことです。
私たちがまだテストしようとしているという点では、ベースフレームレートがどれだけ低いかという問題があります。たとえば、AI生成されたフレームの視覚的な不連続性は、増幅された120でゲームをするときに見るのが難しいです1秒あたりのフレームですが、100fpsについてはどうですか? 90fps? 80fps?極端なレベルでは、DLSS 3は実際に30fpsゲームを60fpsのように見せるために機能する可能性がありますか?ゲームからゲームまで一般的な画像補間に固有の弱点はありますか?これは、GPUから見たことのない先駆的なものです。
長期的な影響は興味深いものであり、Cyberpunk 2077のRT Overdriveアップグレードがあるので、非常にエキサイティングなものが見られます。これはゲームの変容であり、ゲーム内のすべての照明がレイトレースを介して達成されます。実際、それは市場で最も要求の厳しいPCゲームの1つのパストレースの演出です。コンソールはこれを行うことはできませんでした - それは彼らの能力をはるかに超えています。 2つの異なるレンダラーを提供することで、マルチプラットフォーム開発の保存が見られ、同時に完全に変革された次世代のPCエクスペリエンスを提供します。それは魅力的な考えであり、将来のコンテンツでDLSS 3とCyberpunk 2077に戻ります。