多くの昨年と同じです、AIはGDC 2024での町の話を引き続き講演しています。RobloxStudioは、新しい生成的なAIベースのキャラクター作成者を発表しました。グラフィックカードメーカーのNvidiaは、新しいAIを搭載したチップを発表し、株価を急上昇させました。そして、密室の後ろで、Ubisoftはマスコミの小さなコレクションに独自の何かを示しました。InworldAIとのパートナーシップでは、「新しく進化するNPC」のプロトタイプ、またはUbisoftが呼び出すようにNeo NPCを作成します。
ここでは「プロトタイプ」要因を強調することが重要です。イベントで、Ubisoftは、Ubisoft ParisとサポートするUbisoft Production Technologyの乗組員が率いる研究チームの起源を説明する簡単なプレゼンテーションと、しばしばプロジェクトを「実験」と呼んでいます。この後、私は座って実際に、仮説的なゲームシナリオ内で活動中のテクノロジーの3つの3つの長いデモを「プレイ」する機会がありました。しかし、これらのデモは技術的にプレイ可能でしたが、今のところ「独立した概念の証明」として明示的に説明されていました。実践的な時間の後の簡単なパネルディスカッションで、R&DチームのシニアデータサイエンティストであるMélanieLopezMaletは、「表面を傷つけているだけです... [実際のゲームで]私にとっては、私にとっては実装でもないと言いました。レーダー。"
それでも、これは、主要なスタジオの実際のプレイヤー向けの役割で使用される生成AIの最初の作業例の1つであり、機能します。一種の。
完全な前提は、Ubisoftの言葉では、NPCSを使用して生成AIを使用するための典型的なアプローチ - 大規模な言語モデル(LLM)MODSがDialogue Optionsにパッチする標準ゲームのMODS-が多少「空」または「浅い」ことが多かったことです。 「実際には。彼らは技術的に何でも言うことができますが、これらのNPCが言うことはゲーム自体に影響を与えません。そして、科学監督のDavid Louapreが言ったように、あなたが終わらせたのは「ゲームプレイではなく、ロールプレイ」です。 Neo NPCSの目標は、2つをマージすることをすることです。
デモは、この技術が実際に使用されるものの例として使用されました。最初は、仮説的なUbisoftゲームからわずかに似顔絵の抽象的な抽象的なブルームと呼ばれるキャラクターとの会話を含みました。デニムのシャツと垂れ下がったビーニーの老人であるブルームは、抵抗の一員であり、「互換性のある雰囲気があるかどうかを確認する」ようにあなたを知りたいと思っています。あなたにはいくつかの目的があります - 彼と友達になり、特定のトピックについてもっと知りたいなど、会話に結びついています。そして、会話自体は音声からテキストを介して行われます。あなたはLTを押し続けてマイクに話しかけ、それに応じてBloomは反応します。
2番目のシナリオでは、ブルームが再びおしゃべりをしているため、このチームはゲーム内のテレビ画面にリアルタイムで反応し、敵の場所を忍び込んで、3番目の画面外のキャラクターに制御します。ブルームは、モニターに表示されるときに「敵の兵士がスポットされた」と叫ぶことで反応し、あなたとチャットし、ミッション関連の会話プロンプトを提供します。
3番目のシナリオでは、Ironと呼ばれる別のキャラクターとチャットしています。 GTA Heistスタイルのセットアップでは、潜入したい敵の基地のフロアプランを表示する計画委員会を検討しています。アイアンは、私たちがそれにどのようにアプローチしたいかを私たちに尋ね、私たちが言うことにそれに応じて反応します。最終的には実際にプレイ可能なオプションのセットリストの1つに同意します - たとえば、窓のそばに木を使用して建物にグラップルホックするか、または使用してカバーのための煙の手rena弾は、部屋の周りに横たわっていることに気づき、提案として提供されました。
このすべてからの第一印象 - そして実際にデモを見た他の複数のジャーナリストとのいくつかの会話で実際に出てくるもの - これは少し馴染みがあるということです。 Peter Molyneuxは、E3 2009ステージで悪名高い瞬間を覚えているなら、彼の運命の人工知能の友人であるミロとかなり似たものを約束しました。
自尊心のある哺乳類のように、運命にあるかどうかにかかわらず、私の種のメンバーのふりをしている人工的なエンティティとの会話に従事することに対する私の最初の反応は、それを容赦なく楽しむことでした - または少なくとも、その論理の境界をテストすることでしたそして、それがどこで失敗するかを見てください。結果は混ざり合っており、Neo NPCSの制限が何であるかについての良い洞察を与えました。別のジャーナリストと一緒に、ブルームが抵抗にもたらすことができる専門家のスキルについて私たちに尋ねたとき、私たちはポールを越えてスムーズな話をすることを提案しました。私たちと一緒にその飛躍をしてください。
2番目と3番目のデモに進むと、キャラクターは以前に話したことを思い出しました。しかし、敵の化合物の上部窓から自分自身を推進するために大きなポールを見つけることを提案するための最善の試みにもかかわらず、私たちは常にプレイ可能なゲーム内オプションに戻ってきました。同じことが、大きな段ボール箱を見つけて、頭の上に置き、しゃがみ込んで、それを使って警備員を通り過ぎるという提案にも当てはまりました。私たちの両方に合うほど大きい段ボール箱を見つけます」と鉄は鋭く観察しました。
非常に初期のプロトタイプであるため、会話はLLM駆動型チャットボットで通常の制限に反しました。たとえば、話された対話は人間の編集者を渡すことはほとんどありません。たぶん、「ギャラリーの窓の窓を通り抜ける」ことができ、ある時点で鉄を提案しました。 「ああ、ネルソン、あなたは確かに抵抗に勝つ方法を知っている」とブルームは以前に邪魔した。研究チームのナラティブディレクターであるヴァージー・モッサーは、彼女の仕事は、「俳優を即興俳優」に促す監督のようなものであると説明しました。 「作家として、私のキャラクターが生き返り、実際に初めて私と会話するのを見ることは、私のキャリアの中で最も充実した感動的な瞬間の1つでした」と彼女はプレスリリースで言っていると引用しています。あなたが作成したキャラクターとのオープンな会話をするのは驚くべき瞬間であるに違いないことは間違いありませんが、古い映画が言うように、監督は彼らの俳優と同じくらい良いです。
さらに興味深いのは、プロトタイプ自体の中心にあるやや実存的なジレンマです。はい、NPCはあなたが彼らに言うことは何でも、ほぼ無限の可能性と反応することができ、その後、実際の変化するゲーム内の目標、シナリオ、クエストなどにそれらの反応をつなぐことができます。しかし、UbisoftがこれらのネオNPCをチャットボット以外に設定すると主張するのは、最終的に人間が設定した「壁」内に配置されるという事実です。したがって、箱の中の警備員にscutthingを提案することができますが、このシナリオで20-ODDの事前セットソリューションの1つでない限り、実際にはできません。 (実際、鉄に通知することでこれをテストしたとき、彼女が私に大きな段ボール箱の戦略を使わせない限り、私はミッションに行くことを拒否します、彼女は容赦しました - Ubisoftの専門家が私にエラーだと言ったことです)。
あなたが残しているのは、標準的なゲームに非常に似たものです。環境で手がかりを求めて扱いやすいものや使用可能なものについての手がかりを求めて、キャラクターが「はい」と言うまで提供し、その事前にプログラムされた選択を進めます。その上にある無限の会話はすべて、あなたの没入のために効果的に色 - ロールプレイですが、それでも実際にはゲームプレイではありません。
また、音声からテキストなしで入力として(またはキーボードを使用する可能性がある)ことなく、これがどのように機能するかには制限があります。これ自体が、ほとんどのプレイヤーにとって実際には好ましい選択肢ではないと指摘したものです。しかし、ボイス要素を削除することは、標準のゲームデザイン戦略に再び戻ることを意味します。ダイアログオプションのセットリストを作成します。ゲーム内で何かを発見するまで、それらのいくつかが可用性をトリガーするまで隠し、言いたいものをスクロールするだけです。
左から:MélanieLopezMalet(シニアデータサイエンティスト)、David Louapre、(科学ディレクター)、エマニュエルアスティエ(シニアリードプログラマー)、Xavier Manzanares(プロデューサー)、Virginie Mosser(ナラティブディレクター)
そしてもちろん、生成AIが関与している場合、これまでと同じ質問が残ります。たとえば、使用中のモデルのトレーニングデータについては言及されていませんでした。の答えInworld AIのWebサイトのFAQセクション、GPT -4やCHATGPT(現在はニューヨークタイムズなどからの著作権侵害訴訟の主題)などのAIの大規模な言語モデルがオープンしているかどうかという問題に、これは述べていますが、物事は異なるかもしれませんが、このUbisoftパートナーシップで特別に使用されるテクノロジーの場合:
「キャラクターを駆動する20以上のモデルがあります。これには、感情、テキストへのスピーチ、スピーチツーテキストなどの非LLMモデルが含まれます。LLMの場合、LLM APIと独自の独自モデルを動的に切り替えます。会話のコンテキストとレイテンシーに最適です。 。
結果は、Ubisoftのチームがイベントで自分自身を言ったように、それが実際に何であるかよりも将来の「可能性がある」という概念に依存するプロトタイプです。たとえば、現在の種類の発見や、それらのNPCが発見または遭遇するものとそれらがどのように振る舞うかとの間のより複雑なリンクよりも「ビジョン」に近いものがある可能性があるという提案がありました。
その意味で、それはそれにある程度の恩恵を受ける価値があります:Ubisoftは「クリエイティブのために何が入っているのか、プレイヤーのために何が入っているのか」と尋ねることを強調するのに苦労していました、そして、試みはありますテクノロジーを実際のゲームプレイの使用に一致させてみてください。繰り返しになりますが、これらのデモは事実上、単なるモックアップであり、プレイ可能な概念の証明であるため、手元の個々のクエストデザインではなく、テクノロジーについて説明するものについて判断することが重要です。
しかし、それは別の問題にも戻ってきますいくつかの- すべてではありません - 特にビデオゲーム、および最近の他のおそらく革新的なアイデアの多くのAIテクノロジーの形態。とりあえず、これはすべて純粋に投機的なままです。これは、最初に構築されたツールです。それを構築すると、賢い人がきっと登場し、それを利用するという概念に基づいています。それはやや前面に戻っていると言う議論があります。最高のツールは、賢い人々がすでに持っている問題の解決策です。
同じNeo NPCプレスブリーフィングで話すと、UbisoftのボスYves Guillemotは生成AIを次のように説明しましたテストされるもう1つの新しいテクノロジー。