Nvidia、ChatRTXを更新
はじめに
NvidiaのChatRTXアプリがバージョン0.3の更新をリリースしました。この更新により、新しい機能として写真検索機能やAIによる音声認識が追加され、AIの利用ケースが大幅に拡大しました。
更新内容
ChatRTXアプリは、サポート対象のLLMに新しいオプションを追加しました。Googleの最新のLLMであるGemmaや、オープンソースのChatGLM3-6Bが利用可能になりました。LLMを選択できるのは非常に貴重な機能であり、異なるLLMは同じタスクをまったく異なる方法で実行する可能性があります。ChatRTXの写真検索およびインタラクションツールも大幅に強化され、OpenAIのCLIPツールから借用した技術により、以前アプリによって必要とされた複雑なメタデータのラベル付けなしに画像を検索できます。
技術要件
ChatRTXユーザーは、WhisperというAI駆動の音声認識システムのサポートを追加し、ChatRTXが音声コマンドを理解できるようになりました。このテクニカルデモは、NvidiaのテンソルコアとTensorRTライブラリの力に頼っているため、RTX GPUが必要であり、現在のところ、初代RTX 20シリーズはサポートされません。したがって、アプリを自分で実行するには、少なくとも8GBのVRAMを持つNvidia RTX 30または40シリーズGPUが必要になります。
業界の背景
ChatRTXの更新は、特にコンシューマー向けRTXグラフィックカードの文脈において、AIの利用ケースにとって大きな前進です。NvidiaのChatRTXアプリは、コンシューマー向けRTXグラフィックカードによって推進されるAIの力のもう1つの実証です。ChatRTXプログラムは、コンピューターにローカルにインストールされたChatGPTに近いエクスペリエンスを提供し、AIの利用ケースにデータを利用することができますが、データが盗まれたり悪用されたりするリスクはありません。
AI駆動アプリの歴史
AI駆動アプリの概念は新しくありませんが、ChatRTXアプリはアクセシビリティと機能性という点で大きな前進です。以前のAI駆動アプリは、クラウドベースのサービスに依存しており、遅くエラーが発生しやすい傾向がありました。一方、ChatRTXアプリはユーザーのコンピューターでローカルに実行でき、より高速でセキュアなエクスペリエンスを提供します。
技術的メカニズム
ChatRTXアプリがメタデータのラベル付けなしに画像を検索できることは、重大な技術的成果です。これは、OpenAIのCLIPツールを使用することで実現されており、アプリは手動でのラベル付けを必要とせずに画像の内容を理解できます。この技術は、画像とどのように交流するかを変える可能性があり、ヘルスケアから金融まで、幅広い業界に重大な影響を及ぼす可能性があります。
下流への影響
ChatRTXアプリの更新は、AI駆動アプリの将来にとって重大な影響を及ぼします。このアプリが機能を拡大し続けるにつれて、新しい革新的なAIの使用方法が見られる可能性があります。独自のLLMを選択できる機能と、アプリがさらに多くのLLMと互換性があることは、近い将来に注目すべき重要な要素です。また、アプリがユーザーのコンピューターでローカルに実行できることは、データのプライバシーとセキュリティに重大な影響を及ぼす可能性があります。
注目すべき点
ChatRTXアプリが機能を拡大し、最終的に1.0リリースに向けて進化するにつれて、最近削除されたYouTubeリンクスクラブ機能の復帰が見られる可能性があります。また、アプリがさらに多くのLLMと互換性があることも重要な要素となります。異なるLLMは同じタスクをまったく異なる方法で実行する可能性があります。アプリの次の大きな更新は、アプリの長期的な潜在性と、AI市場での競争力の指標となる可能性があります。
結論
NvidiaのChatRTXアプリの更新は、特にコンシューマー向けRTXグラフィックカードの文脈において、AIの利用ケースにとって大きな前進です。このアプリが機能を拡大し続けるにつれて、新しい革新的なAIの使用方法が見られる可能性があります。独自のLLMを選択できる機能と、アプリがさらに多くのLLMと互換性があることは、近い将来に注目すべき重要な要素となります。