Gemini AIは反発に直面しており、Googleは厄介であることを認めています

GoogleのGemini AIは、その機能について公開されたデモビデオから反発を受けています。

テクノロジー企業であり、人工知能(AI)のパイオニアであるGoogleは、新しいマルチモーダルAIモデルであるGeminiの機能を詳述したデモビデオを投稿したことで、ここ数日、多くの批判を受けています。

GoogleがGemini AIを発表

6月に開催されたI/O開発者会議で大規模言語モデル(LLM)の可能性を一般に公開した後、テクノロジーの巨人はついに今週初めにGemini AIを発表しました。 GoogleのCEOであるSundar Pichai氏は、XアプリでAIモデルの可能性を宣伝するビデオを共有し、そのインタラクティブ機能を強調しました。

人間とAI音声アシスタントの対話のように見えるもので、Geminiは線と図形を使用して作成されたアヒルを正確に識別します。 このビデオは、Gemini AIが視覚的な画像と物理的なオブジェクトを認識し、それらを区別できることを示しています。

このユニークな機能は、AIの設計とモデリングの新たなフロンティアを示しています。 Gemini AIはLLMのより包括的な使用を強調しており、これにより優れたユーザーエクスペリエンスが向上し、OpenAIのChatGPTとの厳しい競争が繰り広げられます。 さらに、Googleは、Geminiを使用すると、AIとスムーズな音声会話ができることを一般の人々に伝えようとしているようです。

残念なことに、この6分間の動画は、コンテンツが改ざんされたと感じた一般の人々から否定的な反応を引き起こしました。 特に、同社はYouTubeに「このデモの目的のために、レイテンシーが削減され、簡潔にするためにGeminiの出力が短縮されました」という説明を追加しました。 "

ただし、Xアプリでデモビデオを共有する場合、免責事項については言及されていません。

Googleは、ショーのビデオが編集されたことを認めています

グーグルはブルームバーグに対し、プレゼンテーションはリアルタイムで行われたものではないことを公然と認めた。

しかし、同社は「このビデオは、Geminiとの対話の可能性を示す実際のマルチモーダルプロンプトとテスト出力に基づいている」と述べています。 "

6 分間のプレゼンテーションを実現するために、AI 開発の背後にいる Google チームは静止画像を使用し、Gemini が応答するテキスト プロンプトを提供しました。 これは、Googleが視聴者に信じ込ませる概念とは異なります。

反発にもかかわらず、Googleは「12月13日にGemini Proがオープンしたときに人々が何を作るかを見る」ことを楽しみにしていると述べた。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン