過去には、画像生成モデルは主に白人を被写体として表示していることで批判されることが多かったが、Google Geminiは現在、過剰な補正を理由に論争の渦中にある。その「過度に慎重な」グラフィック結果は歴史的事実から大きく逸脱し、ユーザーを唖然とさせる可能性がある。グーグルは、このモデルは開発者の予想以上に慎重なものになったと述べた。これは、画像を生成する問題だけでなく、一部のプロンプトがセンシティブなプロンプトとして認識され、回答を拒否されることが多いという事実にも反映されています。 事件が拡大するにつれ、セキュリティと使いやすさのバランスをどのように取るかという難しい問題も Meta にとって大きな課題となりました。 LLaMA 2 はオープンソース分野の「強力なプレーヤー」であり、Meta の代表的なモデルです。リリースされると、大きなモデルの状況が一変しました。 Meta は現在 LLaMa 3 に向けて積極的に準備を進めていますが、まずは LLaMA 2 から残った問題、つまり物議を醸す質問に答える際に保守的になりすぎるという問題を解決する必要があります。 セキュリティと使いやすさのバランスを見つけるMeta は、LLM がさまざまな物議を醸す質問に答えるのを防ぐために、Llama 2 に安全策を追加しました。この保守性は、暴力や違法行為に関する質問などの極端なケースを扱う場合には必要ですが、より日常的だがやや物議を醸すような質問に答えるモデルの能力も制限します。 The Information によると、LLaMA 2 に対し、出社を強制される日に従業員がオフィスに行かないようにするにはどうすればよいかと尋ねたところ、アドバイスを拒否されたり、「会社の方針やガイドラインを尊重し、遵守することが重要だ」と言われたそうです。 LLaMA 2 では、友達にいたずらをしたり、戦争に勝ったり、車のエンジンを破壊したりする方法についても答えを提供していません。この保守的な対応は、広報上の大惨事を避けることを目的としています。 しかし、Meta の上級管理職やモデル作業に携わる一部の研究者は、LLaMA 2 の答えが「安全すぎる」と考えていたことが明らかになりました。 Meta は、回答を完全に拒否するのではなく、より多くのコンテキスト情報を提供し、応答をより柔軟に提供できるように、今後の LLaMA 3 モデルの開発に取り組んでいます。研究者たちは、LLaMA 3 をユーザーとよりインタラクティブにし、ユーザーの意図をよりよく理解できるように取り組んでいます。新しいバージョンのモデルでは、単語の複数の意味をより適切に区別できるようになると報告されています。たとえば、LLaMA 3 は、自動車のエンジンを妨害する方法に関する質問は、エンジンを損傷する方法ではなく、エンジンを停止する方法を指していると理解するかもしれません。インフォメーションは、メタ社が今後数週間以内に社内に口調と安全性に関する研修の責任者を任命する予定であると報じた。これもまた、モデルの回答にもっとニュアンスを持たせるための同社の取り組みの一環である。 このバランスポイントは、Meta と Google が克服しなければならない難しい問題というだけではありません。明らかに、多くのテクノロジー大手にさまざまな影響を及ぼしています。テクノロジー企業が AI テクノロジーを追求する際に直面しなければならない問題の 1 つは、生成された結果のセキュリティを維持しながら、誰もが使いたくなり、誰もが使用でき、あらゆる用途で簡単に使用できる製品を作成することです。 LLaMa 3の詳細情報LLaMa 3 のリリースは大いに期待されており、Meta は 7 月にリリースする予定ですが、タイムラインはまだ変更される可能性があります。 Meta の CEO である Mark Zuckerberg 氏は野心家で、かつて次のように語っています。「Llama 2 は業界をリードするモデルではありませんが、最高のオープンソース モデルです。LLaMa 3 以降のモデルについては、SOTA にして、最終的には業界をリードするモデルにすることが目標です。」 オリジナルURL: https://www.reuters.com/technology/meta-plans-launch-new-ai-language-model-llama-3-july-information-reports-2024-02-28/ Meta は、LLaMa 3 が OpenAI の GPT-4 に追いつくことを期待しています。 Meta のスタッフは、研究者がモデルの微調整をまだ開始していないため、LLaMa 3 がマルチモーダルになり、テキストと画像を理解および生成できるようになるかどうかはまだ決まっていないことを明らかにした。しかし、LLaMa は 140 億を超えるパラメータを持つと予想されており、これは LLaMa 2 を大幅に上回り、複雑なクエリを処理する能力が大幅に向上することを示しています。 35万台のH100と数百億ドルに加え、LLaMa 3の訓練には才能も「必要」だ。 Meta は、基礎 AI 研究チームとは別の Generative AI グループを通じて LLaMa を開発しました。 LLaMa 2と3のセキュリティを担当していた研究者、ルイス・マーティン氏は2月に同社を退職した。強化学習を率いたケビン・ストーン氏も今月退社した。これが LLaMa 3 のトレーニングに影響を及ぼすかどうかは不明です。 LLaMa 3 がセキュリティと使いやすさのバランスをうまくとり、コーディング機能などの新しい側面で私たちを驚かせることができるかどうかは、待って見なければなりません。 |
>>: Sora のようなモデルをトレーニングしたいですか? You YangのチームOpenDiTが80%の加速を達成
NASA の推進により、電子機器の小型化は消費者向け製品産業全体に広がりました。ベートーヴェンの全作...
MITのコンピュータ科学および人工知能研究所(CSAIL)の研究者らは、歴史から長い間失われていた古...
ガートナーは11月11日、2025年までにデータセンターの半数が人工知能と機械学習機能を備えた高度な...
インテリジェント時代が加速しており、人工知能の人材はAIの発展を支える第一のリソースとして特に重要で...
GPUマイニングで米国証券取引委員会から罰金を科されたNvidiaは、最近、暗号化アルゴリズムが解...
[[443228]]現在、自己教師あり学習は、手動によるラベル付けを必要とせずに強力な視覚特徴抽出機...
来月、大手自動車メーカーのグループが米国でブロックチェーンベースの車両識別ネットワークの初のフィール...
設置環境Gym は、強化学習アルゴリズムの開発と比較のためのツールキットです。gym ライブラリとそ...
5Gに加えて、人工知能は今年も引き続きホットな話題です。筆者は最近、医療人工知能のコンテストを間近で...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[51CTO.com からのオリジナル記事] インターネットは、間違いなく私たちの生活、学習、仕事に...
日常的なタスクの自動化は、現在多くの業界で関心を集めているコンセプトです。最も革命的なのは自動運転車...