Metaはオープンソースのビッグモデルを緩和し、開発者が商用利用で利益を得られるよう検討していると報じられている。

Metaはオープンソースのビッグモデルを緩和し、開発者が商用利用で利益を得られるよう検討していると報じられている。

6月16日、MetaのCEOマーク・ザッカーバーグ氏とその代理人は、Metaが開発中の新しい人工知能ソフトウェアを他の企業が自由に使用し、そこから利益を得ることができることを期待していると述べた。この決定は、人工知能の導入が進んでいる開発者や企業にとって大きな影響を及ぼす可能性がある。

事情に詳しい関係者によると、Meta は、ChatGPT などのチャットボットを動かす技術であるオープンソースの Large Language Model (LLM) の次期バージョンを商用利用できるようにする方法に取り組んでいる。これにより、Google や OpenAI が販売する独自のソフトウェアに代わるものを熱望する AI 開発者の間で熱狂が巻き起こる可能性がある。これは間接的に Meta 自身の AI 開発の取り組みにも利益をもたらすでしょう。

Metaは2月にオープンソースの大規模言語モデルであるLLaMAの最初のバージョンをリリースし、AIコミュニティに大きな衝撃を与えた。これは、ChatGPTの開発元であるOpenAIの主な収入源となっているプロプライエタリソフトウェアの代替品を研究者が開発するのを支援するためだ。 Meta のモデルは研究用途のみであるにもかかわらず、業界では大きな話題を呼びました。研究者はこれを使用して、Vicuna のようなオープンソースの大規模言語モデルを開発します。その機能は、ある意味では独自の大規模言語モデルの機能に近づいています。

Meta はオープンソースの AI モデルのリリースから利益を得るでしょう。開発者がこれらのモデルを採用して改良し、セキュリティホールを修正するにつれて、Metaはそれらの改良を消費者向けおよび広告向け製品を動かすAIモデルに組み込むことができるようになると、ザッカーバーグ氏は4月のアナリストとの電話会議で述べた。

例えば、ザッカーバーグ氏は、Facebookアプリを使用する中小企業やコンテンツクリエイターが、ファンや顧客と自動的にコミュニケーションできる「AIアシスタント」にアクセスできるようにしたいと述べている。 「LLaMA、あるいはその背後にある言語モデルが、基本的にこれを動かすエンジンとなるだろう」とザッカーバーグ氏は先週、ポッドキャストの司会者レックス・フリードマン氏とのインタビューで語った。

ただし、Meta は LLaMA を研究ライセンスの下でリリースすることを選択したため、これまでに生成されたオープンソースの大規模言語モデルは商用目的で使用することはできません。これにより、商用アプリケーションでのプロモーションと複製が制限されます。まだ多くのハードルが残っているかもしれないが、LLaMA の商用版はソフトウェアのより広範な使用を促進する可能性がある。これらの障害には、常に不足している専用サーバーへのアクセスが含まれます。さらに、このようなサーバーを実行するには、通常のコンピューティング タスクよりもコストがかかります。

フリードマンとのポッドキャストの中で、ザッカーバーグ氏はLLaMAの第2バージョンをどのように承認するかについての内部討論について言及した。 「私たちは LLaMA の最初のバージョンの研究ライセンスを申請しましたが、今大きな問題は、これをどのように行うのが正しいのかということだと思います」と彼は語った。

OpenAIはすべてを混乱させる可能性がある

Meta はすでにオープンソース AI 競争で競争に直面しています。アラブ首長国連邦のアブダビ工科大学は最近、オープンソース AI 開発者の間で注目を集め始めている強力な新しいオープンソース モデル セットである Falcon をリリースしました。

OpenAIが新しいオープンソースの大規模言語モデルを計画通りにリリースすれば、業界にさらなる衝撃を与える可能性があると報じられている。事情に詳しい関係者によると、OpenAIは大規模な言語モデルを商業目的で使用することを検討しているという。しかし、そのようなモデルは、OpenAI の最先端の独自の大規模言語モデルである GPT-4 ほど優れている可能性は低いです。 GPT-4 は ChatGPT を支え、同社が毎年数億ドルの収益を生み出すのに貢献しています。

しかし、Meta 社は LLaMA の次期バージョンの商品化を検討しており、著作権で保護された素材を使用してソフトウェアをトレーニングしたことが判明した場合、同社は法的措置を受ける可能性がある。

複数の元従業員によると、Meta は LLaMA の最初のバージョンをリリースする前に法的問題の解決に苦労していたという。当時、同社の法務、製品、プライバシーの各チームの従業員は、LLaMA を開発者にライセンス供与する方法について徹底的に議論しました。先月、Meta の主任 AI 科学者である Yann LeCun 氏は、Meta が LLaMA の商用バージョンをまだリリースしていない理由について質問されました。同氏は「(1)このような決定に関与しているのは私だけではない、(2)これには法的責任の問題が絡んでいる」と答えたが、詳細は明らかにしなかった。

Metaの広報担当者はこの記事に対するコメントを控えた。

水曜日の報道によると、グーグルの研究者は、YouTubeの動画やその他の情報源を利用して、同社独自の大規模言語モデルの次世代を訓練し、ハリウッド映画などの著作権で保護された素材を避けようとしている。これまで、多くのニュース出版社は、Google が自社のサイト上の資料を使用して独自の大規模言語モデルをトレーニングするのではないかと懸念していました。このモデルは現在、Google のチャットボット「Bard」に採用されています。 (小さい)

<<:  手動でラベルを付ける必要はありません。シドニー大学の中国チームは、「GPT自己教師付きラベリング」パラダイムを提案しました。これは、ラベリングのコスト、バイアス、評価の問題を完全に解決します。

>>: 

ブログ    
ブログ    
ブログ    

推薦する

AIと機械学習に切り替えるには、次の5つのスキルを習得する必要があります

1. 機械学習をスキルとして扱うソフトウェア エンジニアとして、私たちは常に学習し、進化するフレーム...

ロボットR2-D2は50年後に人間の仕事を完全に置き換えるでしょうか?

[51CTO.com クイック翻訳] 海外メディアの報道によると、誰かが設計しているロボットがあな...

自動応答は人工知能ではなく、自律応答は

セキュリティ オペレーション センター (SOC) のアナリストは推論と意思決定に優れていますが、2...

...

カーネルモデル化ガウス過程 (KMGP) を使用したデータモデリング

カーネル モデル ガウス過程 (KMGP) は、さまざまなデータセットの複雑さを処理できる高度なツー...

...

...

最新の3D GANは3次元の幾何学データを生成できます!モデル速度が7倍に向上

[[441513]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

産業用ロボットはセンサーなしでも動作できますか?

現在、人口ボーナスの減少、人件費の上昇、人材構成の矛盾などの問題が、製造業の発展を阻む困難になりつつ...

Java プログラミング スキル - データ構造とアルゴリズムの「スタック」

[[387145]]基本的な紹介1. スタックはFILO(先入れ後出し)順序付きリストです2. ス...

マイクロソフト、中小企業向けにCopilot AIアシスタントを導入、個人向けにプレミアムサービスを開始

マイクロソフトは火曜日、中小企業が同社の生産性向上アプリ内で仮想アシスタント「Copilot」を利用...

GPT-4 の推論はより人間的です!中国科学院は「思考コミュニケーション」を提唱、類推思考はCoT、プラグアンドプレイよりも優れている

今日では、GPT-4 や PaLM などの巨大なニューラル ネットワーク モデルが登場し、驚くべき少...

...

アルゴリズムのパフォーマンスを最適化するためにデータ品質を確保するための 6 つのヒント

今日、企業は、分析アルゴリズムの良し悪しは、そのアルゴリズムをトレーニングするデータの良し悪しによっ...