Metaはオープンソースのビッグモデルを緩和し、開発者が商用利用で利益を得られるよう検討していると報じられている。

6月16日、MetaのCEOマーク・ザッカーバーグ氏とその代理人は、Metaが開発中の新しい人工知能ソフトウェアを他の企業が自由に使用し、そこから利益を得ることができることを期待していると述べた。この決定は、人工知能の導入が進んでいる開発者や企業にとって大きな影響を及ぼす可能性がある。

事情に詳しい関係者によると、Meta は、ChatGPT などのチャットボットを動かす技術であるオープンソースの Large Language Model (LLM) の次期バージョンを商用利用できるようにする方法に取り組んでいる。これにより、Google や OpenAI が販売する独自のソフトウェアに代わるものを熱望する AI 開発者の間で熱狂が巻き起こる可能性がある。これは間接的に Meta 自身の AI 開発の取り組みにも利益をもたらすでしょう。

Metaは2月にオープンソースの大規模言語モデルであるLLaMAの最初のバージョンをリリースし、AIコミュニティに大きな衝撃を与えた。これは、ChatGPTの開発元であるOpenAIの主な収入源となっているプロプライエタリソフトウェアの代替品を研究者が開発するのを支援するためだ。 Meta のモデルは研究用途のみであるにもかかわらず、業界では大きな話題を呼びました。研究者はこれを使用して、Vicuna のようなオープンソースの大規模言語モデルを開発します。その機能は、ある意味では独自の大規模言語モデルの機能に近づいています。

Meta はオープンソースの AI モデルのリリースから利益を得るでしょう。開発者がこれらのモデルを採用して改良し、セキュリティホールを修正するにつれて、Metaはそれらの改良を消費者向けおよび広告向け製品を動かすAIモデルに組み込むことができるようになると、ザッカーバーグ氏は4月のアナリストとの電話会議で述べた。

例えば、ザッカーバーグ氏は、Facebookアプリを使用する中小企業やコンテンツクリエイターが、ファンや顧客と自動的にコミュニケーションできる「AIアシスタント」にアクセスできるようにしたいと述べている。「LLaMA、あるいはその背後にある言語モデルが、基本的にこれを動かすエンジンとなるだろう」とザッカーバーグ氏は先週、ポッドキャストの司会者レックス・フリードマン氏とのインタビューで語った。

ただし、Meta は LLaMA を研究ライセンスの下でリリースすることを選択したため、これまでに生成されたオープンソースの大規模言語モデルは商用目的で使用することはできません。これにより、商用アプリケーションでのプロモーションと複製が制限されます。まだ多くのハードルが残っているかもしれないが、LLaMA の商用版はソフトウェアのより広範な使用を促進する可能性がある。これらの障害には、常に不足している専用サーバーへのアクセスが含まれます。さらに、このようなサーバーを実行するには、通常のコンピューティングタスクよりもコストがかかります。

フリードマンとのポッドキャストの中で、ザッカーバーグ氏はLLaMAの第2バージョンをどのように承認するかについての内部討論について言及した。「私たちは LLaMA の最初のバージョンの研究ライセンスを申請しましたが、今大きな問題は、これをどのように行うのが正しいのかということだと思います」と彼は語った。

OpenAIはすべてを混乱させる可能性がある

Meta はすでにオープンソース AI 競争で競争に直面しています。アラブ首長国連邦のアブダビ工科大学は最近、オープンソース AI 開発者の間で注目を集め始めている強力な新しいオープンソースモデルセットである Falcon をリリースしました。

OpenAIが新しいオープンソースの大規模言語モデルを計画通りにリリースすれば、業界にさらなる衝撃を与える可能性があると報じられている。事情に詳しい関係者によると、OpenAIは大規模な言語モデルを商業目的で使用することを検討しているという。しかし、そのようなモデルは、OpenAI の最先端の独自の大規模言語モデルである GPT-4 ほど優れている可能性は低いです。 GPT-4 は ChatGPT を支え、同社が毎年数億ドルの収益を生み出すのに貢献しています。

しかし、Meta 社は LLaMA の次期バージョンの商品化を検討しており、著作権で保護された素材を使用してソフトウェアをトレーニングしたことが判明した場合、同社は法的措置を受ける可能性がある。

複数の元従業員によると、Meta は LLaMA の最初のバージョンをリリースする前に法的問題の解決に苦労していたという。当時、同社の法務、製品、プライバシーの各チームの従業員は、LLaMA を開発者にライセンス供与する方法について徹底的に議論しました。先月、Meta の主任 AI 科学者である Yann LeCun 氏は、Meta が LLaMA の商用バージョンをまだリリースしていない理由について質問されました。同氏は「（１）このような決定に関与しているのは私だけではない、（２）これには法的責任の問題が絡んでいる」と答えたが、詳細は明らかにしなかった。

Metaの広報担当者はこの記事に対するコメントを控えた。

水曜日の報道によると、グーグルの研究者は、YouTubeの動画やその他の情報源を利用して、同社独自の大規模言語モデルの次世代を訓練し、ハリウッド映画などの著作権で保護された素材を避けようとしている。これまで、多くのニュース出版社は、Google が自社のサイト上の資料を使用して独自の大規模言語モデルをトレーニングするのではないかと懸念していました。このモデルは現在、Google のチャットボット「Bard」に採用されています。（小さい）

<<: 手動でラベルを付ける必要はありません。シドニー大学の中国チームは、「GPT自己教師付きラベリング」パラダイムを提案しました。これは、ラベリングのコスト、バイアス、評価の問題を完全に解決します。

>>: