レポート: Meta の Llama 2 と OpenAI の ChatGPT の「オープンソース」は透明性に欠ける

オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を使用する際にユーザーを誤解させる傾向があり、「オープンソース」と表示されている大規模な言語モデルの中には実際にはオープンソースではないものがあることを指摘する研究レポートを発表した。

報告書では特にMetaのLlama 2モデルとOpenAIのGPT/codexモデルに言及しており、これらの大規模言語モデルをトレーニングするためのコードは一般に公開されていないと述べている。

研究者らは、オープンソースの大規模言語モデルの不足が、現在の AI コミュニティにおいてますます顕著な問題になりつつあると述べています。研究者らは、研究者や開発者がコードにアクセスしてこれらのモデルのパフォーマンスを向上できるように、企業に対し、より多くのオープンソース LLM をリリースするよう呼びかけています。

OpenAI の ChatGPT モデルは最も「神秘的」であり、オープンソースの標準を満たしていません。また、Meta の Llama 2 は「オープンソース」であると主張していますが、実際の透明性は ChatGPT モデルよりもわずかに優れているだけで、オープンソースランキングでのランキングは依然として非常に低いです。

調査レポートでは、これらの企業の主な理由として以下のことが挙げられます。

知的財産を保護したい
大規模な言語モデルの使用方法を制御したい

しかし、研究者や開発者は、オープンソースの大規模言語モデルに直面した場合、当然ながら不利な立場に置かれ、論文の結果を研究したり、既存の大規模言語モデルのパフォーマンスを改善したりすることができない可能性があります。

Meta の姿勢は皮肉なもので、同社は Llama 2 は研究に使用できると誇らしげに述べている。それでも、同社はプロジェクトの一部を開発者や研究者から締め出しているようだ。

IT Homeでは、ここに論文のリンクアドレスを添付しておりますので、ご興味のある方は詳細をお読みいただけます。

<<: 北京大学のチームは、より強力な一般化とより高い生成品質を備えたDiffusionでDragGANをアップグレードしました。クリックするだけで「地面から山が立ち上がる」

>>: 複雑な課題に対するスマートなソリューション: 自動化の成功への道

人間の脳をインターネットに接続するときは注意してください

ブログ

3大分野で需要が解放され、2021年には検査ロボットの開発が期待される

ブログ

ファーウェイの石耀宏氏：成都にインテリジェントシティを構築し、スマートで美しい都市を創る

ブログ

AI、BI、データ: 2020 年までに勝利するのは誰か?

ブログ

ロジスティック回帰を用いた分類

ブログ

レポート: Meta の Llama 2 と OpenAI の ChatGPT の「オープンソース」は透明性に欠ける

人間の脳をインターネットに接続するときは注意してください

3大分野で需要が解放され、2021年には検査ロボットの開発が期待される

ファーウェイの石耀宏氏：成都にインテリジェントシティを構築し、スマートで美しい都市を創る

AI、BI、データ: 2020 年までに勝利するのは誰か?

ロジスティック回帰を用いた分類

推薦する

中国科学院深圳先端技術研究所：新しい知識強化グラフニューラルネットワークが説明可能な推奨を実現

Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する

機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

自動車ドメインコントローラの統合アーキテクチャの背景、利点、設計を1つの記事で理解する

貴州省はアリババクラウドの最適アルゴリズムを使用して交通渋滞を減らし、赤信号の時間を86％削減する予定

AIコードツールが人気、複雑な操作が数秒で簡単になり、ネットユーザー：VS Codeを放棄

1.3>7? Microsoft の新しいモデルは、「小さな勝利で大きな勝利」戦略で Llama2 を打ち負かしました。ネットユーザーは質問しました: Benchmark でトレーニングされたのですか?

AIと機械学習、5G、IoTは2021年に重要な技術となる

世界中でデータ損失を防ぐ先進技術の役割

サイバー犯罪におけるAI時代の到来