オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を使用する際にユーザーを誤解させる傾向があり、「オープンソース」と表示されている大規模な言語モデルの中には実際にはオープンソースではないものがあることを指摘する研究レポートを発表した。 報告書では特にMetaのLlama 2モデルとOpenAIのGPT/codexモデルに言及しており、これらの大規模言語モデルをトレーニングするためのコードは一般に公開されていないと述べている。 研究者らは、オープンソースの大規模言語モデルの不足が、現在の AI コミュニティにおいてますます顕著な問題になりつつあると述べています。研究者らは、研究者や開発者がコードにアクセスしてこれらのモデルのパフォーマンスを向上できるように、企業に対し、より多くのオープンソース LLM をリリースするよう呼びかけています。 OpenAI の ChatGPT モデルは最も「神秘的」であり、オープンソースの標準を満たしていません。また、Meta の Llama 2 は「オープンソース」であると主張していますが、実際の透明性は ChatGPT モデルよりもわずかに優れているだけで、オープンソース ランキングでのランキングは依然として非常に低いです。 調査レポートでは、これらの企業の主な理由として以下のことが挙げられます。
しかし、研究者や開発者は、オープンソースの大規模言語モデルに直面した場合、当然ながら不利な立場に置かれ、論文の結果を研究したり、既存の大規模言語モデルのパフォーマンスを改善したりすることができない可能性があります。 Meta の姿勢は皮肉なもので、同社は Llama 2 は研究に使用できると誇らしげに述べている。それでも、同社はプロジェクトの一部を開発者や研究者から締め出しているようだ。 IT Homeでは、ここに論文のリンクアドレスを添付しておりますので、ご興味のある方は詳細をお読みいただけます。 |
<<: 北京大学のチームは、より強力な一般化とより高い生成品質を備えたDiffusionでDragGANをアップグレードしました。クリックするだけで「地面から山が立ち上がる」
>>: 複雑な課題に対するスマートなソリューション: 自動化の成功への道
近年、ビッグデータとディープラーニングに基づく人工知能は、驚くべきコンピューティング能力と学習能力を...
MySQL への接続は、Java 開発において非常に一般的なタスクの 1 つです。次のセクションでは...
[[249391]] [51CTO.com クイック翻訳] データセンターがますます複雑になってい...
車両の電動化が徐々に進むにつれ、電子制御ユニット(ECU)が車全体を制御するようになりました。アンチ...
朝のラッシュアワーには交通量が多く、午後は非常に空いています。しかし、なぜ信号が変わる頻度は同じまま...
最近、AIコードエディタCursorが人気になってきました—— GPT-3.5/GPT-4 に接続す...
わずか 13 億のパラメータを持つ大規模なモデルが、なぜインターネット上で白熱した議論を引き起こした...
IEEEは、米国、英国、中国、インド、ブラジルの最高情報責任者(CIO)と最高技術責任者(CTO)を...
デジタル時代が進化するにつれ、世界的なデータ損失を防ぐための高度なテクノロジーの役割がますます重要に...
人工知能の分野で画期的な進歩が起こったばかりであり、サイバーセキュリティに携わっている人であれば、そ...