バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。

The Vergeによると:

ByteDanceはOpenAIの技術を秘密裏に利用して、独自の大規模言語モデル(LLM)を開発してきた。

このニュースが公表されて間もなく、The Vergeはさらに、OpenAIがByteDanceのアカウントを停止したと報じた。

具体的には、OpenAIの広報担当者Niko Felix氏は次のような声明を発表しました。

ByteDance による弊社 API の使用は最小限ですが、さらに調査を進める間、同社のアカウントを停止しました。

利用方法が規則に違反していることが判明した場合、必要な変更をお願いしたり、アカウントを停止したりすることがあります。

ここで言及されている「ルール」とは、OpenAI の利用規約に明確に規定されている条項を指し、OpenAI が提供するモデル機能は「自社の製品やサービスと競合する AI モデルの開発」に使用することは許可されていないと規定されています。

ByteDanceはMicrosoftを通じてOpenAIのアクセス権を購入したとされているが、MicrosoftもOpenAIと同様の方針を策定した。

The Vergeは、バイトダンスのアカウントを停止するためにOpenAIと同じ措置を取るかどうかについてマイクロソフトとさらに協議中だと述べた。

それで、この盗作スキャンダルは一体何が起きているのでしょうか?

内部文書が暴露される

The Vergeによると、証拠はByteDanceの内部文書、つまり海外版Feishu Larkのチャット記録から得られたものだという。

この文書は、ByteDanceが「Project Seed」というコードネームの基本的な大規模言語モデルプロジェクトのほぼすべての開発段階(モデルのトレーニングや評価を含む)でOpenAIのAPIに依存していることを示しています。

「Seed Project」は約1年前に立ち上げられ、現在は主に2つの製品を開発しています。1つは中国で発売された「Doubao」、もう1つは現在開発中の商用ユーザー向けチャットボットプラットフォームです。

「Seedプロジェクト」に参加した従業員は、OpenAI APIへの過度の依存がもたらす結果を十分認識していたため、 「データ感度低下」を通じて証拠を美化する方法について議論を始めたという。

従業員が OpenAI API の最大アクセス制限に達することが頻繁にあるほどです。

具体的には、ByteDanceは「Seedプロジェクト」の初期段階でOpenAIの技術をより多く活用しました。

The Vergeは、内部文書に基づき、ByteDanceが数か月前に「モデル開発のどの段階でもGPT生成テキストの使用を停止する」よう命令を出したと報じた。

しかし、ByteDanceが独自の大規模言語モデルDoubaoをリリースしたのもこの頃でした。

しかし、The Vergeは、この時点でもByteDanceは規制違反をやめていないと報じている。

ByteDanceは、Doubaoの背後にあるモデルのパフォーマンスを評価するなど、OpenAIとMicrosoftの利用規約に違反する方法でAPIを使い続けています。

また、バイトダンスの内部状況について直接情報を持つ人物は次のように指摘した。

彼らはすべてが合法であることを確認したいと言いますが、実際には捕まりたくないだけなのです。

バイトダンスは反応した

The Vergeがこの報道を発表した後、バイトダンスの広報担当ジョディ・セス氏は次のように反応した。

GPTによって生成されたデータは、Seedプロジェクトの初期開発中にモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されました。

ByteDance は、GPT API を使用するために Microsoft から許可を取得しました。

当社は中国以外の市場では GPT を使用して製品をサポートしていますが、中国市場では Doubao をサポートするために独自のモデルを使用しています

マイクロソフトの広報担当フランク・ショー氏は次のように述べた。

Azure OpenAI サービスなどの Microsoft AI ソリューションは、当社の限定アクセス フレームワークの一部であるため、すべての顧客が Microsoft に申請して承認を受ける必要があります。

また、当社は標準を開発し、お客様がこれらのテクノロジーを責任を持って、当社の利用規約に従って使用できるようにするためのリソースも提供しています。

当社では不正行為を検出するためのプロセスを導入しており、行動規範に違反する企業を特定した場合は、その企業のアクセスを停止します。

QuantumBitも早急にByteDanceに連絡を取ったが、ByteDanceはまだ正式な返答をしていない。

<<:  有名人のリアルタイムディープフェイク!名前を入力して数秒で顔を変える

>>: 

ブログ    
ブログ    
ブログ    

推薦する

人工知能、機械学習、ディープラーニングの違い

私たちは皆、「人工知能」という言葉をよく知っています。結局のところ、ターミネーター、マトリックス、エ...

OpenAIは、テキストを使用してユーザーの感情を検出できる教師なし感情ニューロンを「巧みに」発見した。

OpenAIは4月7日、公式サイトで最新の研究結果を発表し、感情表現を効率的に学習し、現在Amaz...

...

機械学習に基づく自動ネットワークトラフィック分析

1. 概要現在、機械学習はネットワーク トラフィック分析タスクで広く使用されています。特徴抽出、モデ...

2022年に注目すべき6つのAIトレンド

AIは急速に私たちの日常生活に入り込んできており、近い将来、AIと人間の境界線を見分けることが難しく...

MLOps の定義、重要性、実装

MLOps の定義と成功する実装戦略に関する有益なブログを読んで、AI と機械学習における MLOp...

中国の人工知能は世界の潮流をリードできるか?

[[389342]] 10年以上前であれば、おそらく多くの人が、将来中国が日本や米国と同じくらい発...

機械学習の卒業生は就職に不安を感じ始めています!卒業生と企業のどちらがより厳しいでしょうか?

機械学習を専攻する学生も就職について不安を感じ始めているのでしょうか?昨日、あるネットユーザーがRe...

Google: より多くのデータはより優れたアルゴリズムに勝ります!

Google が発表した新しい研究論文では、音声検索や YouTube 動画へのテキスト説明やタグ...

...

マイクロソフトが人工知能の小規模スタートアップBonsaiを買収

海外メディアの報道によると、マイクロソフトは水曜日、小規模な人工知能スタートアップ企業であるボンサイ...

...

...