バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。

The Vergeによると:

ByteDanceはOpenAIの技術を秘密裏に利用して、独自の大規模言語モデル(LLM)を開発してきた。

このニュースが公表されて間もなく、The Vergeはさらに、OpenAIがByteDanceのアカウントを停止したと報じた。

具体的には、OpenAIの広報担当者Niko Felix氏は次のような声明を発表しました。

ByteDance による弊社 API の使用は最小限ですが、さらに調査を進める間、同社のアカウントを停止しました。

利用方法が規則に違反していることが判明した場合、必要な変更をお願いしたり、アカウントを停止したりすることがあります。

ここで言及されている「ルール」とは、OpenAI の利用規約に明確に規定されている条項を指し、OpenAI が提供するモデル機能は「自社の製品やサービスと競合する AI モデルの開発」に使用することは許可されていないと規定されています。

ByteDanceはMicrosoftを通じてOpenAIのアクセス権を購入したとされているが、MicrosoftもOpenAIと同様の方針を策定した。

The Vergeは、バイトダンスのアカウントを停止するためにOpenAIと同じ措置を取るかどうかについてマイクロソフトとさらに協議中だと述べた。

それで、この盗作スキャンダルは一体何が起きているのでしょうか?

内部文書が暴露される

The Vergeによると、証拠はByteDanceの内部文書、つまり海外版Feishu Larkのチャット記録から得られたものだという。

この文書は、ByteDanceが「Project Seed」というコードネームの基本的な大規模言語モデルプロジェクトのほぼすべての開発段階(モデルのトレーニングや評価を含む)でOpenAIのAPIに依存していることを示しています。

「Seed Project」は約1年前に立ち上げられ、現在は主に2つの製品を開発しています。1つは中国で発売された「Doubao」、もう1つは現在開発中の商用ユーザー向けチャットボットプラットフォームです。

「Seedプロジェクト」に参加した従業員は、OpenAI APIへの過度の依存がもたらす結果を十分認識していたため、 「データ感度低下」を通じて証拠を美化する方法について議論を始めたという。

従業員が OpenAI API の最大アクセス制限に達することが頻繁にあるほどです。

具体的には、ByteDanceは「Seedプロジェクト」の初期段階でOpenAIの技術をより多く活用しました。

The Vergeは、内部文書に基づき、ByteDanceが数か月前に「モデル開発のどの段階でもGPT生成テキストの使用を停止する」よう命令を出したと報じた。

しかし、ByteDanceが独自の大規模言語モデルDoubaoをリリースしたのもこの頃でした。

しかし、The Vergeは、この時点でもByteDanceは規制違反をやめていないと報じている。

ByteDanceは、Doubaoの背後にあるモデルのパフォーマンスを評価するなど、OpenAIとMicrosoftの利用規約に違反する方法でAPIを使い続けています。

また、バイトダンスの内部状況について直接情報を持つ人物は次のように指摘した。

彼らはすべてが合法であることを確認したいと言いますが、実際には捕まりたくないだけなのです。

バイトダンスは反応した

The Vergeがこの報道を発表した後、バイトダンスの広報担当ジョディ・セス氏は次のように反応した。

GPTによって生成されたデータは、Seedプロジェクトの初期開発中にモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されました。

ByteDance は、GPT API を使用するために Microsoft から許可を取得しました。

当社は中国以外の市場では GPT を使用して製品をサポートしていますが、中国市場では Doubao をサポートするために独自のモデルを使用しています

マイクロソフトの広報担当フランク・ショー氏は次のように述べた。

Azure OpenAI サービスなどの Microsoft AI ソリューションは、当社の限定アクセス フレームワークの一部であるため、すべての顧客が Microsoft に申請して承認を受ける必要があります。

また、当社は標準を開発し、お客様がこれらのテクノロジーを責任を持って、当社の利用規約に従って使用できるようにするためのリソースも提供しています。

当社では不正行為を検出するためのプロセスを導入しており、行動規範に違反する企業を特定した場合は、その企業のアクセスを停止します。

QuantumBitも早急にByteDanceに連絡を取ったが、ByteDanceはまだ正式な返答をしていない。

<<:  有名人のリアルタイムディープフェイク!名前を入力して数秒で顔を変える

>>: 

ブログ    

推薦する

機械学習は科学プロジェクトからビジネスプランまで3段階の戦略を完了します

【51CTO.com クイック翻訳】 2015年は機械学習技術が学術分野で形を成した年でした。具体的...

...

人工知能業界データ分析:中国のネットユーザーの76.8%が2020年の人工知能トラフィックアプリケーションシナリオに満足している

政策の推進と資本の注目により、人工知能産業は今後も急速な発展傾向を維持するでしょう。投資家は人工知能...

...

IDC: 2024年までにIoTシステムの約20%が人工知能をサポートすると予想

1月20日、IDCが最近発表した「IDC FutureScape:世界の人工知能(AI)と自動化市場...

Google、AIコードエディタIDXをリリース:クラウド仮想マシンで開発環境の構成を簡素化

Googleは8月9日、「Project IDX」プロジェクトを公開し、AI技術を統合したコードエデ...

アクセンチュア:AIが新しいUIとなり、7年後にはスクリーンレス時代が到来

編集者注: Amazon の Echo スマート スピーカーや自動運転車などのスクリーンレス ユーザ...

AIが研究者に歴史の匂いを再現する手助けをする方法

欧州連合は、AIを使って歴史的な香りや嗅覚要素を再現することを計画している研究チームに280万ユーロ...

アマゾンとファーウェイの機械学習面接を経験すると、試験官はこれらの答えを聞きたがっていることが判明

[[245589]]ジョージ・セイフ氏はこれまで、主にデータサイエンスや機械学習関連の職種を対象に、...

マイクロソフトはOpenAIの警告を無視し、未熟なBingチャットサービスを開始したと報じられている。

マイクロソフトのBing AIチャットボットは、最初にリリースされたときに論争と混乱を巻き起こしたが...

人工知能の時代では、女の子よりも男の子の方が失業する可能性が高いです!

ジョークを一つ言わせてください。今、路上で物乞いをしている人を見かけたら、ぎこちなくポケットを触り、...

...

eMule プロトコルの DHT アルゴリズム

BT プロトコルと eMule プロトコルのアルゴリズムにはいくつかの違いがあり、この 2 つを併用...

AI導入で避けるべき5つの間違い

人工知能と機械学習は、ビジネスの成功にとって貴重な資産となるでしょう。 AI を実装することで、企業...

大きなモデルには堀がない? OpenAI の「LLM City」に侵入し、防御する方法

著者: ベン・ディクソン翻訳者 | 李睿レビュー | Chonglou制作:51CTO テクノロジー...