バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。

The Vergeによると:

ByteDanceはOpenAIの技術を秘密裏に利用して、独自の大規模言語モデル(LLM)を開発してきた。

このニュースが公表されて間もなく、The Vergeはさらに、OpenAIがByteDanceのアカウントを停止したと報じた。

具体的には、OpenAIの広報担当者Niko Felix氏は次のような声明を発表しました。

ByteDance による弊社 API の使用は最小限ですが、さらに調査を進める間、同社のアカウントを停止しました。

利用方法が規則に違反していることが判明した場合、必要な変更をお願いしたり、アカウントを停止したりすることがあります。

ここで言及されている「ルール」とは、OpenAI の利用規約に明確に規定されている条項を指し、OpenAI が提供するモデル機能は「自社の製品やサービスと競合する AI モデルの開発」に使用することは許可されていないと規定されています。

ByteDanceはMicrosoftを通じてOpenAIのアクセス権を購入したとされているが、MicrosoftもOpenAIと同様の方針を策定した。

The Vergeは、バイトダンスのアカウントを停止するためにOpenAIと同じ措置を取るかどうかについてマイクロソフトとさらに協議中だと述べた。

それで、この盗作スキャンダルは一体何が起きているのでしょうか?

内部文書が暴露される

The Vergeによると、証拠はByteDanceの内部文書、つまり海外版Feishu Larkのチャット記録から得られたものだという。

この文書は、ByteDanceが「Project Seed」というコードネームの基本的な大規模言語モデルプロジェクトのほぼすべての開発段階(モデルのトレーニングや評価を含む)でOpenAIのAPIに依存していることを示しています。

「Seed Project」は約1年前に立ち上げられ、現在は主に2つの製品を開発しています。1つは中国で発売された「Doubao」、もう1つは現在開発中の商用ユーザー向けチャットボットプラットフォームです。

「Seedプロジェクト」に参加した従業員は、OpenAI APIへの過度の依存がもたらす結果を十分認識していたため、 「データ感度低下」を通じて証拠を美化する方法について議論を始めたという。

従業員が OpenAI API の最大アクセス制限に達することが頻繁にあるほどです。

具体的には、ByteDanceは「Seedプロジェクト」の初期段階でOpenAIの技術をより多く活用しました。

The Vergeは、内部文書に基づき、ByteDanceが数か月前に「モデル開発のどの段階でもGPT生成テキストの使用を停止する」よう命令を出したと報じた。

しかし、ByteDanceが独自の大規模言語モデルDoubaoをリリースしたのもこの頃でした。

しかし、The Vergeは、この時点でもByteDanceは規制違反をやめていないと報じている。

ByteDanceは、Doubaoの背後にあるモデルのパフォーマンスを評価するなど、OpenAIとMicrosoftの利用規約に違反する方法でAPIを使い続けています。

また、バイトダンスの内部状況について直接情報を持つ人物は次のように指摘した。

彼らはすべてが合法であることを確認したいと言いますが、実際には捕まりたくないだけなのです。

バイトダンスは反応した

The Vergeがこの報道を発表した後、バイトダンスの広報担当ジョディ・セス氏は次のように反応した。

GPTによって生成されたデータは、Seedプロジェクトの初期開発中にモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されました。

ByteDance は、GPT API を使用するために Microsoft から許可を取得しました。

当社は中国以外の市場では GPT を使用して製品をサポートしていますが、中国市場では Doubao をサポートするために独自のモデルを使用しています

マイクロソフトの広報担当フランク・ショー氏は次のように述べた。

Azure OpenAI サービスなどの Microsoft AI ソリューションは、当社の限定アクセス フレームワークの一部であるため、すべての顧客が Microsoft に申請して承認を受ける必要があります。

また、当社は標準を開発し、お客様がこれらのテクノロジーを責任を持って、当社の利用規約に従って使用できるようにするためのリソースも提供しています。

当社では不正行為を検出するためのプロセスを導入しており、行動規範に違反する企業を特定した場合は、その企業のアクセスを停止します。

QuantumBitも早急にByteDanceに連絡を取ったが、ByteDanceはまだ正式な返答をしていない。

<<:  有名人のリアルタイムディープフェイク!名前を入力して数秒で顔を変える

>>: 

ブログ    
ブログ    
ブログ    

推薦する

エントリーレベルのデータベースアルゴリズム [パート 2]

前回の記事「エントリーレベルのデータベースのアルゴリズム [I]」では、いくつかのデータ アルゴリズ...

人工知能の3つの人生を10分で紹介します

AIは2016年以来最もホットなキーワードであり、それについてはさまざまな意見があります。バブルがは...

6 つの大きな障害に直面していますが、AI イノベーションはそれらをうまく克服できるでしょうか?

現状では、人工知能業界は消費者からの需要が大きく、投資家からの関心も高く、非常に活況を呈しているよう...

2021年以降の人工知能トレンドに関する5つの予測

[[377548]]アンドリュー・ン教授(スタンフォード大学コンピュータサイエンスおよび電気工学准教...

指先で操作できる人工知能(基礎編)

人工知能の概念知能は知識と知性の総和です。知識はすべての知的行動の基礎であり、知能は知識を獲得し、そ...

注目すべきデータ視覚化の5つの新たなトレンド

[[412404]]データの視覚化はビジネス指標を理解するための最新の方法です情報の世界におけるテク...

Google Gemini: CMU の総合評価では、Gemini Pro は GPT 3.5 Turbo より劣っていることが判明

少し前に、Google はOpenAI の GPT モデルの競合製品であるGemini をリリースし...

中国チームが超伝導において新たな大きな進歩を遂げました! LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

室温超伝導に新たな進歩はありますか?華南理工大学、中南大学、中国電子科技大学の研究者らは12月19日...

...

...

機械学習プロジェクトでオプティマイザーを選択する方法

導入いくつかの一般的なオプティマイザーを紹介し、その長所と短所を分析し、オプティマイザーを選択するた...

騒ぎの裏で、2020年はケータリングロボットにとって楽な年になるだろうか?

最近、ロボットに特化したレストランが広州に正式にオープンしました。客の出迎えから調理まで、一連の作業...

この記事では人工知能とは何かを徹底的に解説します!

人工知能 (AI) は、自然科学のさまざまな分野を網羅しており、主に特定の種類の知的な人間の活動をモ...

後から登場したが、最初に登場したテンセントのHunyuanモデルの技術的なハイライトは何ですか?

2023年の夏は終わったが、AIGCビッグモデルを巡る注目は衰える気配がない。過去 6 か月間、私...