GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

[[416556]]

Github Copilot はリリース以来、物議を醸してきました。

最近、フリーソフトウェア財団 (FSF) はついに我慢できなくなりました。

FSF は、Copilot テクノロジーが法的および哲学的な問題を引き起こすと考えています。

FSFは投稿の中で、GitHub Copilotは「我々の観点からは受け入れられず不公平だ」と書いている。

Copilot を実行するには、Microsoft の Visual Studio IDE や Visual Studio Code エディターなどの有料ソフトウェアが必要になるためです。

このようにして、Copilot は SaaSS (Service as a Software Substitute) になります。

Copilot は、単に「コピー」して「貼り付け」するだけで、開発者の以前の作業を盗むことができます。

Copilot は、さらなる研究を必要とする他の多くの疑問も提起しています。

たとえば、開発者はソフトウェア上でニューラル ネットワークをトレーニングすることが合理的かどうかわかりません。

さらに、Copilot に関心のある人の中には、GitHub リポジトリからコピーしたコードを使用すると著作権を侵害するのではないかと疑問に思う人もいます。

たとえすべてが合法かつ準拠していたとしても、一部の活動家は、プロプライエタリソフトウェア会社が過去の開発者の作業に基づいてサービスを提供することが公平であるかどうか疑問視しています。

これらの疑問に答え、ユーザーの使用の自由を守るために、FSF は Copilot、セキュリティ、機械学習、フリーソフトウェアの問題に対処するホワイトペーパーへの資金提供を発表しました。

ホワイトペーパーは500ドル

FSF は公式ウェブサイトでホワイトペーパーで回答すべき内容をリストアップしています。

  • Copilot のパブリック リポジトリ トレーニングは著作権を侵害しますか?この使用はフェアユースですか?
  • Copilot の出力によって、GPL ライセンスの作品に対する違反として訴訟の対象となる可能性はどの程度ありますか?
  • 開発者は、著作権を所有するコードが Copilot 違反から保護されることをどのように保証できますか?
  • Copilot を使用する開発者が GPL などのフリー ソフトウェア ライセンスに準拠できるようにする方法はありますか?
  • Copilot が AGPL でカバーされているコードから学習する場合、Copilot は AGPL に違反することになりますか?
  • Copilot によって生成されたコードがフリーソフトウェアライセンスの作品に違反する場合、著作権所有者はどのようにしてこの違反を発見できるのでしょうか?
  • トレーニングされた AI または機械学習モデルは、機械学習によって生成されたトレーニング データのコンパイルされたバージョンから派生したものですか?それとも、ユーザーがさらにトレーニングすることで変更できるソース コードでしょうか?
  • Copilot によってトレーニングされた AI/ML モデルは著作権で保護されていますか?もしそうなら、著作権は誰が所有するのでしょうか?
  • FSF のような倫理擁護団体は、これらの問題に関連する著作権法の改正を主張すべきでしょうか?

提出されたホワイトペーパーが上記の問題を解決できる場合、500 米ドルの報酬を受け取ります。

https://www.fsf.org/blogs/licensing/fsf-funded-call-for-white-papers-on-philosophical-and-legal-questions-around-copilot

FSFはまた、さらなる研究が必要となり、その後論文が発表された場合、FSFは財政支援を増額すると述べた。

FSFとGPL

フリーソフトウェア財団 (FAF) は、コンピュータ ユーザーがソフトウェアを自由に使用できるように戦うことに専念しています。

ソフトウェアとドキュメント、特に GNU システムの開発と自由な使用を促進し、デジタル制限管理 (DRM) やソフトウェア特許などのコンピューター ユーザーに対する脅威に対抗します。

FSF が発行する GNU 一般公衆利用許諾書 (GNU GPL) は、世界で最も人気のあるフリー ソフトウェア ライセンスです。

これは、ソフトウェアの自由を促進し、維持することを明確な目的として作成された唯一のライセンスです。

GNU GPL は、ユーザーにソフトウェアを実行、研究、共有、変更する自由を保証します。

同時に、GPL に基づく派生作品はすべて、同じまたは同等のライセンス条件に従う必要があります。

GNU の公式ウェブサイトでは、GPL について次のように説明しています: 変更された GPL コードを一般に公開する場合は、ソース コードを提供する必要があります。

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

FSF は、GNU LGPL、GNU AGPL、GNU FDL などの他の重要なライセンスも公開しています。

だからこそ、FSF は Copilot の存在に疑問を呈する正当な態度をとっているのです。

疑問

GitHub Copilot は、コードを自動生成するという強力な機能により、リリース後に話題となりました。

GitHub は、Copilot がドキュメント内の文字列、コメント、関数名、コード自体を分析して、以前に呼び出された特定の関数を含む新しい一致するコードを生成できると主張しています。

リリース後、何人かの人がCopilotにLeetcodeの問題バンクを練習するよう依頼し、この「AIプログラマー」のパフォーマンスに非常に満足しました。

いくつかの質問に対する検証後、Copilot は毎回 Leetcode テストに合格できます。

ほぼ瞬時の生成速度を考えると、AI は人間よりもコードを書くのが得意かもしれないとブロガーは示唆しています。

しかし、疑わしいのは、Copilot によって「生成された」コンテンツが、Leetcode によって提供されたテンプレートとほぼ同じであるということです。

偶然にも、Copilot がリリースされた 2 日後に、一部のネットユーザーは、GitHub Copilot は無料のオープンソース コードをクリーンアップして金儲けするためのツールではないかと疑問を呈しました。

これらのコードは、商用利用を避けるために GNU GPL によって保護される必要があります。

ネットユーザーたちは、Copilot がトレーニングに GPL ベースのコードを使用しているという事実に疑問を呈した。

GPL には「私の成果物をプロプライエタリなソフトウェアに組み込まないでください」と明記されていますが、Copilot はまさにそれを実行しました。

予想通り、この疑惑は2日以内に現実のものとなった。

一部のネットユーザーは、Copilotが最も有名な「高速平方根逆計算法」をそのまま「コピー&ペースト」していることを発見した。

Copilot によって「生成された」コードは、これまで誰も理解できなかったマジックナンバー 0x5f3759df を使用するだけではありません。

「生成済み」の横のコメントもこのコードについて不満を述べています: what the f***?

つまり、実際のところ、Copilot はトレーニング セット内の他の人が書いたコードを再構成したものにすぎません。

GitHubの説明

GitHub は Copilot の公式 Web サイトで、直接引用は 0.1% あるかもしれないが、Copilot によって生成されるコードの大部分はオリジナルになると述べています。

さらに、チームメンバーのアルバート・ジーグラー氏は、Copilot を日常業務で使用している 300 人の従業員からデータを収集し、その中には Python に関する 453,780 件の提案も含まれていると述べています。

情報を分析して整理した後、アルバートは非常に完成度の高いブログ記事を書きました。

アルバート氏はブログの中で、トレーニング セットの内容を記憶することは問題ではないと述べています。

それは詩を暗唱するようなものです。誰もが詩を暗唱しますが、これによって彼がこれらの詩との日々のコミュニケーションにおいて迷うことはないでしょう。

テスト結果

アルバート氏は、GitHub Copilot の提案のほとんどについて、トレーニングに使用されたコードとの大きな重複は見つからなかったと述べています。

Albert 氏は、GitHub Copilot はコードセットを逐語的に引用するが、そうすることはほとんどないと述べました。

たとえそうであったとしても、ほとんどの場合、それは誰もが参照するコードであり、ほとんどの場合、ファイルの先頭にあります。

Albert 氏は、理想的には、Copilot がトレーニング セットから直接コピーされたコードを「生成」した場合、Copilot はユーザーにそれを通知すると述べました。

ユーザーは、コードに署名するか、Copilot によって提供されたコードを直接拒否するかを決定できます。

しかし現実には、GitHub、Microsoft、OpenAI はこれを実行するのが遅れています。

そのため、FSF は開発者の権利を保護するために自ら介入する必要がありました。

ネットユーザーの議論

道徳的なレベルでは、ネットユーザーは FSF への支持を表明しましたが、Copilot によってプログラマーがコードを書くハードルを下げることができるとも考えていました。

ネットユーザーによると、AIは実際には人間と同じであり、入手可能なソースコードに基づいてプログラミングを学習できるという。

Copilot が以前に見たことのあるコードを貼り付けていると言うのは、技術的にも法的にも賢明ではありません。

もちろん、ネットユーザーの中には、FSF はソフトウェアの使用を制限するのではなく、自由に使えるように努めるべきだと考える人もいます。

Copilot は著作権を侵害していると思いますか?

<<:  推論コストが48分の1に削減されました! 1つのGPUで静止画像を動かすことができる

>>:  小売業界におけるRPA活用事例11選

ブログ    
ブログ    
ブログ    

推薦する

あなたはキング・オブ・グローリーをプレイしていますが、誰かがiPhoneを使ってニューラルネットワークをトレーニングしています

知っていましたか? LeNet 畳み込みニューラル ネットワークは iOS デバイス上で直接トレーニ...

動的計算グラフとGPU対応操作

[[409431]]動的計算グラフディープラーニングに PyTorch を使用する主な理由の 1 つ...

AIはクラウドコンピューティング大手の次の競争の焦点となる

人工知能が今日の情報技術分野で最もホットな話題であることは疑いの余地がなく、情報産業を豊かにし、改善...

MoEとMambaが協力し、状態空間モデルを数百億のパラメータに拡張

状態空間モデル (SSM) は、最近注目を集めている Transformer の代替手段です。その利...

ロボット開発者イノベーションデー | Horizo​​n RDK と NodeHub の新製品

7月25日、「Horizo​​n 2023 Robotics Developer Innovatio...

...

空飛ぶ脳?ヒントン氏のツイートは白熱した議論を引き起こした。ニューラルネットワークは鳥が飛ぶための「羽」なのか?

[[407838]]ヒントン氏はツイッターでちょっとした議論を始めた。「ニューラルネットワークを設...

...

...

機械学習モデルのパフォーマンスを評価する方法

教師あり機械学習モデルを一日中トレーニングすることはできますが、そのパフォーマンスを評価しなければ、...

百度地図のデータ収集リンクの80%はAIベースになっており、旅行業界はインテリジェントにアップグレードされている

人工知能時代の地図データ制作はどのような変化を遂げるのでしょうか?7月3日、「Baidu Creat...

自動運転分野における機械学習アルゴリズムの応用に関する包括的なレビュー

機械学習は、車内外のセンサーからのデータを融合して、運転者の状態を評価し、運転シナリオを分類するため...

...

Baidu World 2018 の開会式で最初の切り札が切られました。Baidu AI City が新しい世界への機関車としてスタートしました!

スマートカーからスマート道路、スマートシティまで、「複雑な世界をよりシンプルに」という百度の使命によ...