GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

[[416556]]

Github Copilot はリリース以来、物議を醸してきました。

最近、フリーソフトウェア財団 (FSF) はついに我慢できなくなりました。

FSF は、Copilot テクノロジーが法的および哲学的な問題を引き起こすと考えています。

FSFは投稿の中で、GitHub Copilotは「我々の観点からは受け入れられず不公平だ」と書いている。

Copilot を実行するには、Microsoft の Visual Studio IDE や Visual Studio Code エディターなどの有料ソフトウェアが必要になるためです。

このようにして、Copilot は SaaSS (Service as a Software Substitute) になります。

Copilot は、単に「コピー」して「貼り付け」するだけで、開発者の以前の作業を盗むことができます。

Copilot は、さらなる研究を必要とする他の多くの疑問も提起しています。

たとえば、開発者はソフトウェア上でニューラル ネットワークをトレーニングすることが合理的かどうかわかりません。

さらに、Copilot に関心のある人の中には、GitHub リポジトリからコピーしたコードを使用すると著作権を侵害するのではないかと疑問に思う人もいます。

たとえすべてが合法かつ準拠していたとしても、一部の活動家は、プロプライエタリソフトウェア会社が過去の開発者の作業に基づいてサービスを提供することが公平であるかどうか疑問視しています。

これらの疑問に答え、ユーザーの使用の自由を守るために、FSF は Copilot、セキュリティ、機械学習、フリーソフトウェアの問題に対処するホワイトペーパーへの資金提供を発表しました。

ホワイトペーパーは500ドル

FSF は公式ウェブサイトでホワイトペーパーで回答すべき内容をリストアップしています。

  • Copilot のパブリック リポジトリ トレーニングは著作権を侵害しますか?この使用はフェアユースですか?
  • Copilot の出力によって、GPL ライセンスの作品に対する違反として訴訟の対象となる可能性はどの程度ありますか?
  • 開発者は、著作権を所有するコードが Copilot 違反から保護されることをどのように保証できますか?
  • Copilot を使用する開発者が GPL などのフリー ソフトウェア ライセンスに準拠できるようにする方法はありますか?
  • Copilot が AGPL でカバーされているコードから学習する場合、Copilot は AGPL に違反することになりますか?
  • Copilot によって生成されたコードがフリーソフトウェアライセンスの作品に違反する場合、著作権所有者はどのようにしてこの違反を発見できるのでしょうか?
  • トレーニングされた AI または機械学習モデルは、機械学習によって生成されたトレーニング データのコンパイルされたバージョンから派生したものですか?それとも、ユーザーがさらにトレーニングすることで変更できるソース コードでしょうか?
  • Copilot によってトレーニングされた AI/ML モデルは著作権で保護されていますか?もしそうなら、著作権は誰が所有するのでしょうか?
  • FSF のような倫理擁護団体は、これらの問題に関連する著作権法の改正を主張すべきでしょうか?

提出されたホワイトペーパーが上記の問題を解決できる場合、500 米ドルの報酬を受け取ります。

https://www.fsf.org/blogs/licensing/fsf-funded-call-for-white-papers-on-philosophical-and-legal-questions-around-copilot

FSFはまた、さらなる研究が必要となり、その後論文が発表された場合、FSFは財政支援を増額すると述べた。

FSFとGPL

フリーソフトウェア財団 (FAF) は、コンピュータ ユーザーがソフトウェアを自由に使用できるように戦うことに専念しています。

ソフトウェアとドキュメント、特に GNU システムの開発と自由な使用を促進し、デジタル制限管理 (DRM) やソフトウェア特許などのコンピューター ユーザーに対する脅威に対抗します。

FSF が発行する GNU 一般公衆利用許諾書 (GNU GPL) は、世界で最も人気のあるフリー ソフトウェア ライセンスです。

これは、ソフトウェアの自由を促進し、維持することを明確な目的として作成された唯一のライセンスです。

GNU GPL は、ユーザーにソフトウェアを実行、研究、共有、変更する自由を保証します。

同時に、GPL に基づく派生作品はすべて、同じまたは同等のライセンス条件に従う必要があります。

GNU の公式ウェブサイトでは、GPL について次のように説明しています: 変更された GPL コードを一般に公開する場合は、ソース コードを提供する必要があります。

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

FSF は、GNU LGPL、GNU AGPL、GNU FDL などの他の重要なライセンスも公開しています。

だからこそ、FSF は Copilot の存在に疑問を呈する正当な態度をとっているのです。

疑問

GitHub Copilot は、コードを自動生成するという強力な機能により、リリース後に話題となりました。

GitHub は、Copilot がドキュメント内の文字列、コメント、関数名、コード自体を分析して、以前に呼び出された特定の関数を含む新しい一致するコードを生成できると主張しています。

リリース後、何人かの人がCopilotにLeetcodeの問題バンクを練習するよう依頼し、この「AIプログラマー」のパフォーマンスに非常に満足しました。

いくつかの質問に対する検証後、Copilot は毎回 Leetcode テストに合格できます。

ほぼ瞬時の生成速度を考えると、AI は人間よりもコードを書くのが得意かもしれないとブロガーは示唆しています。

しかし、疑わしいのは、Copilot によって「生成された」コンテンツが、Leetcode によって提供されたテンプレートとほぼ同じであるということです。

偶然にも、Copilot がリリースされた 2 日後に、一部のネットユーザーは、GitHub Copilot は無料のオープンソース コードをクリーンアップして金儲けするためのツールではないかと疑問を呈しました。

これらのコードは、商用利用を避けるために GNU GPL によって保護される必要があります。

ネットユーザーたちは、Copilot がトレーニングに GPL ベースのコードを使用しているという事実に疑問を呈した。

GPL には「私の成果物をプロプライエタリなソフトウェアに組み込まないでください」と明記されていますが、Copilot はまさにそれを実行しました。

予想通り、この疑惑は2日以内に現実のものとなった。

一部のネットユーザーは、Copilotが最も有名な「高速平方根逆計算法」をそのまま「コピー&ペースト」していることを発見した。

Copilot によって「生成された」コードは、これまで誰も理解できなかったマジックナンバー 0x5f3759df を使用するだけではありません。

「生成済み」の横のコメントもこのコードについて不満を述べています: what the f***?

つまり、実際のところ、Copilot はトレーニング セット内の他の人が書いたコードを再構成したものにすぎません。

GitHubの説明

GitHub は Copilot の公式 Web サイトで、直接引用は 0.1% あるかもしれないが、Copilot によって生成されるコードの大部分はオリジナルになると述べています。

さらに、チームメンバーのアルバート・ジーグラー氏は、Copilot を日常業務で使用している 300 人の従業員からデータを収集し、その中には Python に関する 453,780 件の提案も含まれていると述べています。

情報を分析して整理した後、アルバートは非常に完成度の高いブログ記事を書きました。

アルバート氏はブログの中で、トレーニング セットの内容を記憶することは問題ではないと述べています。

それは詩を暗唱するようなものです。誰もが詩を暗唱しますが、これによって彼がこれらの詩との日々のコミュニケーションにおいて迷うことはないでしょう。

テスト結果

アルバート氏は、GitHub Copilot の提案のほとんどについて、トレーニングに使用されたコードとの大きな重複は見つからなかったと述べています。

Albert 氏は、GitHub Copilot はコードセットを逐語的に引用するが、そうすることはほとんどないと述べました。

たとえそうであったとしても、ほとんどの場合、それは誰もが参照するコードであり、ほとんどの場合、ファイルの先頭にあります。

Albert 氏は、理想的には、Copilot がトレーニング セットから直接コピーされたコードを「生成」した場合、Copilot はユーザーにそれを通知すると述べました。

ユーザーは、コードに署名するか、Copilot によって提供されたコードを直接拒否するかを決定できます。

しかし現実には、GitHub、Microsoft、OpenAI はこれを実行するのが遅れています。

そのため、FSF は開発者の権利を保護するために自ら介入する必要がありました。

ネットユーザーの議論

道徳的なレベルでは、ネットユーザーは FSF への支持を表明しましたが、Copilot によってプログラマーがコードを書くハードルを下げることができるとも考えていました。

ネットユーザーによると、AIは実際には人間と同じであり、入手可能なソースコードに基づいてプログラミングを学習できるという。

Copilot が以前に見たことのあるコードを貼り付けていると言うのは、技術的にも法的にも賢明ではありません。

もちろん、ネットユーザーの中には、FSF はソフトウェアの使用を制限するのではなく、自由に使えるように努めるべきだと考える人もいます。

Copilot は著作権を侵害していると思いますか?

<<:  推論コストが48分の1に削減されました! 1つのGPUで静止画像を動かすことができる

>>:  小売業界におけるRPA活用事例11選

ブログ    

推薦する

この記事では、人工知能がクラウドコンピューティングをどのように変え、私たちの生活にどのような影響を与えるかを説明します。

AIがクラウドコンピューティングをどう変えるかクラウド コンピューティングは、オンライン アクティ...

人工知能を活用するための5つのベストプラクティス

生産性、精度、意思決定能力を向上させるために人工知能 (AI) を導入する手法は、さまざまな業界で広...

...

デジタルワールドが未来を予見するファバルタ製品・ユーザーカンファレンスが大盛況のうちに開催

9月19日、大手AIインフラ企業であるFabartaは、北京で初の製品およびユーザーカンファレンスを...

機械学習タスクオーケストレーションツールの比較

[[349374]]タスクオーケストレーションツールとワークフロー最近、タスクとデータのワークフロー...

PaddlePaddleがAIの旗印を掲げ、国産のディープラーニングフレームワークが人気

[51CTO.com オリジナル記事] Baidu は 2019 年第 2 四半期の財務報告を発表し...

自然言語処理: 人工知能の重要な要素

自然言語処理 (NLP) により、コンピューターは人間の言語のニュアンスを理解できるようになります。...

人工知能が社会にもっと役立つように

[[355038]]ビッグデータ時代には、「顔」が重要なデータ情報です。顔認識技術は、その独自性と優...

IDC: AIソリューションへの世界的な支出は3年以内に5000億ドルを超える

IDC は、2024 年以降の世界の情報技術 (IT) 業界予測レポートを発表しました。 IDC は...

この世界規模の問題に対して、ドローンはどれほどの助けとなるのでしょうか?

火事を起こすのは簡単ですが、消すのは難しいです。これは世界的な問題ですが、これを効果的に予防し、迅速...

DeLu Deep Visionが蘇州スマート博覧会に登場、3Dフルスタックでマシンビジョンの新時代を切り開く

8月14日、2020年世界人工知能製品応用博覧会(AIExpo2020)が予定通り蘇州国際博覧センタ...

勾配降下法はAI専門家やネットユーザーの間で白熱した議論を巻き起こす:全員の答えは読む価値がある

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

企業が AIoT に細心の注意を払うべきなのはなぜでしょうか?

[[401594]]過去 100 年間の最大の技術革新を思い起こすと、すぐに何が思い浮かびますか?...

AI推論の進化

AI推論市場はここ3、4年で劇的に変化しました。以前は、エッジ AI は存在すらせず、推論機能のほと...