GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

[[416556]]

Github Copilot はリリース以来、物議を醸してきました。

最近、フリーソフトウェア財団 (FSF) はついに我慢できなくなりました。

FSF は、Copilot テクノロジーが法的および哲学的な問題を引き起こすと考えています。

FSFは投稿の中で、GitHub Copilotは「我々の観点からは受け入れられず不公平だ」と書いている。

Copilot を実行するには、Microsoft の Visual Studio IDE や Visual Studio Code エディターなどの有料ソフトウェアが必要になるためです。

このようにして、Copilot は SaaSS (Service as a Software Substitute) になります。

Copilot は、単に「コピー」して「貼り付け」するだけで、開発者の以前の作業を盗むことができます。

Copilot は、さらなる研究を必要とする他の多くの疑問も提起しています。

たとえば、開発者はソフトウェア上でニューラル ネットワークをトレーニングすることが合理的かどうかわかりません。

さらに、Copilot に関心のある人の中には、GitHub リポジトリからコピーしたコードを使用すると著作権を侵害するのではないかと疑問に思う人もいます。

たとえすべてが合法かつ準拠していたとしても、一部の活動家は、プロプライエタリソフトウェア会社が過去の開発者の作業に基づいてサービスを提供することが公平であるかどうか疑問視しています。

これらの疑問に答え、ユーザーの使用の自由を守るために、FSF は Copilot、セキュリティ、機械学習、フリーソフトウェアの問題に対処するホワイトペーパーへの資金提供を発表しました。

ホワイトペーパーは500ドル

FSF は公式ウェブサイトでホワイトペーパーで回答すべき内容をリストアップしています。

  • Copilot のパブリック リポジトリ トレーニングは著作権を侵害しますか?この使用はフェアユースですか?
  • Copilot の出力によって、GPL ライセンスの作品に対する違反として訴訟の対象となる可能性はどの程度ありますか?
  • 開発者は、著作権を所有するコードが Copilot 違反から保護されることをどのように保証できますか?
  • Copilot を使用する開発者が GPL などのフリー ソフトウェア ライセンスに準拠できるようにする方法はありますか?
  • Copilot が AGPL でカバーされているコードから学習する場合、Copilot は AGPL に違反することになりますか?
  • Copilot によって生成されたコードがフリーソフトウェアライセンスの作品に違反する場合、著作権所有者はどのようにしてこの違反を発見できるのでしょうか?
  • トレーニングされた AI または機械学習モデルは、機械学習によって生成されたトレーニング データのコンパイルされたバージョンから派生したものですか?それとも、ユーザーがさらにトレーニングすることで変更できるソース コードでしょうか?
  • Copilot によってトレーニングされた AI/ML モデルは著作権で保護されていますか?もしそうなら、著作権は誰が所有するのでしょうか?
  • FSF のような倫理擁護団体は、これらの問題に関連する著作権法の改正を主張すべきでしょうか?

提出されたホワイトペーパーが上記の問題を解決できる場合、500 米ドルの報酬を受け取ります。

https://www.fsf.org/blogs/licensing/fsf-funded-call-for-white-papers-on-philosophical-and-legal-questions-around-copilot

FSFはまた、さらなる研究が必要となり、その後論文が発表された場合、FSFは財政支援を増額すると述べた。

FSFとGPL

フリーソフトウェア財団 (FAF) は、コンピュータ ユーザーがソフトウェアを自由に使用できるように戦うことに専念しています。

ソフトウェアとドキュメント、特に GNU システムの開発と自由な使用を促進し、デジタル制限管理 (DRM) やソフトウェア特許などのコンピューター ユーザーに対する脅威に対抗します。

FSF が発行する GNU 一般公衆利用許諾書 (GNU GPL) は、世界で最も人気のあるフリー ソフトウェア ライセンスです。

これは、ソフトウェアの自由を促進し、維持することを明確な目的として作成された唯一のライセンスです。

GNU GPL は、ユーザーにソフトウェアを実行、研究、共有、変更する自由を保証します。

同時に、GPL に基づく派生作品はすべて、同じまたは同等のライセンス条件に従う必要があります。

GNU の公式ウェブサイトでは、GPL について次のように説明しています: 変更された GPL コードを一般に公開する場合は、ソース コードを提供する必要があります。

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

FSF は、GNU LGPL、GNU AGPL、GNU FDL などの他の重要なライセンスも公開しています。

だからこそ、FSF は Copilot の存在に疑問を呈する正当な態度をとっているのです。

疑問

GitHub Copilot は、コードを自動生成するという強力な機能により、リリース後に話題となりました。

GitHub は、Copilot がドキュメント内の文字列、コメント、関数名、コード自体を分析して、以前に呼び出された特定の関数を含む新しい一致するコードを生成できると主張しています。

リリース後、何人かの人がCopilotにLeetcodeの問題バンクを練習するよう依頼し、この「AIプログラマー」のパフォーマンスに非常に満足しました。

いくつかの質問に対する検証後、Copilot は毎回 Leetcode テストに合格できます。

ほぼ瞬時の生成速度を考えると、AI は人間よりもコードを書くのが得意かもしれないとブロガーは示唆しています。

しかし、疑わしいのは、Copilot によって「生成された」コンテンツが、Leetcode によって提供されたテンプレートとほぼ同じであるということです。

偶然にも、Copilot がリリースされた 2 日後に、一部のネットユーザーは、GitHub Copilot は無料のオープンソース コードをクリーンアップして金儲けするためのツールではないかと疑問を呈しました。

これらのコードは、商用利用を避けるために GNU GPL によって保護される必要があります。

ネットユーザーたちは、Copilot がトレーニングに GPL ベースのコードを使用しているという事実に疑問を呈した。

GPL には「私の成果物をプロプライエタリなソフトウェアに組み込まないでください」と明記されていますが、Copilot はまさにそれを実行しました。

予想通り、この疑惑は2日以内に現実のものとなった。

一部のネットユーザーは、Copilotが最も有名な「高速平方根逆計算法」をそのまま「コピー&ペースト」していることを発見した。

Copilot によって「生成された」コードは、これまで誰も理解できなかったマジックナンバー 0x5f3759df を使用するだけではありません。

「生成済み」の横のコメントもこのコードについて不満を述べています: what the f***?

つまり、実際のところ、Copilot はトレーニング セット内の他の人が書いたコードを再構成したものにすぎません。

GitHubの説明

GitHub は Copilot の公式 Web サイトで、直接引用は 0.1% あるかもしれないが、Copilot によって生成されるコードの大部分はオリジナルになると述べています。

さらに、チームメンバーのアルバート・ジーグラー氏は、Copilot を日常業務で使用している 300 人の従業員からデータを収集し、その中には Python に関する 453,780 件の提案も含まれていると述べています。

情報を分析して整理した後、アルバートは非常に完成度の高いブログ記事を書きました。

アルバート氏はブログの中で、トレーニング セットの内容を記憶することは問題ではないと述べています。

それは詩を暗唱するようなものです。誰もが詩を暗唱しますが、これによって彼がこれらの詩との日々のコミュニケーションにおいて迷うことはないでしょう。

テスト結果

アルバート氏は、GitHub Copilot の提案のほとんどについて、トレーニングに使用されたコードとの大きな重複は見つからなかったと述べています。

Albert 氏は、GitHub Copilot はコードセットを逐語的に引用するが、そうすることはほとんどないと述べました。

たとえそうであったとしても、ほとんどの場合、それは誰もが参照するコードであり、ほとんどの場合、ファイルの先頭にあります。

Albert 氏は、理想的には、Copilot がトレーニング セットから直接コピーされたコードを「生成」した場合、Copilot はユーザーにそれを通知すると述べました。

ユーザーは、コードに署名するか、Copilot によって提供されたコードを直接拒否するかを決定できます。

しかし現実には、GitHub、Microsoft、OpenAI はこれを実行するのが遅れています。

そのため、FSF は開発者の権利を保護するために自ら介入する必要がありました。

ネットユーザーの議論

道徳的なレベルでは、ネットユーザーは FSF への支持を表明しましたが、Copilot によってプログラマーがコードを書くハードルを下げることができるとも考えていました。

ネットユーザーによると、AIは実際には人間と同じであり、入手可能なソースコードに基づいてプログラミングを学習できるという。

Copilot が以前に見たことのあるコードを貼り付けていると言うのは、技術的にも法的にも賢明ではありません。

もちろん、ネットユーザーの中には、FSF はソフトウェアの使用を制限するのではなく、自由に使えるように努めるべきだと考える人もいます。

Copilot は著作権を侵害していると思いますか?

<<:  推論コストが48分の1に削減されました! 1つのGPUで静止画像を動かすことができる

>>:  小売業界におけるRPA活用事例11選

推薦する

新たなAIスタントがあなたの人生と私の人生への影響を加速させる

現在「ホットスポットの中のホットスポット」として、人工知能は絶大な人気を誇っています。モバイルインタ...

8つの予測分析ツールの比較

予測分析ツールとは何ですか?予測分析ツールは、人工知能とビジネスレポートを融合します。これらのツール...

ウォールストリートジャーナル:大手テクノロジー企業は依然として生成AIサービスで利益を上げようとしている

昨年末の ChatGPT の登場により、生成 AI の流行が巻き起こり、現在ではほぼすべての主要ソフ...

インダストリー4.0: ロボットがやってくる

Robotics as a Service は、産業用 IoT (IIOT) 内でますます注目を集め...

重複ページの検索エンジンアルゴリズム分析

検索エンジンは一般的に、各 Web ページに対して一連の情報フィンガープリントが計算されるという考え...

2017 年のトップデータサイエンスと機械学習手法

[51CTO.com クイック翻訳] 統計によると、回答者が現在選択している最も一般的に使用されてい...

清華大学人工知能開発報告:中国は過去10年間のAI特許出願で世界第1位

ザ・ペーパー記者 張偉最新の報告書によると、中国の人工知能特許出願件数は過去10年間で世界第1位であ...

ロボットはペンを回したりクルミを転がしたりすることを学びました。 GPT-4では、タスクが複雑になるほどパフォーマンスが向上します

ビッグデータダイジェスト制作親愛なる友人たち、人工知能(AI)がチェス、囲碁、Dotaを征服した後、...

機械学習は計算化学研究の発展にどのように役立つのでしょうか?

過去数年間、化学研究は、個人の経験と文献から得られた過去の研究結果を使用する実験方法のみに焦点を当て...

半導体市場における人工知能の可能性と重要性

人工知能プロセッサは世界の半導体産業を活性化させており、少なくとも1つの市場調査会社は、AIチップの...

2019年、AI技術は製造業が小さな努力で大きな成果を達成するのを助けるだろう

[[251579]] 2019 年には、新世代の人工知能 (AI) ソリューションが注目を集めるでし...

ビッグデータと人工知能の時代において、監査人は依然としてアイデアを持つ必要があるのでしょうか?

誰もが考えを持っており、監査人もそれぞれ心の中にさまざまな考えを持っています。表面的には、監査スキル...

...

機械学習について誰もが知っておくべきこと

この記事では、機械学習の知識を広め、機械学習で何ができるのか、どのように行うのかを簡単に紹介します。...