GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

GitHub はオープンソース コミュニティをイライラさせます!非フリーの Copilot はコピー方法しか知りません?我慢できない

[[416556]]

Github Copilot はリリース以来、物議を醸してきました。

最近、フリーソフトウェア財団 (FSF) はついに我慢できなくなりました。

FSF は、Copilot テクノロジーが法的および哲学的な問題を引き起こすと考えています。

FSFは投稿の中で、GitHub Copilotは「我々の観点からは受け入れられず不公平だ」と書いている。

Copilot を実行するには、Microsoft の Visual Studio IDE や Visual Studio Code エディターなどの有料ソフトウェアが必要になるためです。

このようにして、Copilot は SaaSS (Service as a Software Substitute) になります。

Copilot は、単に「コピー」して「貼り付け」するだけで、開発者の以前の作業を盗むことができます。

Copilot は、さらなる研究を必要とする他の多くの疑問も提起しています。

たとえば、開発者はソフトウェア上でニューラル ネットワークをトレーニングすることが合理的かどうかわかりません。

さらに、Copilot に関心のある人の中には、GitHub リポジトリからコピーしたコードを使用すると著作権を侵害するのではないかと疑問に思う人もいます。

たとえすべてが合法かつ準拠していたとしても、一部の活動家は、プロプライエタリソフトウェア会社が過去の開発者の作業に基づいてサービスを提供することが公平であるかどうか疑問視しています。

これらの疑問に答え、ユーザーの使用の自由を守るために、FSF は Copilot、セキュリティ、機械学習、フリーソフトウェアの問題に対処するホワイトペーパーへの資金提供を発表しました。

ホワイトペーパーは500ドル

FSF は公式ウェブサイトでホワイトペーパーで回答すべき内容をリストアップしています。

  • Copilot のパブリック リポジトリ トレーニングは著作権を侵害しますか?この使用はフェアユースですか?
  • Copilot の出力によって、GPL ライセンスの作品に対する違反として訴訟の対象となる可能性はどの程度ありますか?
  • 開発者は、著作権を所有するコードが Copilot 違反から保護されることをどのように保証できますか?
  • Copilot を使用する開発者が GPL などのフリー ソフトウェア ライセンスに準拠できるようにする方法はありますか?
  • Copilot が AGPL でカバーされているコードから学習する場合、Copilot は AGPL に違反することになりますか?
  • Copilot によって生成されたコードがフリーソフトウェアライセンスの作品に違反する場合、著作権所有者はどのようにしてこの違反を発見できるのでしょうか?
  • トレーニングされた AI または機械学習モデルは、機械学習によって生成されたトレーニング データのコンパイルされたバージョンから派生したものですか?それとも、ユーザーがさらにトレーニングすることで変更できるソース コードでしょうか?
  • Copilot によってトレーニングされた AI/ML モデルは著作権で保護されていますか?もしそうなら、著作権は誰が所有するのでしょうか?
  • FSF のような倫理擁護団体は、これらの問題に関連する著作権法の改正を主張すべきでしょうか?

提出されたホワイトペーパーが上記の問題を解決できる場合、500 米ドルの報酬を受け取ります。

https://www.fsf.org/blogs/licensing/fsf-funded-call-for-white-papers-on-philosophical-and-legal-questions-around-copilot

FSFはまた、さらなる研究が必要となり、その後論文が発表された場合、FSFは財政支援を増額すると述べた。

FSFとGPL

フリーソフトウェア財団 (FAF) は、コンピュータ ユーザーがソフトウェアを自由に使用できるように戦うことに専念しています。

ソフトウェアとドキュメント、特に GNU システムの開発と自由な使用を促進し、デジタル制限管理 (DRM) やソフトウェア特許などのコンピューター ユーザーに対する脅威に対抗します。

FSF が発行する GNU 一般公衆利用許諾書 (GNU GPL) は、世界で最も人気のあるフリー ソフトウェア ライセンスです。

これは、ソフトウェアの自由を促進し、維持することを明確な目的として作成された唯一のライセンスです。

GNU GPL は、ユーザーにソフトウェアを実行、研究、共有、変更する自由を保証します。

同時に、GPL に基づく派生作品はすべて、同じまたは同等のライセンス条件に従う必要があります。

GNU の公式ウェブサイトでは、GPL について次のように説明しています: 変更された GPL コードを一般に公開する場合は、ソース コードを提供する必要があります。

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

FSF は、GNU LGPL、GNU AGPL、GNU FDL などの他の重要なライセンスも公開しています。

だからこそ、FSF は Copilot の存在に疑問を呈する正当な態度をとっているのです。

疑問

GitHub Copilot は、コードを自動生成するという強力な機能により、リリース後に話題となりました。

GitHub は、Copilot がドキュメント内の文字列、コメント、関数名、コード自体を分析して、以前に呼び出された特定の関数を含む新しい一致するコードを生成できると主張しています。

リリース後、何人かの人がCopilotにLeetcodeの問題バンクを練習するよう依頼し、この「AIプログラマー」のパフォーマンスに非常に満足しました。

いくつかの質問に対する検証後、Copilot は毎回 Leetcode テストに合格できます。

ほぼ瞬時の生成速度を考えると、AI は人間よりもコードを書くのが得意かもしれないとブロガーは示唆しています。

しかし、疑わしいのは、Copilot によって「生成された」コンテンツが、Leetcode によって提供されたテンプレートとほぼ同じであるということです。

偶然にも、Copilot がリリースされた 2 日後に、一部のネットユーザーは、GitHub Copilot は無料のオープンソース コードをクリーンアップして金儲けするためのツールではないかと疑問を呈しました。

これらのコードは、商用利用を避けるために GNU GPL によって保護される必要があります。

ネットユーザーたちは、Copilot がトレーニングに GPL ベースのコードを使用しているという事実に疑問を呈した。

GPL には「私の成果物をプロプライエタリなソフトウェアに組み込まないでください」と明記されていますが、Copilot はまさにそれを実行しました。

予想通り、この疑惑は2日以内に現実のものとなった。

一部のネットユーザーは、Copilotが最も有名な「高速平方根逆計算法」をそのまま「コピー&ペースト」していることを発見した。

Copilot によって「生成された」コードは、これまで誰も理解できなかったマジックナンバー 0x5f3759df を使用するだけではありません。

「生成済み」の横のコメントもこのコードについて不満を述べています: what the f***?

つまり、実際のところ、Copilot はトレーニング セット内の他の人が書いたコードを再構成したものにすぎません。

GitHubの説明

GitHub は Copilot の公式 Web サイトで、直接引用は 0.1% あるかもしれないが、Copilot によって生成されるコードの大部分はオリジナルになると述べています。

さらに、チームメンバーのアルバート・ジーグラー氏は、Copilot を日常業務で使用している 300 人の従業員からデータを収集し、その中には Python に関する 453,780 件の提案も含まれていると述べています。

情報を分析して整理した後、アルバートは非常に完成度の高いブログ記事を書きました。

アルバート氏はブログの中で、トレーニング セットの内容を記憶することは問題ではないと述べています。

それは詩を暗唱するようなものです。誰もが詩を暗唱しますが、これによって彼がこれらの詩との日々のコミュニケーションにおいて迷うことはないでしょう。

テスト結果

アルバート氏は、GitHub Copilot の提案のほとんどについて、トレーニングに使用されたコードとの大きな重複は見つからなかったと述べています。

Albert 氏は、GitHub Copilot はコードセットを逐語的に引用するが、そうすることはほとんどないと述べました。

たとえそうであったとしても、ほとんどの場合、それは誰もが参照するコードであり、ほとんどの場合、ファイルの先頭にあります。

Albert 氏は、理想的には、Copilot がトレーニング セットから直接コピーされたコードを「生成」した場合、Copilot はユーザーにそれを通知すると述べました。

ユーザーは、コードに署名するか、Copilot によって提供されたコードを直接拒否するかを決定できます。

しかし現実には、GitHub、Microsoft、OpenAI はこれを実行するのが遅れています。

そのため、FSF は開発者の権利を保護するために自ら介入する必要がありました。

ネットユーザーの議論

道徳的なレベルでは、ネットユーザーは FSF への支持を表明しましたが、Copilot によってプログラマーがコードを書くハードルを下げることができるとも考えていました。

ネットユーザーによると、AIは実際には人間と同じであり、入手可能なソースコードに基づいてプログラミングを学習できるという。

Copilot が以前に見たことのあるコードを貼り付けていると言うのは、技術的にも法的にも賢明ではありません。

もちろん、ネットユーザーの中には、FSF はソフトウェアの使用を制限するのではなく、自由に使えるように努めるべきだと考える人もいます。

Copilot は著作権を侵害していると思いますか?

<<:  推論コストが48分の1に削減されました! 1つのGPUで静止画像を動かすことができる

>>:  小売業界におけるRPA活用事例11選

ブログ    
ブログ    
ブログ    

推薦する

ロボット工学は良いが、誇張しすぎるのは良くない

現在、ロボット工学は科学技術分野における最先端技術となっており、先進国は、この技術面で優位に立つこと...

2024 年のコンテナ技術予測: パフォーマンス、AI、セキュリティの採用

パフォーマンス重視のコンテナ技術向けのツールとサービスを提供する Sylabs は、2024 年まで...

CCTV が顔認識ルーチンを公開、プライバシーとセキュリティをどう保護するか?

現在、インターネットやビッグデータなどの急速な発展と、Internet of Everythingの...

農産物産業における人工知能の応用と影響

農産物における人工知能の応用人工知能は、次のような農産物のあらゆる段階と側面に適用できます。農業: ...

図: ページ置換アルゴリズム

[[398509]]この記事はWeChatの公開アカウント「Jingyu」から転載したもので、著者は...

人工知能とクラウドコンピューティングはアプリケーションエコシステムの形成を加速させている

[[430244]]現在、人工知能は生産性の向上を可能にし、さまざまな産業のインテリジェント化と新旧...

AI製品化の鍵はアルゴリズムではなくインフラとデータ

[[187402]]人工知能は現在、魔法のような大流行を経験しています。データは、数字の羅列としてニ...

自動運転車は私たちの生活をどのように変えるのでしょうか?

自動運転車は交通渋滞を改善し、交通事故を減らすだろうが、公共交通機関、不動産市場、健康にもさまざまな...

...

...

強化学習の博士号を取得して卒業することは人気がありますか? Redditユーザーがキャリアプランニングのアドバイスを求める

最近、修士号を取得して卒業しようとしているネットユーザーがネットユーザーに助けを求めました。「強化学...

人工知能が不動産ビジネスの成長を加速させる方法

人工知能 (AI) は、今後最も期待されるテクノロジーの 1 つです。テクノロジーがビジネスに与える...

AIが科学研究を「行う」ことを学習し、ネイチャー誌に発表。知湖ネットユーザー:水を見るのは耐えられない

人工知能は複雑な囲碁のゲームでは簡単に人間に勝つことができますが、科学的な発見に役立つのでしょうか?...

AIアルゴリズムの包囲とフードデリバリー業者の「ブレイクアウト」

システムに閉じ込められた配達員たちは反撃している。最近、海外のテクノロジーメディアWiredは、プラ...

Stack Overflow は独自の生成 AI ツールを公開するためにスタッフの 28% を削減

これは ChatGPT が直接引き起こした大規模なレイオフである可能性があります。世界最大のプログラ...