YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI学術界に大きな激震が走っています。

YOLOアルゴリズムの作者ジョセフ・レドモン氏は、自身のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されていたため、すべての履歴書研究を停止すると個人のTwitterで発表した。これにより彼の道徳心が大いに試された。

YOLO は、コンピュータービジョンの分野で最もよく知られているターゲット検出アルゴリズムの 1 つであり、オープンソースであるため業界で広く採用されています。

著者の Joseph Redmon 氏は、このアルゴリズムで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界で広く引用されており、レドモン氏の筆頭著者である関連論文3本の引用総数は1万件を超えている。

このような影響力のある学者による突然の撤退発表は、必然的に学界に衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

フランスのテクノロジー企業の最高技術責任者（CTO）は、レドモン氏の信念を尊重すると述べた。

レドモン氏の過去の派手な性格が、今日の彼の決断のきっかけとなったのかもしれない。

YOLOの父について

ジェセフ・レドモンは、米国のミドルベリー大学を卒業し、コンピューターサイエンスを専攻し、数学を副専攻しました。 2013年にワシントン大学に入学し、コンピューターサイエンスの修士号を取得し、その後2019年まで博士号取得を目指しました。

この期間中、彼と彼の指導者である Ali Farhadi は共同で YOLO アルゴリズムを提案し、改良しました。

彼の主な研究分野は、物体検出、画像分類、モデル圧縮です。レドモンはCV研究からの撤退を発表したが、これは基本的に今後新たに始めることを意味する。

彼の履歴書は次のようになります。

ジョセフ・レドモンの過去のインターンシップ経験も素晴らしいものでした。

彼は Google Brain でインターンとして働き、リアルタイムのロボットによる把持検出に取り組みました。その後、AI2（後のXNOR.ai）でインターンをし、モバイルデバイス上での画像分類に必要な計算量を削減できるバイナリ近似畳み込みニューラルネットワークXNOR-Netを提案しました。

レドモン氏は、現実世界のアプリケーション向けに、より優れた高速な CV ツールの開発に取り組んだ功績により、2018 年に「機械認識、音声技術、コンピュータービジョン」部門で Google PhD フェローシップを受賞しました。

レドモン氏自身もTEDのステージに登場し、物体を素早く識別するCVアルゴリズムを紹介した。

高速YOLOアルゴリズム

YOLO の正式名称は「You Only Look Once」です。この名前は、このアルゴリズムの高速性の利点も示しています。そのため、YOLO アルゴリズムは多くのエッジデバイスで広く使用されています。

他の有名なターゲット検出アルゴリズムである Fast R-CNN とは異なり、YOLO は「ワンステップ」戦略を採用して、ターゲットオブジェクトのカテゴリと位置を同時に生成します。

YOLO アルゴリズムには、Fast R-CNN に比べて 2 つの大きな利点があります。

1. 高速: 毎秒 45 フレームの検出速度で、リアルタイムのビデオ検出に使用でき、小型モデルでは最大 155 フレームまで検出できます。

2. 汎用性が高い: 実際の画像データでトレーニングされたネットワークは、架空の絵画にも使用できます。

ただし、YOLO にも一定の制限があります。精度は Fast R-CNN ほど高くなく、各正方形で 1 つのオブジェクトしか検出できず、エッジが不規則なオブジェクトの場合、周囲のオブジェクトの認識に影響します。

作者のレドモン氏はその後、オリジナルのYOLO技術をベースにYOLO9000やYOLOv3といったアルゴリズムを開発し、検出対象の種類を拡大し、モデルの精度を向上させました。

今後もYOLOを使用できますか?

レッドモン氏の突然の決断はYOLOの今後の利用に影響を与えるでしょうか？今のところこれについては心配しないでください。

著者は CV 研究からの撤退を発表しただけであり、彼の個人 GitHub ページにあるオープンソースプロジェクトはいずれも終了していません。たとえ作者が将来的にメンテナンスを行わなくなったとしても、YOLO の影響力の大きさを考えると、オープンソースコミュニティの他の開発者が今後もメンテナンスを継続することは間違いありません。

レッドモン氏自身がYOLOアルゴリズムの特許を申請する可能性は低い。なぜなら、レッドモン氏はこの態度をAI技術の適用範囲に対する不満を表明するために利用しているだけであるからだ。特許を申請しても、軍事的および非倫理的な商業的利用を防ぐことはできない。

AIが今日まで発展するにつれて、倫理的な問題がますます顕著になってきています。

サンフランシスコでは警察が法執行に顔認識技術を使用することを禁止する法律が可決され、メグビー氏は教室でAI監視技術を使用したことで非難されたが、これらはすべてAIが一線を越えないようにという警告である。

YOLOの生みの親の撤退は、AIの倫理的問題に関して学術界に新たな警鐘を鳴らすものとなった。

<<: 10回！マイクロソフトは、1000億のパラメータをトレーニングできる史上最大のNLGモデルをオープンソース化しました。

>>: グリーンロボットが環境の持続可能性にどのように貢献できるか

なぜ失敗したかご存知ですか?機械学習プロジェクトの 87% がこのように失敗します…

YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

YOLOの父について

高速YOLOアルゴリズム

今後もYOLOを使用できますか?

なぜ失敗したかご存知ですか?機械学習プロジェクトの 87% がこのように失敗します…

ペンシルバニア大学は、ディープニューラルネットワークの対称構造を研究し、層ごとの剥離解析モデルを提案した。

人工知能の実例5つ

GPT-4Vに匹敵し、120万データと8つのA100のみを使用し、トレーニングは1日で完了し、LLaVA-1.5は11のベンチマークSOTAを更新しました。

将来スマートフォンは消滅するのでしょうか？ Huaweiがそれに代わるスマートフォンを発売します！

AIの受賞作品の著作権申請が却下されました！著者は624のヒントを与えている

人工知能の力：デジタル創造性から金融技術まで、知能は新たな機会をもたらす

動画超解像コンテストの優勝アルゴリズムがCVPR 2022に選出された。センスタイムと南洋理工大学が開発したアルゴリズムで、16の類似モデルを一気に打ち負かした。

推薦する

老黄が勝利！ Nvidia H100の注文は24年待ち、マスク氏も黙っていられない

210,000のボーナスがあなたを待っています！「ファーウェイクラウドカップ」全国AIコンテスト募集中

ChatGPT Enterprise Editionが登場: 史上最強のバージョン、無制限の使用と32kコンテキストを備えた2倍のGPT-4

馬懿、沈向陽、曹英の最新AIレビューが人気に！作成に3か月かかりました。ネットユーザー必読の論文です

顔認識の過去と現在

仕事の未来に役立つAIの3つの重要な要素

データ構造とアルゴリズム: 文字列の分割とバランス

バイトマルチモーダル大規模モデル PixelLM: SA に頼らない効率的なピクセルレベル推論

インテルは新しい小さな「スピン量子ビット」チップをテスト中

機械学習について知っておくべき6つの革命的な教訓