YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI学術界に大きな激震が走っています。

YOLOアルゴリズムの作者ジョセフ・レドモン氏は、自身のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されていたため、すべての履歴書研究を停止すると個人のTwitterで発表した。これにより彼の道徳心が大いに試された。

YOLO は、コンピューター ビジョンの分野で最もよく知られているターゲット検出アルゴリズムの 1 つであり、オープン ソースであるため業界で広く採用されています。

著者の Joseph Redmon 氏は、このアルゴリズムで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界で広く引用されており、レドモン氏の筆頭著者である関連論文3本の引用総数は1万件を超えている。

このような影響力のある学者による突然の撤退発表は、必然的に学界に衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

フランスのテクノロジー企業の最高技術責任者(CTO)は、レドモン氏の信念を尊重すると述べた。

レドモン氏の過去の派手な性格が、今日の彼の決断のきっかけとなったのかもしれない。

YOLOの父について

ジェセフ・レドモンは、米国のミドルベリー大学を卒業し、コンピューターサイエンスを専攻し、数学を副専攻しました。 2013年にワシントン大学に入学し、コンピューターサイエンスの修士号を取得し、その後2019年まで博士号取得を目指しました。

この期間中、彼と彼の指導者である Ali Farhadi は共同で YOLO アルゴリズムを提案し、改良しました。

彼の主な研究分野は、物体検出、画像分類、モデル圧縮です。レドモンはCV研究からの撤退を発表したが、これは基本的に今後新たに始めることを意味する。

[[315879]]

彼の履歴書は次のようになります。

ジョセフ・レドモンの過去のインターンシップ経験も素晴らしいものでした。

彼は Google Brain でインターンとして働き、リアルタイムのロボットによる把持検出に取り組みました。その後、AI2(後のXNOR.ai)でインターンをし、モバイルデバイス上での画像分類に必要な計算量を削減できるバイナリ近似畳み込みニューラルネットワークXNOR-Netを提案しました。

レドモン氏は、現実世界のアプリケーション向けに、より優れた高速な CV ツールの開発に取り組んだ功績により、2018 年に「機械認識、音声技術、コンピューター ビジョン」部門で Google PhD フェローシップを受賞しました。

レドモン氏自身もTEDのステージに登場し、物体を素早く識別するCVアルゴリズムを紹介した。

高速YOLOアルゴリズム

YOLO の正式名称は「You Only Look Once」です。この名前は、このアルゴリズムの高速性の利点も示しています。そのため、YOLO アルゴリズムは多くのエッジ デバイスで広く使用されています。

他の有名なターゲット検出アルゴリズムである Fast R-CNN とは異なり、YOLO は「ワンステップ」戦略を採用して、ターゲット オブジェクトのカテゴリと位置を同時に生成します。

YOLO アルゴリズムには、Fast R-CNN に比べて 2 つの大きな利点があります。

1. 高速: 毎秒 45 フレームの検出速度で、リアルタイムのビデオ検出に使用でき、小型モデルでは最大 155 フレームまで検出できます。

2. 汎用性が高い: 実際の画像データでトレーニングされたネットワークは、架空の絵画にも使用できます。

ただし、YOLO にも一定の制限があります。精度は Fast R-CNN ほど高くなく、各正方形で 1 つのオブジェクトしか検出できず、エッジが不規則なオブジェクトの場合、周囲のオブジェクトの認識に影響します。

作者のレドモン氏はその後、オリジナルのYOLO技術をベースにYOLO9000やYOLOv3といったアルゴリズムを開発し、検出対象の種類を拡大し、モデルの精度を向上させました。

今後もYOLOを使用できますか?

レッドモン氏の突然の決断はYOLOの今後の利用に影響を与えるでしょうか?今のところこれについては心配しないでください。

著者は CV 研究からの撤退を発表しただけであり、彼の個人 GitHub ページにあるオープンソース プロジェクトはいずれも終了していません。たとえ作者が将来的にメンテナンスを行わなくなったとしても、YOLO の影響力の大きさを考えると、オープンソース コミュニティの他の開発者が今後もメンテナンスを継続することは間違いありません。

レッドモン氏自身がYOLOアルゴリズムの特許を申請する可能性は低い。なぜなら、レッドモン氏はこの態度をAI技術の適用範囲に対する不満を表明するために利用しているだけであるからだ。特許を申請しても、軍事的および非倫理的な商業的利用を防ぐことはできない。

AIが今日まで発展するにつれて、倫理的な問題がますます顕著になってきています。

サンフランシスコでは警察が法執行に顔認識技術を使用することを禁止する法律が可決され、メグビー氏は教室でAI監視技術を使用したことで非難されたが、これらはすべてAIが一線を越えないようにという警告である。

YOLOの生みの親の撤退は、AIの倫理的問題に関して学術界に新たな警鐘を鳴らすものとなった。

<<:  10回!マイクロソフトは、1000億のパラメータをトレーニングできる史上最大のNLGモデルをオープンソース化しました。

>>:  グリーンロボットが環境の持続可能性にどのように貢献できるか

ブログ    
ブログ    

推薦する

Tongyi Qianwenが再びオープンソース化、Qwen1.5は6つのボリュームモデルを導入、そのパフォーマンスはGPT3.5を上回る

春節の直前に、同義千文モデル(Qwen)バージョン1.5がリリースされました。今朝、新バージョンのニ...

...

TCP/IPトランスポート層におけるTCP BBRアルゴリズムについての簡単な説明

0x00. はじめにこれは、TCP/IP プロトコル スタック シリーズの 3 番目の記事です。前回...

画像認識が最も得意な会社はどこでしょうか? Microsoft、Amazon、Google、それともIBM?

[51CTO.com クイック翻訳] 認識ソフトウェアは、特定の種類の画像を正しく分類するのに非常...

ブラウザで TensorFlow を使用するにはどうすればいいですか?

[[341102]] [51CTO.com クイック翻訳] TensorFlow を使用すると、少...

人工知能があなたの生活を変える10の方法

人類は歴史の中で長い道のりを歩んできましたが、現在の技術の進歩は人類の進歩のペースを加速させ、すべて...

ボストン・ダイナミクスの二輪ロボット「ハンドル」がデビューします!物流ロボットOTTOと連携して商品を配送

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

最近人気の大型モデルや自動運転コンセプトについてお話ししましょう。

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

マスク氏が突然ツイッター買収を希望、上場廃止に2700億ドルで入札。ツイッターとテスラの株価は下落

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ソラの13人のメンバーを解読:北京大学卒業生を含む中国人3人、博士号を取得したばかりの1人、そして21歳の天才

OpenAIはSoraで世界に衝撃を与えた。どのような才能あるチームがこのような傑作を開発できるので...

Appleは、生成AIをiPhone上でローカルに実行できるようにするために、より多くの人材を採用している。

8月6日、今年初めから、生成型人工知能への熱狂がテクノロジー業界全体を席巻しているというニュースが...

2024年に最も使用される11のAIテキスト生成ツール

世界は、スーパーヒーローのマントを身につけていない強力な世界的勢力のような人工知能 (AI) が支配...

...

機械に記憶を与える: DeepMind の主要研究は柔軟な重み統合アルゴリズムを提案

世界で最も注目されている人工知能研究機関のひとつである Google DeepMind は、常に私た...