YOLOプロジェクト復活!マスターが後を継ぎ、YOLOの父が2か月間引退し、v4バージョンが正式にリリースされました

YOLOプロジェクト復活!マスターが後を継ぎ、YOLOの父が2か月間引退し、v4バージョンが正式にリリースされました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

良いニュースです! YOLO の創設者が突然 CV 学術コミュニティからの撤退を発表してから 2 か月後、誰かが彼の旗を引き継ぎました。

かつてYOLOプロジェクトの保守に携わっていたもう一人の偉人、 Alexey Bochkovskiy氏がarXivにYOLO v4を提出し、この論文はYOLOの生みの親が立ち上げたプロジェクトの本流に引き込まれました。

これは、YOLO v4 が認められ、公式の「後継」となることも意味します。

今年2月、YOLOの生みの親であるジェセフ・レドモン氏は「自身の研究が及ぼすマイナスの影響を無視できない」という理由で突然引退を発表し、学界に大きな悲しみをもたらした。

[[323614]]

多くの人々は、これがこの強力な物体検出アルゴリズムの研究に水を差すことになるのではないかと懸念しています。

しかし、学術界とオープンソース コミュニティの力は強力です。YOLO v4 の開発者は、YOLO の Windows 版と Linux 版を開発した Alexey Bochkovskiy 氏です。

今回、YOLO v4では前作に比べて性能面でも大きな向上が図られました。前作と同じ実行速度を維持しながら、精度が大幅に向上しました。

パフォーマンスの大幅な向上

早速、実験結果を見てみましょう。

以下の実験結果はすべて、単一の 1080Ti または 2080Ti を使用してトレーニングされています。

COCO データセットでは、YOLOv4 は43.5% AP と65 FPS を達成しました。 AP と FPS がそれぞれ10%12%増加しました。実行速度はEfficientNetの2倍です。

研究者らは、Maxwell、Pascal、Volta などのさまざまな GPU アーキテクチャでも YOLOv4 を実行しました。

その速度 (FPS) と精度 (MS COCO AP50…95 および AP50) は、他の物体検出器を上回ります。

著者は、YOLOv4 は主に 3 つの新しい貢献をもたらすと結論付けました。

効率的で強力な物体検出モデルが提案されています。 1080Ti または 2080Ti を使用すると、超高速かつ正確なオブジェクト検出器をトレーニングできます。

検出器のトレーニング プロセス中に、最先端の Bag-of-Freebies および Bag-of-Specials メソッドがオブジェクト検出器に与える影響が検証されました。

SOTA メソッドを改善し、より効率的で、単一 GPU トレーニングに適したものにしました。

ドラマチックYOLOv4

実際、YOLOv4 の誕生は非常にドラマチックです。

なぜそう言うのでしょうか?

YOLO は、CV 分野の偉人である Joseph Redmonによって開発および保守されています。

今年2月、AI学術界に大きな激震が走った。ジョセフ・レドモン氏が個人のTwitterで、すべてのCV研究を中止すると発表したのだ。

その理由は、彼のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されており、それが彼の倫理に大きな試練をもたらしたからだ。

YOLO は、コンピューター ビジョンの分野で最もよく知られているターゲット検出アルゴリズムの1 つと言え、オープン ソースであることから業界でも広く採用されています。

Redmon 氏は、このアルゴリズムだけで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界にも大きな影響を与え、広く引用されている。レドモン氏が筆頭著者として発表した関連論文3本の引用数は合計1万6000件を超える。

ジェセフ・レドモンは2019年に卒業。当初は業界で大きな功績を残すと思われていたが、1年も経たないうちに突然の退学を発表し、衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

YOLO は絶版になるだろうと誰もが思っていたときに、突然 v4 バージョンがリリースされました。

私は誰で、どこにいるのか...

[[323615]]

引退することに同意したんじゃないの?

よく調べてみると、Redmon 氏は確かに今回の YOLOv4 の作者の中に含まれていないことが判明しました。

YOLOv4 の作者は Alexey Bochkovskiy であり、多くの学生はこの名前を聞いたことがあるかもしれません。

しかし、問題は、巨匠がこれほど広範囲に及ぶ影響力を持つ傑作の名前をそのまま使用することに同意するかどうかだ。

説明になるかもしれない詳細があります。

2年間非アクティブだったYOLO GitHub公式サイトが、数時間前にREADMEドキュメントを正式に更新しました。

ドキュメントの更新された内容は、主に YOLO v4 の論文とソース コードを指します。

Alexey Bochkovskiy は、YOLOv4 のコード ベースである darknet の別の github バージョンのメンテナーです。

これは、YOLOv4 が Joe Redmon によって承認されたことを意味するのでしょうか?

偉大な神はこの世から引退したが、依然として世の情勢を気にかけているようだ。

<<:  AIはアプリケーションとそれをサポートするアプリケーション/インフラストラクチャの管理方法を再定義します。

>>:  ボストン・ダイナミクスが伝染病と戦うために犬を派遣:頭にはiPad、背中にはトランシーバー、価格性能比は本当に大丈夫なのか?

ブログ    
ブログ    

推薦する

顔認識ブームは沈静化すべきでしょうか?

北京地下鉄は昨年11月から、セキュリティチェックに顔認識技術を使用する試験運用を開始し、ブラックリス...

「でたらめ記事ジェネレーター」が GitHub のホットリストのトップに。ワンクリックで 10,000 語の形式主義的な傑作を生成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

不動産テクノロジーの6つのトレンド: テクノロジーが不動産業界に破壊的変化をもたらす

[[315285]]現代の技術進歩の影響を免れる業界はありませんが、不動産業界はこの点では孤立した業...

...

顔認識が「トレンド」になったら、少なくとも私たちには選択する権利があるはずです。

【CNMO】「東莞でトイレットペーパーを買うのに顔認証が必要」「94歳の男性が顔認証で逮捕」「南寧...

2022年にロボット工学の急成長を支える5つの要因

ロボット工学は、ロボットの構想、設計、製造、操作を扱う工学の分野です。ロボット産業はここ数年で驚異的...

超速い! ByteDanceが配列推論エンジンLightSeqをオープンソース化

これは、Transformer や GPT などの複数のモデルの高速推論を完全にサポートする業界初の...

生成型AIの7つの秘密

誇大宣伝されているかどうかは別として、人工知能アルゴリズムの可能性は依然として有望です。しかし、今日...

AI による顔を変える動画が何百万人ものユーザーを獲得。たった 1 ステップで楽しさから恐怖感まで

今朝、私の友人の輪の中に、AI による顔の変形に関する短い動画が大量に現れました。これらの短編動画の...

人工知能が企業発展の原動力となる

新しいコンセプトが実行可能なビジネスツールになると、多くの企業がそのテクノロジーを積極的に採用して市...

72歳の男性がコーラを飲みながら脳で麻雀をする:これはすべて脳コンピューターインターフェース技術のおかげです

浙江省メディアの報道によると、現在浙江大学医学部第二付属病院で治療を受けている72歳の張さんは、意識...

ChatGPTプロンプトワードの新しいゲームプレイ「もっと作る」、テキストと画像の効果を2倍にする

ChatGPT は誰もがよく知っていると思いますが、それをうまく使う方法は想像するほど簡単ではありま...

ディズニーは強化学習を利用して新しいロボットをスターウォーズ風に仕上げた

ディズニーの新しいロボットがデビュー!では早速、どんな感じか見てみましょう——大きく輝く目、揺れる頭...

アリババDAMOアカデミーが自社開発の音声認識モデルDFSMNをリリースしオープンソース化を発表

[[232119]]最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDFS...