YOLOプロジェクト復活!マスターが後を継ぎ、YOLOの父が2か月間引退し、v4バージョンが正式にリリースされました

YOLOプロジェクト復活!マスターが後を継ぎ、YOLOの父が2か月間引退し、v4バージョンが正式にリリースされました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

良いニュースです! YOLO の創設者が突然 CV 学術コミュニティからの撤退を発表してから 2 か月後、誰かが彼の旗を引き継ぎました。

かつてYOLOプロジェクトの保守に携わっていたもう一人の偉人、 Alexey Bochkovskiy氏がarXivにYOLO v4を提出し、この論文はYOLOの生みの親が立ち上げたプロジェクトの本流に引き込まれました。

これは、YOLO v4 が認められ、公式の「後継」となることも意味します。

今年2月、YOLOの生みの親であるジェセフ・レドモン氏は「自身の研究が及ぼすマイナスの影響を無視できない」という理由で突然引退を発表し、学界に大きな悲しみをもたらした。

[[323614]]

多くの人々は、これがこの強力な物体検出アルゴリズムの研究に水を差すことになるのではないかと懸念しています。

しかし、学術界とオープンソース コミュニティの力は強力です。YOLO v4 の開発者は、YOLO の Windows 版と Linux 版を開発した Alexey Bochkovskiy 氏です。

今回、YOLO v4では前作に比べて性能面でも大きな向上が図られました。前作と同じ実行速度を維持しながら、精度が大幅に向上しました。

パフォーマンスの大幅な向上

早速、実験結果を見てみましょう。

以下の実験結果はすべて、単一の 1080Ti または 2080Ti を使用してトレーニングされています。

COCO データセットでは、YOLOv4 は43.5% AP と65 FPS を達成しました。 AP と FPS がそれぞれ10%12%増加しました。実行速度はEfficientNetの2倍です。

研究者らは、Maxwell、Pascal、Volta などのさまざまな GPU アーキテクチャでも YOLOv4 を実行しました。

その速度 (FPS) と精度 (MS COCO AP50…95 および AP50) は、他の物体検出器を上回ります。

著者は、YOLOv4 は主に 3 つの新しい貢献をもたらすと結論付けました。

効率的で強力な物体検出モデルが提案されています。 1080Ti または 2080Ti を使用すると、超高速かつ正確なオブジェクト検出器をトレーニングできます。

検出器のトレーニング プロセス中に、最先端の Bag-of-Freebies および Bag-of-Specials メソッドがオブジェクト検出器に与える影響が検証されました。

SOTA メソッドを改善し、より効率的で、単一 GPU トレーニングに適したものにしました。

ドラマチックYOLOv4

実際、YOLOv4 の誕生は非常にドラマチックです。

なぜそう言うのでしょうか?

YOLO は、CV 分野の偉人である Joseph Redmonによって開発および保守されています。

今年2月、AI学術界に大きな激震が走った。ジョセフ・レドモン氏が個人のTwitterで、すべてのCV研究を中止すると発表したのだ。

その理由は、彼のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されており、それが彼の倫理に大きな試練をもたらしたからだ。

YOLO は、コンピューター ビジョンの分野で最もよく知られているターゲット検出アルゴリズムの1 つと言え、オープン ソースであることから業界でも広く採用されています。

Redmon 氏は、このアルゴリズムだけで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界にも大きな影響を与え、広く引用されている。レドモン氏が筆頭著者として発表した関連論文3本の引用数は合計1万6000件を超える。

ジェセフ・レドモンは2019年に卒業。当初は業界で大きな功績を残すと思われていたが、1年も経たないうちに突然の退学を発表し、衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

YOLO は絶版になるだろうと誰もが思っていたときに、突然 v4 バージョンがリリースされました。

私は誰で、どこにいるのか...

[[323615]]

引退することに同意したんじゃないの?

よく調べてみると、Redmon 氏は確かに今回の YOLOv4 の作者の中に含まれていないことが判明しました。

YOLOv4 の作者は Alexey Bochkovskiy であり、多くの学生はこの名前を聞いたことがあるかもしれません。

しかし、問題は、巨匠がこれほど広範囲に及ぶ影響力を持つ傑作の名前をそのまま使用することに同意するかどうかだ。

説明になるかもしれない詳細があります。

2年間非アクティブだったYOLO GitHub公式サイトが、数時間前にREADMEドキュメントを正式に更新しました。

ドキュメントの更新された内容は、主に YOLO v4 の論文とソース コードを指します。

Alexey Bochkovskiy は、YOLOv4 のコード ベースである darknet の別の github バージョンのメンテナーです。

これは、YOLOv4 が Joe Redmon によって承認されたことを意味するのでしょうか?

偉大な神はこの世から引退したが、依然として世の情勢を気にかけているようだ。

<<:  AIはアプリケーションとそれをサポートするアプリケーション/インフラストラクチャの管理方法を再定義します。

>>:  ボストン・ダイナミクスが伝染病と戦うために犬を派遣:頭にはiPad、背中にはトランシーバー、価格性能比は本当に大丈夫なのか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AI ソフトウェアは教育分野にどのように役立つのでしょうか?

[[280714]]人工知能は世界に大きな影響を与えます。 2025年までに、AIソフトウェアの総...

GitHub が機械学習コードの脆弱性スキャンを無料で提供、JavaScript / TypeScript もサポート

現在、JavaScript および TypeScript リポジトリで開発およびテストが行​​われて...

Metaがオープンソース「AIアベンジャーズアライアンス」の結成を主導、AMDと他の同盟国が800億ドルでOpenAI Nvidiaと戦う

今日、MetaとIBMが主導し、50を超えるテクノロジー企業、大学、機関が共同でAIアライアンスを設...

...

PaddlePaddleのクリック率に基づくディープラーニング手法の試み

序文チーム内でクリック率に関する記事をいくつか共有した際に、広告のクリック率の推定値を計算する一般的...

人類はついに怠惰なAIを生み出してしまった…

強化学習 (RL) の概念を説明する記事は多数ありますが、現実世界で RL を実際に設計して実装する...

ロボット工学が建設業界の新時代を告げる

建設業界は現在、デジタル革新が業界の方向性をますます推進する中で、大きな変革期を迎えています。ロボッ...

CLIP と LLM を使用したマルチモーダル RAG システムの構築

この記事では、オープンソースの Large Language Multi-Modal モデルを使用し...

顧客サービスの応答時間を短縮して潜在顧客の喪失を回避する方法

急速に変化する今日の世界では、誰も待たされることを好みません。私たちはリクエストに迅速に対応してもら...

ICML 2023 優秀論文賞発表!北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出

ICML 2023 の賞品が発表されました!今年は32件の候補論文の中から6件が優秀論文賞を受賞しま...

金融分野における機械学習の7つの主要な応用例をカウントダウン

[[269614]]ビッグデータダイジェスト制作編集者:劉兆娜機械学習は市場の新しいトレンドであり、...

RLHF にはもう人間は必要ありません! Googleチームの研究により、AIによる注釈が人間のレベルに達したことが証明される

たとえば、RLHF の「人間」が入れ替わった場合、それは実現可能でしょうか? Google チームの...

説明可能な不正防止AIについてお話しましょう

人工知能は近年急速に発展し、さまざまな業界の無数のユースケースで強力なイノベーションツールとして広く...

成功するビジネス インテリジェンス戦略を開発する方法

ビジネス インテリジェンス戦略の策定は、企業が検討する必要がある重要なステップであり、ビジネス イン...