機械学習研究動向の分析: TensorFlow が Caffe を上回り、最も一般的に使用される研究フレームワークに

機械学習研究動向の分析: TensorFlow が Caffe を上回り、最も一般的に使用される研究フレームワークに

冗談ですが、論文提出のトピックは、Adam で最適化された、完全な畳み込みエンコーダー/デコーダー BatchNorm ResNet GAN をスタイル転送に適用することについてになるでしょうか?

Google トレンドを使ったことがありますか? キーワードを入力すると、その用語の Google 検索が時間の経過とともにどのように変化するかを確認できる、とても便利な機能です。 arxiv-sanity データベースには過去 5 年間の機械学習論文がちょうど 28,303 件あるので、同様の作業を行って、機械学習研究が過去 5 年間でどのように進化してきたかを調べてみようと思いました。結果は非常に興味深いものだったので、ここに投稿しました。

arXiv シンギュラリティ

まず、arxiv-sanity カテゴリ (cs.AI、cs.LG、cs.CV、cs.CL、cs.NE、stat.ML) に投稿された論文の総数を見てみましょう。時間が経つにつれて、次のような結果が得られます。

はい、2017 年 3 月には、この分野で約 2,000 件の論文が提出されました。この急増は、会議の締め切り (NIPS/ICML など) が原因である可能性があります。ただし、これは分野自体の規模を直接示すものではないことに注意してください。すべての人が arXiv に論文を投稿するわけではなく、研究者が行う研究のカテゴリは時間の経過とともに変化する可能性があるためです。しかし、一つはっきりしているのは、人工知能の分野では膨大な数の論文が発見され、閲覧され、読まれているということです。

論文の総数を分母として、正確なキーワードを含む論文の割合を見てみましょう。

ディープラーニングフレームワーク

ウォーミングアップとして、まずはディープラーニングのフレームワークを見てみましょう。このキーワードを計算するために、本文全体のどこか(参考文献などを含むどこでも)でフレームワーク名に言及した論文とその割合を記録しました。 2017 年 3 月に提出された論文では、次のような結果が得られました。

つまり、2017 年 3 月に提出された論文の 10% で TensorFlow が言及されていました。もちろん、すべての論文でフレームワークの使用が発表されているわけではありませんが、フレームワークについて言及している人はそれを使用する可能性が高いと仮定すると、コミュニティの 40% が TensorFlow を使用しているように見えます (TF バックエンドを備えた Keras を含めるとさらに多くなります)。以下は、フレームワークの経時的な変化を示すグラフです。

Theano は長い間存在していますが、その成長は停滞していることがわかります。 Caffe は 2014 年に劇的な成長を遂げましたが、ここ数か月で TensorFlow に追い抜かれました。 Torch (および最近では PyTorch) も、ゆっくりではあるが着実に成長を続けています。今後数か月は注目に値します。私の推測では、Caffe/Theano は引き続きゆっくりと衰退し、TensorFlow は PyTorch の出現によりさらにゆっくりと成長していくでしょう。

ConvNet モデル

次に、一般的な ConvNet モデルを見てみましょう。下の図では、3 月にすべての論文の 9% が ResNet に言及するまで、ResNet の成長が明確にわかります。

また、InceptionNet 以前に「インセプション」について議論していたのは誰でしょうか? これについても興味があります。

最適化アルゴリズム

最適化アルゴリズムに関しては、Adam が人気を集めているようで、すべての論文の 23% が Adam に言及しています。実際の使用率を推定することは困難ですが、一部の論文では使用された最適化アルゴリズムが公開されておらず、また論文群ではニューラル ネットワークがまったく最適化されていない可能性があるため、23% よりも高い可能性があります。そうすると、5% 低くなる可能性があります。これは、Adam がバックグラウンドで「隠れている」ことを意味し、Adam 最適化アルゴリズムは 2014 年 12 月までリリースされていなかったため、作成者の名前と競合する可能性があります。

研究者

ディープラーニングにおける重要な数値の比率についても興味があったので、グラフを作成しました。これは引用数に多少似ていますが、論文の数が 0 または 1 の場合よりも堅牢であり、すべての論文にわたって正規化されます。

提出された論文の 35% に「bengio」という名前が挙げられていますが、研究者の中には Samy と Yoshua という 2 人の Bengio がおり、この図では 2 人が一緒になっていることに注意してください。言及する価値のある点の 1 つは、Geoff Hinton がすべての新しい論文の 30% 以上で言及されていることです。これはかなり多いように思えます。

ホットワードまたは非キーワード

最後に、手動で検索したキーワード カテゴリに加えて、ホットなキーワードとそうでないキーワードをいくつか見てみましょう。

注目ワード

これを定義する方法は多数ありますが、この実験では、論文内のすべてのモノグラフまたはバイグラムを調べ、昨年の最大使用量と比較した比率を記録しました。この基準を超える論文は、1 年前には可能性があったが、今年は関連性の頻度が非常に高い論文です。リストは次のとおりです。

たとえば、ResNet の比率は 8.17 です。なぜなら、1 年前 (2016 年 3 月) は、提出されたすべての論文の 1.044% にこの用語が含まれていましたが、今年 3 月には 8.53% に含まれていたため、8.53 を 1.044 で割ると、およそ 8.17 に等しくなります。結果として、過去 1 年間のコアイノベーション領域はすべて、1) ResNet、2) GAN、3) Adam、4) BatchNorm です。これらのモデルを研究でもっと頻繁に使用してください。研究の関心分野としては、1) スタイル転送、2)​​ 深層強化学習、3) ニューラル機械翻訳、4) 画像生成が挙げられます。アーキテクチャの面では、1) 完全畳み込みネットワーク (FCN)、2) LSTM/GRU、3) シャムネットワーク、4) エンコーダー/デコーダーネットワークが人気です。

トップは暑くない

反対にはどうでしょうか? 過去 1 年間で投稿数が減ったものの、歴史的には割合が高かった単語は何でしょうか? いくつか例を挙げます。

「フラクタル」が何を指しているのかはよく分かりませんが、もっと一般的には、攻撃されているのはおそらくベイジアン・ノンパラメトリックスでしょう。

結論は

現在提出されている論文のトピックは、Adam で最適化された Fully Convolutional Encoder Decoder BatchNorm ResNet GAN をスタイル転送に適用することを中心に展開されるはずです。それほど信頼できないようには思えません。

<<:  機械学習の発展の歴史と啓蒙

>>:  自然言語処理におけるディープラーニングの応用

ブログ    
ブログ    

推薦する

機械学習は、インダストリー4.0の不安定性、不確実性、複雑性、曖昧性に対処する

序文科学技術の急速な発展により、インダストリアル4.0時代は終焉を迎えつつありますが、実際の発展には...

GAN はたった 1 枚の画像でトレーニングできます。 Adobe が画像生成方法を改善 | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

特許出願は世界中に広がっています!中国の新興人工知能についてあなたが知らないこと

待望の2020年世界インターネット会議が先日、烏鎮で開催されました。中国サイバースペースアカデミーが...

ケータリングロボットが市場発展の時代を先導

[[387119]]近年、ロボット産業の急速な発展に伴い、伝統的な飲食業界も徐々に第二の春を迎えてい...

ChatGPT は月間アクティブユーザー数が 15 億人に達し、他社を大きくリードしています。 50社が6か月間競争し、そのうち80%が自社で立ち上げた企業だった

生成 AI が人気を集め始めてほぼ 1 年が経ちましたが、そろそろ年次総括の時期が来ています。最近、...

...

世界初の翻訳エンジンが進化して復活、「細部にこだわり」方言もマスター

最近、オンライン機械翻訳ソフトウェアが日本で非常に人気になっています。この翻訳ソフトはDeepLと呼...

建設現場での死傷者を減らすには? 10のAI手法をご紹介します

この記事の結論から始めましょう。AI と機械学習は、ビデオ信号を 24 時間 365 日リアルタイム...

...

米メディア:人工知能の発展には5つの大きなトレンドが予想される

3月15日、アメリカの隔週刊ウェブサイト「フォーブス」は「2021年の人工知能:期待できる(または期...

AIが医療診断を改善する方法

人工知能システムは刻々と賢くなっています。運転や自然言語の理解などの複雑なタスクはすでに AI で実...

...