Google トレンドを使ったことがありますか? かなり便利です。キーワードをいくつか入力すると、Google でどのようなトレンドになっているかがわかります。たまたま、arxiv-sanity 論文データベースには過去 5 年間の機械学習関連の論文が 28,303 件登録されているので、同じようなことをして、過去 5 年間の機械学習研究がどのように進歩したかを調べてみようと思いました。結果は非常に興味深いので、投稿して共有しようと思いました。 (機械学習は広大な分野です。この記事では、私が最も精通しているサブフィールドであるディープラーニングに焦点を当てます。) arxiv 特異点 まず、arxiv-sanity (cs.AI、cs.LG、cs.CV、cs.CL、cs.NE、stat.ML) に投稿された論文の総数を見てみましょう。下の図を参照してください。 はい、2017 年 3 月にはこれらの分野で約 2,000 件の論文が提出されました。急増は、会議 (NIPS/ICML など) の締め切りに関連している可能性があります。ただし、これは分野自体の論文数を反映したものではないことに注意してください。すべての人が論文を arxiv に投稿するわけではなく、一部の論文に対する研究者の分類は時間の経過とともに変化する可能性があるためです。しかし、これらの分野には多数の論文があることを指摘しておく価値はある。 論文の総数を分母として使用します。ここで、論文のこの部分に私たちが興味を持つ具体的なキーワードがどれに含まれているかを確認します。 ディープラーニングフレームワーク まずは、使用されているディープラーニング フレームワークを見てみましょう。この値を計算する際には、論文内のどこかにあるディープラーニング フレームワークの言及(書誌の書籍タイトルなどを含む)も含まれます。 2017 年 3 月にアップロードされた論文については、次の結果が得られました。
つまり、2017 年 3 月に提出された論文の 10% で TensorFlow が言及されていました。もちろん、すべての論文が使用するフレームワークを宣言しているわけではありませんが、フレームワークを宣言している論文ではフレームワークを使用する確率が比較的一定であると仮定すると、現在コミュニティの約 40% が TensorFlow を使用していることになります (TF バックエンドの Keras を含めるとさらに多くなります)。次の図は、いくつかの人気のあるフレームワークが時間の経過とともにどのように進化してきたかを示しています。 Theano はしばらく前から存在していますが、その成長はほぼ停滞していることがわかります。 Caffe は 2014 年に急速に成長しましたが、ここ数か月で TensorFlow に追い抜かれました。 Torch (および最近では PyTorch) もゆっくりではあるが着実に上昇しています。今後数か月でこれがどのように発展していくかを見るのは興味深いでしょう。私の推測では、Caffe/Theano は引き続き緩やかな衰退を続け、TF の成長は PyTorch の出現により少し鈍化するでしょう。 ConvNet モデル 楽しみのために、一般的な ConvNet モデルを見てみましょう。ここでは、ResNet の大幅な増加がはっきりとわかります。2017 年 3 月の論文の 9% に ResNet が登場しています。 また、InceptionNet 以前にインセプションについて議論していたのは誰ですか? これについても興味があります。 最適化アルゴリズム 最適化アルゴリズムに関しては、Adam が再び勝利を収めているようです。2017 年 3 月の論文の 23% に登場しています。実際の使用率は推定が難しく、最適化アルゴリズムを明記していない論文や、ニューラル ネットワークをまったく最適化していない論文も多数あるため、おそらく 23% よりも高いと考えられます。 Adam は 2014 年 12 月に出版されたばかりで、論文の著者と名前が競合している可能性があるため、約 5% になる可能性があります。 研究者 ディープラーニング分野の重要人物の言及も気になったので、以下のグラフを作ってみました(論文引用数に少し似ていますが、①論文の「0/1」カウントよりも安定しており、②全体の範囲で正規化されています。 注目すべき点がいくつかあります。提出された論文の 35% に「bengio」と記載されていますが、ここには Samy Bengio と Yoshua Bengio という 2 人の Bengio がいますが、合併しました。ジェフ・ヒントンはリストの 30% 以上に掲載されています。これは高いようですね。 ホットキーワードまたは非ホットキーワード 最後に、キーワードを手動で分類するのではなく、ホットキーワードと非ホットキーワードを調べます。 人気のキーワード これにはさまざまな定義がありますが、今回はすべての論文のすべてのユニグラム(単一の単語)またはバイグラム(二重の単語)を調べ、前年と比較した最大使用率の比率を記録しました。この比率より高い場合、昨年の潜在的可能性は高かったが、今年の相対的な頻度が高かったことを意味します。ホットキーワードのランキング結果は次のとおりです。
たとえば、ResNet の比率が 8.17 なのは、1 年前 (2016 年 3 月 - 最も使用率の高い月) には提出された論文全体の 1.044% に登場したのに対し、先月 (2017 年 3 月) は 8.53% だったためで、8.53 / 1.044 ~= 8.17 となります。 上の図から、過去 1 年間で人気を博した中核的なイノベーションは、1) ResNet、2) GAN、3) Adam、4) BatchNorm であることがわかります。 これらのモデルは研究でよく使用されます。 研究の関心分野としては、1) スタイル転送、2) 深層強化学習、3) ニューラル機械翻訳 (「nmt」)、4) 画像生成が挙げられます。 アーキテクチャの面では、Hotspot は 1) 完全畳み込みネットワーク (FCN)、2) LSTM/GRU、3) シャム ネットワーク、および 4) エンコーダー/デコーダー ネットワークを使用します。 ホットでない言葉 逆の場合はどうでしょうか? 過去 1 年間の提出数は少なかったものの、歴史的には多かった用語にはどのようなものがありますか。以下にいくつか例を挙げます。
「フラクタル」が何を指しているのかはよく分かりませんが、一般的にはベイズ非パラメトリックが攻撃を受けているように見えます。 結論は 今回提出する論文のテーマは、Adam で最適化されたスタイル転送への Fully Convolutional Encoder Decoder BatchNorm ResNet GAN の適用に関するものです。これはそれほど突飛な話ではないようです。 |
<<: Caffeでのディープラーニングトレーニングの全プロセス
ディープラーニングでは、PyTorch と NumPy はデータの処理と変換によく使用される 2 つ...
COVID-19パンデミックは、物流やスーパーマーケットなどの分野に問題と機会の両方をもたらしまし...
Google が発表した新しい研究論文では、音声検索や YouTube 動画へのテキスト説明やタグ...
映画『エイリアン:コヴェナント』では、マイケル・ファスベンダーが演じるバイオニックマンのデイビッドは...
マンデルブロ複素集合: https://en.wikipedia.org/wiki/Mandelbr...
ビッグモデルが普及して以来、ビッグモデルを圧縮したいという人々の欲求は減ることはありません。大規模モ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
100日間以上にわたる激しい競争では、国内トップクラスのテクノロジー企業40社以上が競い合い、競争...
[[208162]]大規模なニューラル ネットワークには多数のレイヤーとノードがあるため、特にオンラ...
ロイター通信は10月12日、事情に詳しい関係者の話として、人工知能企業OpenAIが来月、同社の人工...