人気のディープラーニングライブラリ23選のランキング

人気のディープラーニングライブラリ23選のランキング

[[209139]]

Data Incubator は最近、Github と Stack Overflow でのアクティビティと Google 検索結果に基づいて、人気のディープラーニング ライブラリ 23 個のランキングを作成しました。

次の表は正規化されたスコアを示しています。値 1 は平均 (平均は 0) より 1 標準偏差上であることを表します。 たとえば、Github での Caffe のアクティビティは平均より 1 標準偏差上ですが、deeplearning4j は平均に近いです。方法は最後に記載されています。

結果と考察

ランキングは、Github (スターとフォーク)、Stack Overflow (タグと質問)、Google 検索結果 (合計および四半期ごとの成長率) という、同等に重要な 3 つの要素に基づいています。これら 3 つの部分は、利用可能な API を通じて取得されます。ディープラーニング ツールキットの包括的なリストを作成するのは簡単ではないため、代表的と思われる 5 つの異なるリストを選択しました (詳細については、以下の方法論を参照してください)。各メトリックの正規化されたスコアを計算すると、各カテゴリでどのパッケージが優れているかがわかります。完全なランキングはここにあり、生データはここにあります。

TensorFlowが最も活発なコミュニティを支配

TensorFlow は、すべての計算メトリックにおいて平均より少なくとも 2 標準偏差上にあります。 2 番目に人気のあるフレームワークである Caffe と比較すると、TensorFlow には Github 上でのフォークがほぼ 3 倍、Stack Overflow 上での質問が 6 倍以上あります。 2015年にGoogle Brainチームによって初めてリリースされたTensorFlowは、Theano(4)やTorch(8)などの多くの高レベルライブラリを上回り、リストのトップに躍り出ました。 TensorFlow は C++ エンジン上で実行される Python API とともに配布されていますが、表内のいくつかのライブラリは TensorFlow をバックエンドとして使用し、独自のインターフェースを提供できます。これらのライブラリには、まもなくTensorFlowとSonnet(6)の中核部分となるKeras(2)が含まれます。 TensorFlow の人気は、その一般的なディープラーニング フレームワーク、柔軟なインターフェース、美しい計算グラフの視覚化、そして Google の重要な開発者およびコミュニティ リソースの結果であると考えられます。

CaffeはまだCaffe2に置き換えられていない

Caffe は私たちのリストで 3 位にランクされており、TensorFlow を除くどの競合他社よりも Github でのアクティビティが活発です。 Caffe は伝統的に Tensorflow よりも専門的であると考えられており、画像処理、オブジェクト認識、事前トレーニング済みの畳み込みニューラル ネットワークに重点を置いています。 Facebookは2017年4月にCaffe2(11)をリリースしており、すでにディープラーニングライブラリの上位半分にランクされています。 Caffe2 は、リカレント ニューラル ネットワークを含む、より軽量でモジュール化された拡張可能なバージョンの Caffe です。 Caffe と Caffe2 は別々のリポジトリであるため、データ サイエンティストは元の Caffe を引き続き使用できます。ただし、Caffe Translator などの移行ツールがあり、Caffe2 を使用して既存の Caffe モデルを駆動する方法が提供されます。

Kerasはディープラーニングのための最も先進的なフロントエンドライブラリです

Keras(2)は、非フレームワークライブラリの中でトップクラスです。 KerasはTensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)のフロントエンドとして使用できます。 Keras は 3 つの指標すべてにおいて平均を上回るパフォーマンスを発揮します。 Keras が人気なのは、そのシンプルさと使いやすさによるものかもしれません。 Keras を使用すると迅速なプロトタイピングが可能になりますが、フレームワークから直接実行することで得られる柔軟性と制御性が多少犠牲になります。 Keras は、データ セットに対してディープラーニング関連の実験を実行するデータ サイエンティストに好まれています。 Keras の成長と人気は、R Studio 用の Keras インターフェースの最近のリリースによって継続しています。

巨人の支援がなくても、テアノは依然としてトップにランクされている

新しいディープラーニングフレームワークが数多く存在する中、Theano(4)は当ランキングで最も古いライブラリです。 Theano は計算グラフの使用を先駆的に導入し、研究コミュニティでディープラーニングや機械学習が普及するにつれて人気が高まり続けています。 Theanoは本質的にはPython用の数値計算ライブラリですが、Lasagne(15)のような高レベルのディープラーニングライブラリと一緒に使用できます。 GoogleはTensorFlow(1)とKeras(2)をサポートし、FacebookはPyTorch(5)とCaffe2(11)をサポートし、MXNet(7)はAmazon Web Servicesの公式ディープラーニングフレームワークであり、MicrosoftはCNTK(9)を設計・保守していますが、Theanoは業界大手からの公式サポートがないにもかかわらず人気を保っています。

ソネットは最も急速に成長している図書館です

2017年初頭、GoogleのDeepMindは、TensorFlowをベースにした高レベルオブジェクト指向ライブラリであるSonnet(6)のコードを公開しました。 Sonnet の Google 検索結果では、前四半期より 272% 多くのページが返され、これはリストにあるどのライブラリよりも高い数値です。 Google は 2014 年に英国の人工知能企業 DeepMind を買収しましたが、DeepMind と Google Brain はほぼ独立したチームのままです。 DeepMind は汎用的な人工知能に重点を置いており、Sonnet はユーザーが特定の AI のアイデアや研究のためのトップレベルの設計を作成するのに役立ちます。

Pythonはディープラーニングのインターフェース言語です

PyTorch(5) は、この表の中で 2 番目に急速に成長しているライブラリであり、その唯一のインターフェースは Python です。 PyTorch の Google 検索結果は前四半期と比較して 236% 増加しました。私たちがランク付けした23のオープンソースのディープラーニングフレームワークとラッパーのうち、Pythonインターフェースを持たないのはDlib(10)、MatConvNet(20)、OpenNN(23)の3つだけです。 23 個のライブラリのうち、C++ インターフェースと R インターフェースはそれぞれ 7 個と 6 個しかありません。データ サイエンス コミュニティでは Python の使用に関してほぼ合意に達していますが、ディープラーニング ライブラリには依然として多くの選択肢があります。

制限

もちろん、一部のライブラリは単に長く存在しているため、データが多く、ランキングも高くなります。これを考慮している唯一の指標は、Google 検索の四半期ごとの成長率です。

データのプレゼンテーションで遭遇するいくつかの困難:

  • Neural DesignとWolfram Mathは独自のものであるため削除されました
  • cntkはMicrosoft Cognitive Toolkitとしても知られていますが、ここではctnkという名前だけを使用します。
  • ネオンはネルヴァーナネオンになる
  • paddle が paddlepaddle に変更されました
  • Caffe や Caffe2 など、一部のライブラリは明らかに他のライブラリの派生です。別個の/独立した Github リポジトリがある場合、これらのリポジトリは個別に処理されます。

方法

すべてのソースコードとデータは、Github ページで入手できます。

まず、5 つの異なるソースから 23 個のオープンソース ディープラーニング ライブラリのリストを生成し、次にこれらすべてのライブラリの指標を収集してランキングを作成しました。 Github のデータはスターとフォークの数に基づいており、Stack Overflow のデータにはパッケージ名を含むタグと質問が含まれており、Google の検索結果は過去 5 年間の Google 検索結果の総数に基づいており、過去 3 か月間の検索結果の四半期ごとの成長率をその前の 3 か月間と比較して計算しています。

いくつかの注意点:

  • いくつかのライブラリは一般的な語彙(caffe、chainer、lasagne)であるため、Google 検索結果の数を決定するために使用される検索用語には、ライブラリの名前と「ディープラーニング」という用語が含まれます。
  • 利用できない Stack Overflow カウントはゼロ カウントに変換されます。
  • カウントは平均 0、偏差 1 になるように正規化され、その後、Github と Stack Overflow のスコアが平均化され、Serch の結果と組み合わせて全体のスコアが算出されました。
  • Github リポジトリの場所を確認するために手動でチェックしました。

<<:  プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

>>:  オープンソースの機械学習プロジェクトのトップ 5。TensorFlow だけを考えるのはやめましょう。

ブログ    
ブログ    

推薦する

...

SKU多次元属性状態判定アルゴリズム

問題の説明この問題は、製品属性を選択するシナリオから発生します。たとえば、服や靴を購入するときは、通...

...

...

誰でも使えるディープラーニング: 3 つの主要な自動化ディープラーニング プラットフォームの紹介

ディープラーニング技術は複雑で、ゼロから開発するのが難しい場合が多いですが、Microsoft の ...

メーター読み取りシステムにおける無線データ伝送モジュールの応用

周知のとおり、従来の手動メーター読み取り方法は時間がかかり、労働集約的であり、その正確性と適時性は保...

ソフトウェアテストが再び進化、Testinクラウドテストリモート実機サービスには明らかな利点がある

モバイルインターネット時代の始まり以来、スマートフォンへのソフトウェアの適応は常にソフトウェア業界の...

機械学習とは何ですか?

機械学習は人工知能 (AI) のサブセットです。これは、コンピューターを明示的にプログラミングするの...

人工知能は伝染病の予防と制御に役立ちます。正確にスクリーニングし、伝染病を推測し、ウイルスの発生源を追跡することができます。

感染予防・抑制の過程では、高リスクグループとスーパースプレッダーを迅速に特定し、感染の進行状況を正確...

0パラメータ+0トレーニング、3D点群解析手法Point-NNは複数のSOTAを更新します

論文リンク: https://arxiv.org/pdf/2303.08134.pdfコードアドレス...

2つの主要な負荷分散アルゴリズムの原理に関する研究

負荷分散デバイスの製造は負荷分散アルゴリズムに基づいているため、ここでその原理を調べてみましょう。ポ...

...

1日当たりの予算が508万だと、OpenAIは2024年までしか存続できないのでしょうか?

執筆者:Qianshan最近、海外メディアAnalytics India Magazineによると、...

...