ディープラーニングは、機械学習の分野で最も注目されているテクノロジーです。ディープラーニング フレームワークは急速に変化しています。わずか 5 年前は、Theano が唯一の目立ったフレームワークでしたが、最近ではさまざまな機能を備えたさまざまなフレームワークが登場しています。この記事では、2018 年にどのフレームワークがより人気があるのか評価するために、LinkedIn の求人要件、Google 検索の人気、Medium の記事、arXiv の論文、GitHub のアクティビティの観点からさまざまなフレームワークを調査します。 注目に値するフレームワークを見つけたかったので、このリストを作成しました。 Pythonはディープラーニングでよく使われる言語なので、私は主にPythonと互換性のあるフレームワークに焦点を当てています。私は 7 つの異なるカテゴリから 11 のデータ ソースを使用し、それらを使用してフレームワークの使用状況、ユーザーの関心、人気を評価しました。 データアドレス: https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018 2018.09 ジェフ・ヘイル 明らかに TensorFlow が勝者ですが、驚くべき発見もいくつかあります。一緒に見てみましょう〜 候補者 私たちが検討したフレームワークはすべてオープンソースであり、主に Python を使用していますが、一部は R や他の言語と互換性があります。 TensorFlow が明らかに勝者です。 GitHub アクティビティ、Google 検索、Medium の記事、Amazon 書籍、arXiv 論文などのデータ ソースの最大のシェアを占めています。また、開発者ユーザー数も最も多く、オンライン求人情報に最も多く登場します。 Keras には「機械ではなく人間向けに設計された API」があります。ほぼすべての評価において 2 番目に人気のあるフレームワークです。 Keras のバックエンドは、TensorFlow、Theano、または NLTK をベースにすることができます。ディープラーニングを初めて学ぶ場合は、Keras を使用するのがよいでしょう。 PyTorch は 3 番目に人気のあるフレームワークであり、2 番目に人気のあるスタンドアロン フレームワークです。 TensorFlow よりも後に登場しましたが、急速に発展しました。 PyTorch ではカスタマイズが可能ですが、TensorFlow ではカスタマイズはできません。 PyTorch は Facebook によって開発およびサポートされています。 Theano は 2007 年にモントリオール大学によって開発された、最も古い Python ディープラーニング フレームワークです。現在、その人気は大幅に低下しており、開発者とメンテナーは Theano の更新とメンテナンスを停止すると発表しました。それでも、Theano は求人情報に頻繁に登場します。 MXNet は Apache によってインキュベートされています。スコア的には Theano に非常に近く、現在 4 番目に人気のあるディープラーニング ライブラリです。寄稿者、検索結果、関連書籍、学術論文の膨大なコレクションがあります。しかし、昨年に比べると利用率は低下しており、検索するユーザーもそれほど多くありません。 CNTK は、Microsoft がリリースした認知ツールキットです。 GoogleやFacebookに対抗するために立ち上げられたが、あまり利用されていない。 FastAI は PyTorch 上に構築されています。その API は Keras に触発されており、必要なコードがさらに少なくなります。 FastAI は、今年 10 月の 1.0 リリースに向けて書き直し中です。FastAI の立役者である Jeremy Howard 氏は、かつて Kaggle チャンピオンであり、Kaggle 会長でもありました。 なぜ FastAI がこのリストに載っているのかと疑問に思う人もいるかもしれません。プロの開発者の間では FastAI に対する需要があまりなく、広く使用されていないからです。しかし、無料のオンラインコースプラットフォームであるfast.aiを通じて、多くのユーザーを獲得しました。同時に、FastAI は強力で使いやすく、その使用は急速に拡大する可能性があります。 Caffe は以前に Caffe2 に更新され、2018 年 3 月に PyTorch に統合されたため、このリストには含まれていません。 評価基準 ディープラーニング フレームワークの人気度を総合的に評価するために、次のカテゴリと観点を選択してスコアを付けました。
この評価を裏付けるデータは今年 9 月 16 日に収集されました。元のデータのアドレスは次のとおりです。 https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit?usp=sharing 私は plotly データ視覚化ライブラリと Python の Pandas ライブラリを使用して、各フレームワークの人気度を調査して表示しました。インタラクティブな plotly チャートについては、Kaggle カーネルを参照してください。 https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018 オンライン求人情報 現在の職場におけるディープラーニング フレームワークの需要はどの程度でしょうか? LinkedIn の求人情報、具体的には Simply Hired、Monster、Angel List を検索しました。 TensorFlow は他のフレームワークよりも求人情報にかなり多く登場するため、ディープラーニング分野で働きたい場合は、TensorFlow を学ぶのが最善でしょう。 求人情報を検索する方法は「機械学習」+「フレームワーク名」を使用するので、TensorFlow は「機械学習 TensorFlow」で検索されます。実際に他の検索方法も使用しましたが、この方法の方がより良い結果が得られました。さらに、当初この分析に Caffe ライブラリも含めようとしたため、異なるフレームワークを区別するために追加のキーワードが必要になります。 使用法 人気のデータ サイエンス ウェブサイトである KDnuggets は、世界中のデータ サイエンティストを対象にソフトウェア ライブラリの使用状況について調査を行いました。調査では、ユーザーに次のような質問をしました。
フレームワークの優先レベルは次のとおりです。 Keras は、TensorFlow とほぼ同じくらい広く使用されています。そのため、アメリカの上司は従業員の TensorFlow スキルを圧倒的に求めており、Keras も国際的に非常に頻繁に使用されています。 他のカテゴリに国際データを含めるのは面倒なので、このカテゴリにのみ国際データが含まれます。 KDnuggets はこのレポートを数年にわたって作成しており、この分析では今年のデータのみを使用しましたが、Theano、MXNET、CNTK の使用量は昨年に比べて減少していることに注意する必要があります。 Google検索の人気 最大手の検索エンジンで各フレームワークの検索人気度を測定することも、人気度を測る非常に良い方法です。 Google トレンドで過去数年間の検索人気度の推移を調べました。具体的な検索値は提供されていませんが、相対的なグラフは提供できます。 2018 年 9 月 15 日現在、TensorFlow は安定して検索の 78% を占めています。 PyTorch は Keras に近いですが、他のフレームワークの検索ボリュームは 3 前後か 3 未満です。 歴史的な背景をもう少し詳しく知るために、検索ボリュームが時間の経過とともにどのように変化したかを簡単に見てみましょう。以下の表は、過去 2 年間の Google 検索を示しています。 TensorFlow は青、Keras は赤、PyTorch は黄色、Theano は緑です。 TensorFlow、Keras、PyTorch の検索は 2016 年後半から 2017 年にかけて急増しました。興味深いことに、ここ数か月はゆっくりと成長しています。夏休みが減り、冬休みが増加するなど、季節性も見られます。 Google 検索トレンドでは、同時に比較できる項目は 5 つだけなので、他のライブラリは別の表で比較されます。これらの結果はすべて米国でのものです。検索キーワード「Theano」と「Keras」には他の意味もありますが、それらの意味は主に米国外で使用されています。 中程度の記事 複数の出版形態を計算してみましたが、先に登場したフレームワークほど出版数が有利です。今後のランキングでは出版数の推移に注目します。以下の Medium の記事を見てみましょう。 今回、新たなチャンピオンが登場しました。 Medium の記事の言及数から判断すると、Keras は TensorFlow を上回っていますが、互角でもあります。 FastAI は、これまでの取り組みよりも優れたパフォーマンスを発揮します。上記の結果になった理由は、Keras と FastAI が初心者にとってより使いやすいためだと思います。ディープラーニングを初めて学ぶ人々の間では大きな関心が寄せられており、Medium はチュートリアル フォーラムとなっています。 次に、Amazon で物理的な本をより多く扱っているフレームワークを見てみましょう。 アマゾンブックス Amazon Books->Computer Science で各ディープラーニング フレームワークを検索したところ、次の結果が見つかりました。 TensorFlow が再び優勝しました。 MXNET には、Theano よりも予想以上に多くの書籍があります。 PyTorch に関する書籍は比較的少ないですが、これはフレームワークがまだ新しいためだと考えられます。この評価基準は、本の出版に時間がかかることから、古い図書館に有利です。 学術論文では Theano の方が良いかもしれません。 arXiv論文 arXiv は、ほとんどの機械学習の学術論文が公開されているオンライン データベースです。このサイトの各フレームワークを検索した結果は次のとおりです。 同様に、TensorFlow に関する学術論文も数多くあります。最も驚くべきことは、他のフレームワークに関する学術論文の総数が TensorFlow よりも少ないことです。 Keras は学術論文よりも Medium や Amazon で人気があることに注意してください。 PyTorch もこの分野ではあまり良いパフォーマンスを発揮しません。おそらく、登場してからまだ間もないからでしょう。 GitHub アクティビティ GitHub のアクティビティはフレームワークの人気を示すもう 1 つの指標です。スター、フォーク、ウォッチャー、貢献者の数を個別に調べたのは、合計数よりもそれぞれが個別に見た方が意味があるからです。 明らかに、TensorFlow は GitHub 上で最も人気のあるフレームワークであり、多数のアクティブ ユーザーを抱えています。 FastAI は、まだ 1 年しか経っていないのに、なかなか優れています。興味深いのは、各フレームワークの貢献者の数が他の 3 つの指標よりもはるかに近いことです。 このデータを収集して分析した後は、要約します。 リーダーボードスコアを計算する手順 リーダーボードのスコアを作成するには、次の手順を使用しました。
上記のように、オンラインの求人情報と KDnuggets の使用状況調査がスコアの半分を占め、Web 検索、出版物、GitHub の注目が残りの半分を占めています。この分割は、さまざまなカテゴリにとって最も適切なバランスになるはずです。 Google シート アドレス: https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit#gid=0 下の図は、サブカテゴリを加重加算した後のスコアを示しています。 Jupyter Notebook アドレス: https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018 下の図は、最終的なリーダーボードのスコアを再度示しています。 2018.09 ジェフ・ヘイル 100 は最高得点であり、各カテゴリーの 1 位を表します。 TensorFlow のスコアは 100 近くになりましたが、このフレームワークがほぼすべてのカテゴリで 1 位を獲得したので、これは驚くことではありません。画像に表示されていない情報を取得するには、次のリンクをクリックしてください。 https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018 将来に向けて 現在、TensorFlow がリーダーであり、この状況は短期的には変化しないようです。しかし、ディープラーニングの世界の進歩のスピードを考えると、TensorFlow が追いつくことは不可能ではありません。 React が Angular を超えたのと同じように、PyTorch が TensorFlow を超えるかどうかは時が経てばわかるでしょう。 PyTorch と React はどちらも Facebook がサポートする柔軟なフレームワークであり、一般的に Google の同等のフレームワークよりも使いやすいと考えられています。 FastAI はコースを超えてユーザーを引き付けることができますか? 学生ベースが大きく、API は Keras よりも使いやすいです。 学習者のためのヒント これらのフレームワークのいずれかを学習することを検討していて、Python、numpy、pandas、sklearn、matplotlib のスキルがある場合は、Keras から始めることをお勧めします。このフレームワークはユーザー数が多く、仕事探しにとても便利です。Mediumにも関連記事がたくさんあり、APIも使いやすいです。 すでに Keras を学習している場合、次に学習するフレームワークを選択するのは少し難しいかもしれません。 TensorFlow または PyTorch を学習し、優れたディープラーニング モデルを作成できるように十分に学習することをお勧めします。 TensorFlow は明らかにニーズに合わせて学習するフレームワークですが、PyTorch の使いやすさと柔軟性により、よりユーザーフレンドリーになっています。 これらのフレームワークを習得したら、FastAI に注目することをお勧めします。基本的なディープラーニング スキルと高度なディープラーニング スキルの両方を習得したい場合は、FastAI の無料オンライン コースをご覧ください。FastAI 1.0 は、ユーザーが最新のディープラーニング戦略を簡単に実装し、迅速に反復できるように支援することを約束します。 どのフレームワークを選択する場合でも、どのフレームワークが最も需要があり、最も使用され、最も話題になっているかについて、深く理解していただけたと思います。 オリジナルリンク: https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a [この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です] この著者の他の記事を読むにはここをクリックしてください |
<<: 超まとめ! 200以上の便利な機械学習、NLP、Pythonチュートリアル
>>: 自動運転のテストが加速:北京と上海が重要なニュースを発表
[51CTO.com からのオリジナル記事] 自然言語処理は、人工知能の開発において常に克服しなけ...
[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミット...
この時代において、AIは科学技術の将来の発展の重要な支点となり、AIチップは産業の発展を牽引する新た...
この記事はWeChatの公開アカウント「Android Development and Progra...
ChatGPTを開発するOpenAIは金曜日、CEO兼創設者のサム・アルトマン氏を解雇したが、彼の突...
[[216302]] Leifeng.com(公式アカウント:Leifeng.com)AI Fina...
[[418617]]人工知能と人間の知能は互いに対立するものではなく、本質的に共生関係にあります。企...
月収8万元の美しいネットセレブは、わずか数か月でインスタグラムのフォロワーが15万人を超えた。有名人...
[[386714]]北東部に拠点を置くエネルギー会社 Eversource で財務計画および分析 (...
回答者の半数だけが、自社のデータセキュリティ戦略が AI の発展に追いついていると答えました。さらに...