データサイエンスと機械学習のためのツールと言語の最新情報

データサイエンスと機械学習のためのツールと言語の最新情報

[[198310]]

第 18 回 KDnuggets ソフトウェア アンケートには、今年もアナリティクス、データ サイエンス コミュニティ、ソフトウェア プロデューサーからの熱心な参加がありました。投票には昨年同様、約2,900人が参加した。近年、Python の使用率の伸び率は R を上回っています。今年、Python はついに R の使用率をわずかに上回りました (52.6% 対 52.1%)。しかし、最も驚いたのは、ディープラーニングツールが広く共有され、使用されていることでした。ディープラーニングの使用率は、2016 年にはわずか 18%、2015 年には 9% であったのに対し、2017 年には 32% にまで上昇しました。 Google Tensorflow は急速にディープラーニング プラットフォームのリーダーとなり、20.2% の使用率でトップに立っています。昨年の使用率はわずか6.8%でしたが、今年は使用ツールのトップ10に入りました。 2014 年には、分析、データ マイニング、データ サイエンスの主なツールは R、Python、SQL、SAS の 4 つでしたが、2017 年には Python、R、SQL、Saprk、Tensorflow の 5 つになりました。 RapidMiner は、データ マイニング/データ サイエンス向けの最も人気のある汎用プラットフォームであり、そのシェアは約 33% で、2016 年とほぼ同じです。

多くのソフトウェア ベンダーがユーザーに投票を奨励していますが、すべてのソフトウェア ベンダーに平等に投票する機会があるため、これは KDnuggets のガイドラインに違反するものではありません。機械が自動的に投票したり、1 つのツールだけに投票したりするケースは見られませんでした。

Spark は約 23% まで成長し、Hadoop エコシステムでトップ 10 の地位を維持しました。

TensorFlowに加えて、もう1つの新しいツールであるAnacondaも使用率22%でトップに登場しました。

分析、データサイエンス、機械学習で使用されるトップツール

表1: 2015年から2017年までの分析/データサイエンス分野におけるKDnuggetsの世論調査結果の比較

上記のグラフは、各ユーティリティが 500 票以上を獲得した上位 11 件の結果を示しています。上記の表では、「2017%使用率」は今年ツールを使用した投票者の割合、「2017年と2016年の%変化」は2016年の使用状況の比較で、5%を超える変化は緑と赤で強調表示され、「%のみ」は現在のツールのみを使用する投票者の割合です。投票者1人あたりに使用されたツールの平均数は6.1で、2016年の6.0とほぼ変わっていない。 2016 年の KDnuggets Analytics/Data Science 投票結果と比較すると、上位 11 位に新たに加わったツールは Anaconda と Tensorflow です。

各地域の参加率は以下の通りです。

• アメリカ/カナダ (41.5%)

• ヨーロッパ (35.5%)

• アジア(10.1%)

• ラテンアメリカ(6.5%)

• アフリカ/中東 (3.8%)

• オーストラリア/ニュージーランド (2.7%)

調査で2%以上の使用率を誇るトレンドの新ツールは次のとおりです: • Keras (9.5%) • PyCharm (9%)

• マイクロソフト R (4.3%)

• IBM DSX (3.0%)

• パイトーチ(3.0%)

• テラデータ(2.4%)

次の表には、2017 年に使用率が 20% 以上増加し、使用率が 2% 以上であったツールがリストされています。これには、5 つのディープ ラーニング ツールと 4 つの Microsoft ツールが含まれます。

表2: 利用が最も急速に増加した分析/データサイエンスツール

DataRobot の使用率は 2% 未満ですが、2016 年の 0.5% から 2017 年には 1.9% に増加しました。 2016 年に少なくとも 2% の使用率があったツールのうち、22 個のツールは使用率が増加し、27 個のツールは使用率が減少していることがわかります。これは、データ サイエンス プラットフォーム市場がまだ統合されていないことを示しています。次の表は、2016 年に少なくとも 2% の使用率があったが、2017 年には少なくとも 20% の使用率が減少したツールを示しています。 Turi と Salford は最近買収され、Perl と Octave は Python と R に負け、RapidInsight はユーザーに投票を促すことはなかったと思われます。QlikView は Tableau に負けたと思われます。C4.5 は時代遅れの技術とみなすことができます。興味深いことに、Hadoop エコシステム向けのオープンソース ツールの中で、MLlib やその他の無料のオープンソース分析/データ マイニング ツールの使用も減少しています。

表3: 利用が最も急速に減少している分析/データサイエンスツール

ディープラーニング ツール ディープラーニング ツールの使用は、2016 年の 18%、2015 年の 9% から今年は 32% に急増しました。 Google Tensorflow は、昨年のリーダーである Theano/Pylearn2 に取って代わり、主要なプラットフォームとなっています。上位のツールは次のとおりです。

• Tensorflow、使用率20.2%

• ケラス、9.5%

• テアノ、5.8%

その他のディープラーニングツール、4.8%

• マイクロソフト CNTK、3.4%

• カフェ、3.1%

• PyTorch、3.0%

• DL4J 2.2%

• MxNet、1.8%

• トーチ、1.2%

• ラザニア、0.9%

Hadoop/ビッグデータ ツール Hadoop システムにおける Hadoop/Spark ツールの分類を簡素化しました。 Hadoop、SQL、Spark の商用/オープンソース ツールの使用率は 33% を占めています。これは 2016 年の 39% よりわずかに低いですが、2016 年には多くのツールがビッグデータ ツールに分類されていました。 2015 年、Spark/Hadoop ツールの使用率は 29% でした。 2017年に使用されたビッグデータツールは次のとおりです。Spark、22.7%

• Hadoopオープンソースツール、15.0%

Hadoop SQL、10.3%

• Hadoop商用ツール 7.6%

Python、Java、Unix、Scala の人気が高まっている一方で、C/C++、Perl、Julia、F#、Clojure、Lisp の人気は低下しています。投票による主なプログラミング言語の順位は次のとおりです。Python、使用率52.6%(2016年の45.8%から増加)

• R、52.1%(2016年は49.0%)、6%増加

• SQL、34.9% (35.5%)、2%減

• ジャワ、13.8% (16.8%)、18%減

• Unix Shell/AWK/GAWK、9.6% (10.4%)、7%減

• C/C++、6.3%、(7.3%)、13%減

• パール、1.7%、(2.3%)、27%下落

• ジュリア、1.1% (1.1%)、変化なし

Python は競合の Julia から学び続け、成長を続けていますが、Julia の使用は驚くべきことに変わっていません。

<<:  自然言語処理にディープラーニングを使用するにはどうすればよいでしょうか?練習チェックリストはこちら

>>:  天馬株式:企業に力を与え、ビジネスをシンプルにする

ブログ    

推薦する

知っておくべき6種類のニューラルネットワーク

[51CTO.com クイック翻訳]ニューラルネットワークは人工知能の分野で非常に人気が高まっていま...

Shopee多言語商品知識グラフ技術構築方法と応用

Shopee は世界中の複数の市場にサービスを提供する電子商取引プラットフォームであり、消費者に、よ...

最高の AI 学習アプリ トップ 10

人工知能の革新により、ツールの使用方法は変化しています。 AI 学習アプリケーションは、適応型学習、...

...

今後 20 年以内に、完全自動運転のコネクテッドカーが登場するでしょうか?

20 年後の旅行と交通の未来はどうなるでしょうか? おそらく、この質問への答えははるかに複雑です。...

機械学習がインドのヘルスケア分野に変化をもたらす

ヘルスケア産業はインド経済において最大のセクターの一つとなっている。 NITIAyogの報告によると...

...

人工知能チュートリアル (V): Anaconda とさらなる確率理論

このシリーズの前回の記事では、まず TensorFlow の使い方を紹介しました。これは、人工知能お...

アニメーション + 原理 + コード、トップ 10 の古典的なソート アルゴリズムを解釈する

ソートアルゴリズムは、「データ構造とアルゴリズム」における最も基本的なアルゴリズムの 1 つです。ソ...

3D AI が新しい遊び方を生み出します。何時間もかかる代わりに、1 枚の写真からわずか 45 秒で 3D モデルを生成できます。

3D AI生成は近年急速に発展しており、最新の作品の多くは文章・画像から高品質な3Dモデルを生成で...

AIIAがAIチップベンチマークの第一ラウンドの結果を発表

3月6日、国際電気通信連合と中国情報通信研究院が共催し、人工知能産業発展連盟(AIIA)とZTEが主...

...

アルゴリズムだけでは不十分:AIの次のブレークスルーにはハードウェアの再検討が必要

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

人類は人工知能のせいで滅びるのか?ホーキング博士の最後の論文にヒントがあるかもしれない

[[251536]] 「完全な人工知能の開発は人類の終焉を意味するかもしれない...人工知能は自ら進...

女神があなたを好きかどうか知りたいなら、AI マシンであなたの顔をスキャンするだけです。

[[281019]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...