翻訳 | 江凡百理子杰樹 校正 | ロリン 最新の KDnuggets 調査では、データ サイエンティストの実際の業務で最もよく使用されるアルゴリズムが集計されており、ほとんどの学術界と産業界において驚くべき発見がありました。 KDnuggets の Gregory Piatetsky 氏によると、最新の調査質問は次のとおりです。過去 12 か月間に、実際のデータ サイエンス関連のアプリケーションでどのモデル/アルゴリズムを使用しましたか? したがって、844 枚の解答用紙に基づく結果は次のとおりです。 上位10のアルゴリズムとその投票者の割合 図1: データサイエンティストが最もよく使用するアルゴリズムのトップ10。すべてのアルゴリズムについては、記事の最後にある表を参照してください。 回答者は平均 8.1 個のアルゴリズムを使用しており、これは 2011 年の同様の調査と比較すると大幅に増加しています。 2011 年のデータ分析アルゴリズムの調査と比較すると、最も一般的に使用されている方法は依然として回帰、クラスタリング、決定木/ルール、視覚化であることがわかりました。最大の増加率は(増加 = %2016/%2011 -1)です。
2016年最も人気のある新人は
最も大きな下落は
次の表は、さまざまなアルゴリズム タイプ (教師ありアルゴリズム、教師なしアルゴリズム、メタアルゴリズム、その他のアルゴリズム) が使用される場所を示しています。応募種別不明(NA、4.5%)またはその他の職業種別(3%)は含まれていません。 表1: 職業種別アルゴリズムの使用状況 ほぼ全員が教師あり学習アルゴリズムを使用していることに気付きました。政府や産業界のデータ サイエンティストは、学生や科学者よりも多様なアルゴリズムを使用します。産業データサイエンティストはメタアルゴリズムの使用を好みます。 さまざまな職業で最もよく使われるアルゴリズム + ディープラーニングのトップ 10 次に、さまざまな職業で最もよく使用されるアルゴリズム+ディープラーニングのトップ10を分析しました。 表2: 職業別のトップ10アルゴリズム+ディープラーニング これらの違いをより明確に示すために、異なる職業タイプのアルゴリズム使用バイアスを計算する式を使用します。 バイアス = 特定の職業タイプのアルゴリズム使用率 / すべての職業タイプのアルゴリズム使用率 - 1 図2: さまざまな会場でのアルゴリズム使用の偏り 産業データ サイエンティストは、回帰、視覚化、統計、ランダム フォレスト、時系列を使用する傾向があることに気付きました。政府機関や非営利団体では、視覚化、主成分分析、時系列を使用する可能性が高くなります。学術界の研究者は主成分分析とディープラーニングをより多く利用しています。学生は一般的にアルゴリズムをあまり使用しませんが、主にテキストマイニングとディープラーニングを使用します。 次に、KDnuggets ユーザー全体を表す特定の地域でのエンゲージメントを見てみましょう。 調査員の地域分布:
2011 年の調査では、業界と政府からの回答者を 1 つのグループにまとめ、学術研究者と学生を 1 つのグループにまとめ、業界と政府グループのアルゴリズムの使用知識を計算しました。 (産官グループのアルゴリズム利用率 / 学術学生グループのアルゴリズム利用率) / (産官グループの人数 / 学術学生グループの人数) - 1 したがって、親和性が 0 のアルゴリズムは、業界/政府グループと学術学生グループによって同等に使用されていることを示します。 IG 親密度が高くなるほど、アルゴリズムは業界に偏り、結果が小さくなるほど、アルゴリズムは学術に偏ります。 最も「工業的なアルゴリズム」は次のとおりです。
アップリフト モデリングは今回も最も好まれる「業界アルゴリズム」ですが、驚くほど使用頻度が低く、調査全体で最も低い 3.1% にとどまっています。 最も「学術的なアルゴリズム」は次のとおりです。
下の図は、すべてのアルゴリズムとその業界/学術的親和性を示しています。 図 3: KDnuggets 調査: データ サイエンティストが最もよく使用するアルゴリズム: 業界と学術界の比較 次の表には、2016 年の回答者の使用率、2011 年の使用率、変化 (2016 年の割合 / 2011 年の割合 - 1)、および前述の業界の精通度など、アルゴリズム調査のすべての結果が詳細に記載されています。 表3: KDnuggets 2016 調査: データ サイエンティストが使用するアルゴリズム 以下の表は、すべてのアルゴリズムの調査結果の詳細を示しています。各列は次の内容を表しています。
表4: KDnuggets 2016 調査: データサイエンティストが使用するアルゴリズム 出典: http://www.kdnuggets.com/2016/09/poll-algorithms-used-data-scientists.html [この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です] |
<<: ディープラーニングの深層: モデリング知識とオープンソースツールのオプション
>>: 最適化されたアルゴリズムによる高度なデータ分析に視覚化を活用する 5 つのステップ
[[333019]]この記事は、劉燕氏が執筆したWeChatパブリックアカウント「AI Front...
1物語はAI熱狂の3つの波から始まる2017年、誰もが人工知能について語っていました。しかし、2度...
1. はじめにニューラル ネットワークは、画像、テキスト、時系列などのさまざまなデータの処理において...
中国共産党中央委員会と国務院がこのほど発表した「知的財産強国建設要綱(2021~2035年)」では、...
言語は機械と人間をつなぐ重要な経路であり、機械が現実世界を深く理解するためには知識が必要です。 8月...
AlphaGoとイ・セドルの戦いの後、ディープラーニング技術は国内で非常に人気が高まった。多くの技術...
[51CTO.com クイック翻訳] 強化学習は自律的な意思決定を実現するのに非常に適しています。対...
従来の産業および製造現場では、作業者の安全の監視、オペレーターの効率性の向上、品質検査の改善はすべて...
ベルギーの通信会社は、10代の若者向けに「.comdom」というセキュリティアプリをリリースした。こ...
最近、NVIDIA GPU 製品や SDK を使用してディープラーニングを学習している学生に多く出会...
全米経済研究所が実施した最近の調査によると、ChatGPT のような AIGC を導入すると、従業員...