「データが王様」と言われる今日の世界では、データサイエンスに興味を持つ人が増えています。データ サイエンティストはアルゴリズムを使わずにはいられません。では、データ サイエンティストが最もよく使用するアルゴリズムは何でしょうか? 最近、有名なデータマイニング情報ウェブサイトKDnuggetsがトップ10アルゴリズムの調査を企画しました。この調査では、データサイエンティストがよく使用するアルゴリズムをランク付けし、最も「産業的」かつ「学術的」なアルゴリズムを見つけました。また、過去5年間(2011〜2016年)のこれらのアルゴリズムの変化についても詳しく紹介しました。 調査結果は844人の回答者の投票に基づいています。 KDnuggets は、上位 10 個のアルゴリズムとその投票シェアを次のようにまとめています。 すべてのアルゴリズムとメソッドの完全なリストについては、記事の最後を参照してください。 調査によると、回答者は平均 8.1 個のアルゴリズムを使用しており、2011 年の同様の調査と比べて大幅に増加している。 2011 年のデータ分析/データマイニングの投票アルゴリズムと比較すると、人気のあるアルゴリズムは依然として回帰アルゴリズム、クラスタリング アルゴリズム、決定木、視覚化であることがわかります。相対的に言えば、最大の成長は次のアルゴリズム (pct2016/pct2011-1) によって測定されます。
2016 年の新しいアルゴリズムは次のとおりです。
減少のアルゴリズム***は次のとおりです。
表1: 業種別アルゴリズムの使用状況 ほぼすべての人が教師あり学習アルゴリズムを使用していることに気付きました。政府や産業界のデータ サイエンティストは、学生や学術界よりも多様なアルゴリズムを使用しており、産業界のデータ サイエンティストはメタアルゴリズムを使用する可能性が高くなります。 次に、業界タイプ別に上位 10 のディープラーニング アルゴリズムの使用状況を分析します。 表2: 雇用形態別に使用されるディープラーニングアルゴリズム上位10件 表 2: 雇用形態別上位 10 アルゴリズム + ディープラーニングの使用状況 違いをより明確にするために、特定の業界タイプに関連付けられたアルゴリズムの平均使用率を Bias(Alg,Type)=Usage(Alg,Type)/Usage(Alg,All)-1 として計算します。 業界のデータ サイエンティストは、回帰アルゴリズム、視覚化、統計アルゴリズム、ランダム フォレスト アルゴリズム、時系列を使用する傾向があることに気付きました。政府機関や非営利団体では、視覚化、主成分分析、時系列を使用する可能性が高くなります。学術研究者は主成分分析とディープラーニングを好みます。学生は一般的にアルゴリズムをあまり使用しませんが、テキストマイニングとディープラーニングをより多く使用します。 次に、KDnuggets の訪問者全体を表す地域別の参加状況を見てみましょう。 有権者の地域分布は次のとおりです。
2011 年の調査と同様に、業界/政府を 1 つのグループに、学術研究者/学生を 2 番目のグループにまとめ、業界/政府に対するアルゴリズムの「親近感」を計算しました。 親和性が 0 のアルゴリズムは、産業界/政府機関と学術研究者/学生によって同様に使用されます。 IG 親密性委員会は、アルゴリズムがより「産業的」であることを示す一方、低いほどアルゴリズムがより「学術的」であることを示します。 その中で最も「工業的」なアルゴリズムは次のとおりです。
インクリメンタル モデリングは、今回も最も「産業的」なアルゴリズムですが、驚くほど使用率が低く、今回の調査で最も使用されているアルゴリズムであるにもかかわらず、わずか 3.1% にとどまっています。 最も「学術的な」アルゴリズムは次のとおりです。
次の図は、すべてのアルゴリズムと、業界/学術界におけるその人気を示しています。 以下の表には、アルゴリズムの詳細、2016 年と 2011 年の調査でそれらを使用した回答者の割合、変化 (%2016 / %2011 - 1)、および前述の業界との親和性が記載されています。 表3: KDnuggets 2016 調査: データサイエンティストが使用するアルゴリズム 次の表に、各アルゴリズムの詳細を示します。
|
<<: Spark を使用して行列分解推奨アルゴリズムを学習する
>>: [乾物] Tencent Cloud FPGA 上のディープラーニング アルゴリズム
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
自動車技術の継続的な向上とインターネット技術の普及に伴い、自動車に付与される機能はますます増えていま...
人々は、一人でいるときと公共の場では行動が大きく異なりますが、基本的な性格は同じままです。観客のいな...
[51CTO.com よりオリジナル記事] 今年初め、Google は強化学習によりモデル選択 + ...
テスラの元AIディレクター、アンドレイ・カルパシー氏の新しいチュートリアルが話題になっている。今回、...
編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...
AI技術の飛躍的な発展に伴い、攻撃者はAIの武器化を加速させ、ソーシャルエンジニアリング技術と組み合...
2013年のノーベル化学賞受賞者であるアリエ・ワーシェル氏は、COVID-19パンデミックと製薬業...
IoT アプリケーションでは、AI はデータ スタックの「最上位」で使用されることが多く、複数のソー...
人工知能とデータサイエンスは、2023 年に最もエキサイティングで影響力のある 2 つのテクノロジー...
[[438690]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
2023年は大きな言語モデルと着実な普及の年です。時系列の分野ではそれほど大きな成果は得られていませ...