落とし穴を避けよう!ニューラルネットワークの欠点と短所を数え上げよう

落とし穴を避けよう!ニューラルネットワークの欠点と短所を数え上げよう

最近、ディープラーニングが大々的に宣伝されており、人々はニューラル ネットワークをあらゆる場所で使用したいと熱望していますが、ニューラル ネットワークは本当にあらゆる場所で適用できるのでしょうか? これについては、次の章で説明します。これを読めば、ニューラル ネットワークの主な欠点がわかり、機械学習の問題に適したタイプのアルゴリズムを選択する際の大まかなガイドラインが得られます。また、現在私たちが直面している機械学習の主な問題についても学びます。

[[227138]]

目次:

  • なぜディープラーニングがこれほど注目されているのか?(データ、コンピューティング能力、アルゴリズム、マーケティング)
  • ニューラル ネットワークと従来のアルゴリズム (ブラック ボックス、開発期間、データ量、計算コストが高い)
  • まとめ
  • 結論は

ディープラーニングがなぜこれほど注目されているのでしょうか?

ディープラーニングが現在注目されている主な理由は、データ、コンピューティング能力、アルゴリズム自体、マーケティングの 4 つです。次のセクションでそれぞれについて説明します。

1. データ

ディープラーニングの人気が高まった要因の 1 つは、過去数年から数十年にわたって収集され、2018 年に利用可能になった膨大な量のデータです。これにより、ニューラル ネットワークはより多くのデータを取得するほど改善され、その潜在能力を真に発揮できるようになります。

対照的に、従来の機械学習アルゴリズムは、必然的に、データを増やしてもパフォーマンスが向上しないレベルに達します。次の図はこれを示しています。

2. 計算能力

もう 1 つの非常に重要な理由は、現在利用可能なコンピューティング能力によって、はるかに多くのデータを処理できるようになったことです。人工知能の第一人者であるレイ・カーツワイル氏によれば、コンピューティング能力は徐々に増加するのではなく、時間単位ごとに一定の係数で増加します(たとえば、毎年 2 倍になります)。これは、計算能力が指数関数的に増加していることを意味します。

3. アルゴリズム

ディープラーニングの人気が高まった3つ目の要因は、アルゴリズム自体の進歩です。アルゴリズム開発における最近の進歩は、主にアルゴリズムを以前よりも高速に実行できるようになり、より多くのデータを使用できるようになったことによるものです。

4. マーケティング

マーケティングも非常に重要な要素となるかもしれません。ニューラル ネットワークは数十年にわたって大きな注目を集めてきました (1944 年に初めて提案されました) が、当時は誰もそれを信じて投資したいとは思っていませんでした。 「ディープラーニング」というフレーズによって、ディープラーニングに新しい派手な名前が付けられ、新たな宣伝効果を生み出し、ディープラーニングが新しく作られた分野であると多くの人が誤解する原因となっています。

さらに、一般大衆の間で大きな論争を巻き起こしたハンソン・ロボティクス社の「ヒューマノイド」ロボット「ソフィア」や、マスメディアで取り上げられた機械学習の主要分野におけるいくつかのブレークスルーなど、他の要因もディープラーニングのマーケティングに貢献しています。

ニューラルネットワークと従来のアルゴリズム

ニューラル ネットワークと従来の機械学習アルゴリズムのどちらを使用すべきかは、解決しようとしている問題に大きく依存するため、答えるのが難しい質問です。これは「ノー・フリー・ランチ定理」によるもので、これは大まかに言えば、どんな問題でもうまく機能する「完璧な」機械学習アルゴリズムは存在しないというものです。あらゆる問題に対して、特定のアプローチが適しており、良い結果が得られる一方で、別のアプローチは失敗する可能性がありますが、これはおそらく機械学習の最も興味深い部分の 1 つです。

これは、複数のアルゴリズムに習熟する必要がある理由であり、優れた機械学習エンジニアやデータサイエンティストになるための最良の方法は実践である理由でもあります。この投稿では、どのタイプのアルゴリズムをいつ使用すればよいかをよりよく理解するのに役立つガイドラインをいくつか紹介します。

ニューラル ネットワークの主な利点は、ほぼすべての他の機械学習アルゴリズムの能力を上回っていることですが、これにはいくつかの欠点があり、この記事ではそれらについて説明して重点的に説明します。前に述べたように、ディープラーニングを使用するかどうかの決定は、主に解決しようとしている問題によって決まります。たとえば、がんの検出では、パフォーマンスが優れているほど、より多くの人が治療できるため、高いパフォーマンスが重要です。しかし、従来のアルゴリズムが満足できる以上の結果をもたらす機械学習の問題もあります。

1. ブラックボックス

  

おそらく、ニューラル ネットワークの最もよく知られている欠点は、その「ブラック ボックス」性です。つまり、ニューラル ネットワークが特定の出力を生成する方法と理由がまったくわからないということです。たとえば、猫の画像をニューラル ネットワークに入力して、それが車であると予測した場合、その予測が行われた原因を理解するのは困難です。人間が解釈できる特徴があれば、なぜ何かが間違っているのか理解するのがずっと簡単になります。それに比べて、決定木のようなアルゴリズムは非常に理解しやすいです。一部の分野では解釈可能性が非常に重要であるため、これは重要です。

多くの銀行が、ある人物が信用に値するかどうかを予測するためにニューラル ネットワークを使用しないのは、融資を受けられなかった理由を顧客に説明する必要があるためです。そうでなければ、その人はなぜ融資を受けられなかったのか理解できず、銀行から不当に脅迫されていると感じ、Quora のようなサイトのように、その銀行に対する意見が変わる可能性があります。機械学習アルゴリズムに基づいてユーザー アカウントを削除することにした場合、その理由をユーザーに説明する必要があります。コンピューターが出した答えに彼らが満足するとは思えない。

その他のシナリオは、機械学習によって推進される重要なビジネス上の意思決定です。大企業の CEO が、なぜそうすべきかを理解せずに、数百万ドルの決定を下すところを想像できますか? それは単に「コンピューター」がそうすべきだと言ったからです。

2. 開発期間

Keras のようなライブラリを使用するとニューラル ネットワークの開発が非常に簡単になりますが、機械学習で難しい問題を解決しようとしている場合など、アルゴリズムの詳細をより細かく制御する必要がある場合もあります。

次に、Tensorflow を選択すると、より多くの機会が得られますが、より複雑なため、開発に時間がかかります (構築したいものによって異なります)。すると、企業経営者にとっての疑問は、より単純なアルゴリズムではるかに速く解決できる問題の開発に、高額なエンジニアを何週間も費やすことが本当に価値があるのか​​どうかという点になります。

3. データ量

ニューラル ネットワークでは通常、従来の機械学習アルゴリズムよりもはるかに多くのデータ、少なくとも数千、あるいは数百万のラベル付きサンプルが必要になります。これは簡単に解決できる問題ではありませんが、他のアルゴリズムを使用すれば、多くの機械学習の問題はより少ないデータでうまく解決できます。

ニューラル ネットワークがごく少量のデータしか処理しないケースもありますが、ほとんどの場合はそうではありません。この場合、Naive Bayes のような単純なアルゴリズムは、少量のデータでうまく機能します。

  

4. 計算コストが高い

一般に、ニューラル ネットワークは従来のアルゴリズムよりも計算コストが高くなります。最先端のディープラーニング アルゴリズムでは、非常に深いニューラル ネットワークのトレーニングを成功させますが、ゼロから完全にトレーニングするには数週間かかる場合があります。従来の機械学習アルゴリズムのほとんどは、数分未満から数時間または数日かかります。

ニューラル ネットワークに必要な計算能力は、データのサイズに大きく依存しますが、ネットワークの深さと複雑さにも依存します。たとえば、1 つの層と 50 個のニューロンを持つニューラル ネットワークは、1000 本のツリーを持つランダム フォレストよりもはるかに高速になります。比較すると、50 層のニューラル ネットワークは、10 本のツリーのみのランダム フォレストよりもはるかに遅くなります。

まとめ

おそらく、ニューラル ネットワークは一部のタスクには最適ですが、他のタスクには必ずしも適していないことは、すでにご存知でしょう。大量のデータ、より高い計算能力、より優れたアルゴリズム、そしてスマートなマーケティングによって、ディープラーニングの人気が高まり、最もホットな分野の 1 つになったことを学びました。最も重要なことは、ニューラル ネットワークが、付随する欠点はあるものの、ほぼすべての他の機械学習アルゴリズムよりも優れていることを学んだことです。最大の欠点は、その「ブラック ボックス」の性質、開発時間の増加 (問題によって異なります)、必要なデータの量、そしてそのほとんどが計算コストが高いという事実です。

結論は

ディープラーニングはおそらくまだ少し過大評価されており、期待されていた成果を上回っています。しかし、だからといってそれが役に立たないということではありません。機械学習はますます民主化され、より多くの人が機械学習を使って便利な製品を構築できるようになっているため、私たちは機械学習のルネッサンス期を生きていると思います。機械学習によって解決できる問題はたくさんあり、今後数年のうちにそれが実現すると信じています。

主な問題の 1 つは、データ サイエンスで何ができるのかを理解し、企業に真の価値をもたらす優れたデータ サイエンス チームを構築する方法を知っている人が少数しかいないことです。一方では、機械学習の理論に関しては天才的だが、ビジネス面の理解が不足している博士レベルのエンジニアもいます。その一方で、ディープラーニングで何ができるのか全く分からず、数年以内にすべての問題が解決されると考えている CEO や管理職もいます。このギャップを埋めるにはより多くの人材が必要であり、それによって社会に役立つ製品がさらに生産されるようになるでしょう。

<<:  孫玄、Zhuanzhuan 社アーキテクチャアルゴリズム部門: AI によるマイクロサービスアーキテクチャ

>>:  人工知能ニューラルネットワークとは何ですか?なぜ人間の推論を実現したり、意識を生成したりできないのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

「映画を見る」こと以外に、人工知能は医療の分野で何ができるのでしょうか?

6月26日に開催されたセコイア・グローバル・ヘルスケア産業サミットで、スタンフォード大学のフェイフ...

Google の 130 億パラメータの多言語モデル mT5 が利用可能になり、101 言語への容易な移行が可能になりました。

Facebook は多言語機械翻訳モデル「M2M-100」をオープンソース化したばかりだが、今度は...

これら5つのコアテクノロジーを理解すれば、人工知能はもうあなたの身近な存在に

人工知能は現在最も注目されている産業であり、将来的にはロボット、スマートセンサー、ウェアラブルデバイ...

非人道的だ!人工知能はソーシャルエンジニアリングの天敵である

人工知能 (AI) はまだ初期段階ですが、AI は急速に企業が自らを守るための重要な手段になりつつあ...

AI言語モデルのオープンソース化による10のプラスとマイナスの影響

GPT や PaLM などの独自のソフトウェアが市場を支配していますが、多くの開発者は依然としてオー...

各国の人工知能戦略の解釈

現在、人工知能の開発は引き続き盛んに行われており、新世代の科学技術革命の先駆者となりつつあります。米...

ディープラーニング入門: オートエンコーダから変分オートエンコーダまで

オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(AN...

...

...

リアルタイムの洞察を強化: コンピューター ビジョンとエッジ コンピューティングの相乗効果

今日の急速に変化する世界では、最先端技術のシームレスな統合がイノベーションの基盤となっています。その...

Python が機械学習に最適な理由は何ですか?

[[395543]] Python AI プロジェクトは、あらゆる形態や規模の企業の間で非常に人気...

モザイクから高精細画像まで、AIの画像作成能力は強化されてきましたが、美しさと歪みのバランスをどう実現するのでしょうか。

サスペンスやSF作品では、ぼやけた写真がコンピューターの画面に表示され、捜査官が画像を強調するように...

...

英国で今年、自動運転車が合法化される

[[397045]]画像ソース: https://pixabay.com/images/id-358...