ディープラーニングの深層: モデリング知識とオープンソースツールのオプション

[51CTO.com クイック翻訳] この記事では、ディープラーニングアルゴリズムを使用してデータモデルを作成する方法に焦点を当てます。ここでは、人間の脳や人間の知能に関連する問題については議論しませんが、ディープラーニング技術がコンピューターサイエンスと初期の人工知能における主要な問題の解決にどのように役立つかを説明します。また、ディープラーニングの利点と応用についても説明し、ディープラーニングモデルの作成時に発生するいくつかの質問に回答します。参考資料、提案、ヒントを提供し、それらを他のフォローアップトピックの開始点として使用します。

まず、私はディープラーニングの分野の専門家ではありません。それどころか、私もこの技術を学んでおり、この記事を通じて自分のアイデアや知識を共有し、より多くの友人が学習に参加するよう促したいと考えています。抜け漏れや誤り、補足すべき内容などございましたら、コメント欄にてご指摘ください。よろしくお願いいたします。

データサイエンスの専門家として、ディープラーニング技術の最も魅力的な点は、複数の分野に拡張して多数の実用的な問題を解決できる点です。ディープラーニングは昨今トレンドとなっており、大きな潜在的応用領域を秘めています。本当に興味深いのは、ディープラーニングがデータから隠れた特徴を抽出し、明示的にプログラムしたり（ルールベースのシステム）、手動で調整したり（他の機械学習アルゴリズムの中には、これを使用して独自の学習能力を向上させるものもある）することなく、デバイスがタスクを完了する方法を学習するのに役立つことです。

ディープラーニングソリューションを使用することで、画像、音声、ビデオ認識の分野の研究者や実務者は優れた成果を達成しています。ディープラーニングは、AI がロボットの脳としてより効果的に機能するのに役立ち、急速に発展しているモノのインターネットの分野でも大きな役割を果たすことができます。企業にとって、ディープラーニングはすでに顧客サービスの効率化や手作業の多いタスクの自動化において効果を発揮し始めています。さらに、ディープラーニングを搭載したロボットを使用して、製品に関する相談の質問に答えたり、よくある質問を要約したりすることをすでに開始しているかもしれません。 AppleのSiriやMicrosoftのCortanaはどちらもディープラーニングをコアコンポーネントとして採用しており、医療やヘルスケアの分野におけるX線やMRIスキャンの診断も徐々にディープラーニングのアルゴリズムで解釈できるようになる。

ディープラーニング方式では、大量のデータを使用して非線形の関連性を確立するようにトレーニングしますが、この機能により、このファミリー内の多くの先行技術の中でも際立った特徴となっています。

標準的なディープラーニングアルゴリズムの基礎を理解するには、まずその前身であるニューラルネットワークを理解する必要があります。ニューラルネットワークは、入力層、隠れ層、出力層の 3 つの層で構成されます。

• 入力層は、入力値を受信する役割を果たすニューロンで構成されています。これらのニューロンの出力は入力予測と同じです。

• 出力層はニューラルネットワークの最終層であり、結果をユーザー環境に返す役割を担います。ニューラルネットワークの特定の設計に応じて、情報の内容をどのように理解するかを前の層に伝え、それに応じて前の層の実際の機能を改善することもできます。

• 隠れ層は入力層と出力層の間に配置されます。従来、隠し層の数は 1 から多数までの範囲で、隠し層は入力をノード出力にマッピングする中心的な計算層です。

ニューラルネットワークからディープラーニングに移行する理由は何ですか?

「ディープ」アーキテクチャの導入により、複数の隠しレイヤーをサポートできます。これは、複数の表現レイヤーを実現したり、初期のニューラルネットワークでは不可能だったより複雑な特徴構造を学習したりできることを意味します。
さまざまな問題に適応するために、複数のアーキテクチャ (DBN、RBM、CNN、さらには RNN) をサポートするように改善および変更されました。
大規模なデータ計算タスクを処理するためのアルゴリズムを最適化できます。
トレードオフを行うことでトレーニングデータのサイズを縮小するなど、最適化および正規化パラメータを導入します。
オープンソースのディープラーニングソフトウェアパッケージを備えており、複数の主流プログラミング言語で利用できるため、特定の分野に革新的な成果をもたらします。

隠し層の数を増やすだけでは生産性を向上させるのに十分ではありません。では、ディープラーニングを実際に実用的なツールにするにはどうすればいいのでしょうか?

より多くのデータ: ディープラーニングアルゴリズムのトレーニングに使用されるデータが増えるほど、実際のパフォーマンスは向上します。さらに、アルゴリズムがさまざまな状況を区別し、対応する知識を獲得できるように、データ自体には肯定的な状況と否定的な状況の両方が含まれている必要があります。ディープラーニングの台頭と精度の向上は、ビッグデータの本格的な登場と密接に関係しています。デジタル化とビッグデータ処理フレームワークは、ディープラーニングがトレーニングに必要なデータリソースをより適切に取得するのに役立ちます。
モデルのチューニングは芸術です。ディープラーニングモデルでは、モデルのチューニングを実現するためにハイパーパラメータと知識が必要です。データセットに基づいてディープラーニングアルゴリズムのパフォーマンスを最適化し、精度を向上させることができます。このシリーズの次の投稿では、ディープラーニングモデルを作成するプロセスで H2O を使用して関連パラメータを決定する方法について説明します。

この時点で、私たちは新たな問題に直面しています。複雑なディープニューラルネットワークのトレーニングには、大量の計算能力が必要です。この課題は、Nvidia や Intel などのメーカーの継続的な進歩により、手頃な価格で高性能な GPU によって解決されました。 GPU を使用したディープラーニングモデルは、CPU よりもはるかに高いトレーニング速度を実現できることがわかります。 Nvidia はブログで、ベンチマーク結果によると、GPU で加速されたニューラルネットワークのトレーニングは CPU よりも 10 ～ 20 倍高速になる可能性があると指摘しました。つまり、かつては数週間、あるいは数日かかっていたトレーニングが、わずか数時間で完了できるようになったということです。

R ユーザーは、次のパッケージを使用してディープラーニングモデルを作成できます。次の記事でも、H2OとRを組み合わせてディープラーニングモデルを作成します。

h2o: H2O への R インターフェース。これは、クラスター環境での一般化ニアラインモデル、勾配誘導デバイス、ランダムフォレスト、ニューラルネットワーク (ディープラーニング) などの並列分散機械学習アルゴリズムを計算するためのオープンソース数学エンジンである H2O 用の R スクリプト機能を提供します。
mxnet: R 言語向けの柔軟で効率的な GPU コンピューティングと最先端のディープラーニング機能を提供します。
deepnet: R のディープラーニングツールキット。
neuralnet: ニューラルネットワークのトレーニングに使用されます。重みバックプロパゲーションの有無にかかわらず、弾性バックプロパゲーション、またはグローバル集約の修正バージョンを利用します。このパッケージを使用すると、エラーとアクティベーション関数の選択をカスタマイズして設定を調整できます。さらに、一般化された重み付けコンピューティング機能も実現できます。
rnn: リカレントニューラルネットワーク。 R 言語環境で再帰ニューラルネットワークを実装します。
darch: ディープアーキテクチャと制限付きボルツマンマシン用のパッケージ。 darch パッケージは、GE Hinton と RR Salakhutdinov によって提供されたコードから構築されています。この方法には、GE Hinton によって公開された事前トレーニング済みのコントラストダイバージェンス法が含まれており、リリース前にバックプロパゲーションや共役勾配などのアルゴリズムを使用して事前トレーニングされています。さらに、ディープラーニングのきめ細かな調整効果を向上させるために、他の新しい技術も導入されています。
オートエンコーダー: ラベルなしデータの表現特徴を自動的に学習するためのスパースオートエンコーダー。

お気に入りのディープラーニングソフトウェアパッケージをダウンロードしてプログラミングを開始できます。誰もがより良い出発点を見つけられるように、次の質問に基づいて実際の状況に適したディープラーニングモデルを構築できます。

入力層で使用するニューロンの数はいくつ必要ですか?入力または機能の数を決定します。
隠し層はいくつ使用すればよいでしょうか?使用する隠し層の正確な数を理解するには、標準的な機械学習プロトコルを使用した相互検証を使用する必要があります。
各隠れ層にはいくつのニューロンが必要ですか?隠れ層のニューロンの正確な数は、既存の技術だけでは判断できません。隠れ層のニューロンの最も一般的な数は、入力層のニューロンの数と出力層のニューロンの数の間になります。あるいは、幾何学的ピラミッドルールを使用して、N 個の入力ニューロンと出力ニューロンを持つ 3 層ネットワークの大まかな近似値を計算することもでき、隠れ層のニューロン数は sqrt(n * m)sqrt(n * m) になります。
ディープラーニングネットワークは隠れ層なしで実装できますか?はい、ただしそれを「ディープ」学習ネットワークと呼ばないでください。数値を取り込み、データの線形分離を実行できます。
出力層のニューロンはいくつ必要ですか? 当社が開催する対象クラスの数に相当します。

原題: Dive Deep Into Deep Learning原著者: Sibanjan Das

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: 主要なソートアルゴリズムのパフォーマンス比較とデモンストレーション例

>>: KDnuggets 調査 | データサイエンティストが最もよく使用するアルゴリズムトップ 10