Python ディープラーニング: なぜディープラーニングを学ぶのか?

Python ディープラーニング: なぜディープラーニングを学ぶのか?

2016年初頭、伝説の囲碁プレイヤー、イ・セドル氏が囲碁界の「新人」と世界的に有名な一連の対決を始めた。

囲碁は2,500年前に中国で生まれたボードゲームです。チェスよりも複雑な戦略ゲームで、世界75か国のプレイヤーが積極的に参加しています。

囲碁九段の李世ドル氏は、2002年以来、世界選手権で何度も優勝している。彼は目に見えない対戦相手、AlphaGoと対峙していた。 AlphaGoはロンドンにあるGoogleのDeepMindチームによって開発されました。対局前に李世ドルが対戦相手のことをどれだけ知っていたかは不明だが、おそらく科学ライターのマシュー・ブラガの囲碁に関する記事を読んで安心したのかもしれない。この記事は 2014 年に公開され、Go について説明しています。

「…は、コンピュータの知能がまだ習得していない数少ないゲームの 1 つです。このゲームには可能な動きが多すぎるため、プログラマーは長い間行き詰まっていました。」

しかし、データサイエンスの世界では、24 か月というのは長い時間です。 Google のディープラーニング アルゴリズムは、最初に 4 つの駒をプレイする必要がある場合でも、優れたコンピューター 対戦相手に勝つことができます。 2016年1月、AlphaGoはヨーロッパチャンピオンのファン・モを5対0で破った。 2016年3月、AlphaGoは伝説の棋士、イ・セドルに挑戦した。

1. 最後の子供

最後の行動が行われる前に、結果は明らかでした。フランスの有名メディア「CAUSEUR」は「イ・セドルの恥辱の日」と叫んだ。ショックを受けた九段のチャンピオンは、数学的アルゴリズムによって自分が敗北した経緯を苦労して語った。

「…もっと良いパフォーマンスを発揮し、もっと良い結果ともっと良いプロセスを出すべきでした。多くの人の期待に応えられなかったことをお詫びします。私にできることは何もありません。」

イ・セドルも、人間と機械の競争で注目を集めている選手の一人だ。人間と機械の戦いの歴史は、ジョン・ヘンリーと新技術の蒸気ドリルとの壮大な戦いにまで遡ることができます。その容赦のない試合では、両者は互角で、最終的にヘンリーが勝利したが、その後すぐに疲労困憊で亡くなった。アメリカ全土に鉄道が張り巡らされるにつれ、蒸気ドリルは欠かせない道具となった。リー・セドルにとってのディープラーニングは、ジョン・ヘンリーにとっての蒸気ドリルのようなものです。

1.2 — 奇妙なこと

奇妙なことに、専門モデルの構築を生業とする人々にとって、ニューラル ネットワークや機械学習による他の高度に洗練された技術の利点は明らかです。実際(理論的な推測とは反対に)、ディープラーニングの驚くべき成果は、ビジネス界、政府機関、研究コミュニティ、そしてますます多くの学者から高く評価されています。ある学者はこう言いました。

「1990年代は経験主義の復活にとって刺激的な時代でした。私たちの努力がこれほど成功するとは想像もしていませんでした。私たちが求めていたのは、ただ働く場所だけでした。現在の研究とは別に、現在行われている研究とは異なる仕事のためのスペースを少しでも確保したいと考えていました。」

1.3 2種類の人間

世の中には 2 種類の人間がいるという古いジョークを覚えていますか。世の中には 2 種類の人間がいると信じている人と、それをまったく信じていない人です。そうですね、世の中には 2 種類のデータ サイエンティストがいると私は信じています。私が言っているのは、コンピューターサイエンスを学んだデータサイエンティストや統計学を学んだデータサイエンティストのことではありません。有能なデータ サイエンティストであれば、必要に応じて確率、統計、データ構造、アルゴリズムを活用できます。実際、この本のアドバイスは、両方の分野のデータ サイエンティストに等しく当てはまり、両方に大きなメリットをもたらす例も紹介します。

また、私は機械学習の熱狂的なファンと、従来の統計モデリングを行うデータ サイエンティストの対立についても話しているわけではありません。古典的な統計モデリングと現代の機械学習によって開発されたアルゴリズムはどちらも、データセットの重要な特徴を識別して活用する上で重要な役割を果たします。この本は、これら 2 つのアプローチをより深く理解し、それらをより効果的に組み合わせてデータ セットを分析するのに役立ちます。

私は、専門的なドメイン知識を持つデータ サイエンティストとジェネラリストであるデータ サイエンティストについて話しているわけではありません。一つの分野を深く掘り下げて習得することは、非常にやりがいのあることです。複数の分野を柔軟に横断するには並外れた才能が必要ですが、これもまた非常にやりがいのあることです。この本は両方の面で役立ちます。

そうですね、世の中にはディープラーニングの専門知識を持つデータサイエンティストと、ディープラーニングの専門知識を持たないデータサイエンティストの 2 種類がいると思います。この知識を欠いている人たちが、同時代の人たちよりも専門性が劣っていると言っているのではありません。簡単に言えば、ディープラーニングの知識があれば、より幅広いツールにアクセスできるようになり、さまざまな角度から困難な問題に取り組み、迅速かつ効率的に解決策を見つけることができます。つまり、ディープラーニングはデータ サイエンスのツールキットを拡張します。

優れたディープラーニング手法に関する知識がほとんどないデータ サイエンティストは、このスキルを持つ同僚に比べて大きな不利を被る可能性があります。老化研究から動物学的分析まで、ディープラーニングのスキルは高い需要があります。

2. ディープラーニングとは何ですか?

ディープラーニングは、機械学習とニューラルネットワーク、人工知能、グラフィカルモデリング、最適化、パターン認識、信号処理などの技術の融合から生まれた分野です。厳格な学術雑誌では、この新しい分野のモデルが真剣かつ合理的な学者によって推進されてきました。

「ディープラーニングネットワークはニューラルネットワークにおける革命的な発展であり、より強力な予測モデルを作成するために使用できるとさえ考えられています。」

2.1 成功への青写真

簡単に言えば、ディープ ニューラル ネットワークは、複数の抽象化レイヤーを使用して概念や機能を表現する方法です。実際、どのエンジニアや建築家もこの基本的な方法を使用しています。大きなオフィスビルの設計図を想像してみてください。最下階には電気、配管、排水システムが詳細に描かれ、最上階には 30 階まで見渡せる回転展望台と旗竿が設置されているかもしれません。

ディープ ニューラル ネットワークもこの非常に便利なスキームに従います。このプログラムは生活のほぼあらゆる分野で使用されています。医師には診断があり、教師には指導要領があり、企業には利益計画があり、学術界にも研究論文を発表するための基準があります。

実際、人生において、アイデアが複数の抽象化レイヤーを使用して表現されていない例を見つけるのは難しいです。軍の司令官は戦闘を展開するために同じ原則を使用し、政治家は選挙に勝つために同じ原則を使用します。同じ原則が、ニューラル ネットワークやその他の多層モデルを使用した分類や予測にも当てはまるのは当然です。

より高速なコンピュータ プロセッサ、ますます安価になるメモリ、新しいデータ形式の急増により、あらゆる規模の企業がデータ分析にディープラーニングを使用できるようになりました。

2.2 教師あり学習と教師なし学習

ディープラーニングは、多層機械学習モデルを使用して、データに対して教師あり学習または教師なし学習を実行します。モデル内のさまざまなレイヤーは、非線形データ変換の複数の段階で構成され、データの機能は、より高い抽象的なレイヤーで順次表現されます。

データサイエンスの分野には、2 つの基本的な学習タイプがあります。

教師あり学習: トレーニング データには既知の結果が含まれています。モデルはこれらの結果に基づいてトレーニングされます。

教師なし学習: トレーニング データには既知の結果が含まれていません。アルゴリズムはデータ内のつながりを独自に発見します。

2.3 ディープラーニングのプロセス

ディープラーニングの核となる考え方を学ぶ際に私たちが取る一般的なアプローチは、図 2.1 に示されています。どのようなタイプの機械学習モデルを開発しても、最終的にはこの基本モデルに戻ってきます。入力データはモデルに渡され、複数の非線形レイヤーを介してフィルタリングされ、最後のレイヤーには、オブジェクトがどのカテゴリに属する​​かを決定する分類子が含まれます。

図2.1 一般的なディープラーニングフレームワーク

データを使用して学習する目的は、一連の属性を与えられた場合に応答変数を予測したり、応答変数を分類したりすることです。これは、独立変数 (属性または特徴とも呼ばれる) のセットを使用して線形モデルを通じて従属 (応答) 変数を予測する線形回帰に多少似ています。ただし、従来の線形回帰モデルは、データに対して複数層の非線形変換を実行しないため、ディープラーニングとは見なされません。

その他の一般的なデータ学習手法には、決定木、ランダムフォレスト、サポートベクターマシンなどがあります。これらのテクニックは強力ではあるが、深遠なものではない。決定木とランダム フォレストは、変換や新しい機能の生成を行わずに元の入力データを処理し、サポート ベクター マシンはカーネル関数と線形変換のみで構成されるため、より浅いものになります。同様に、単一隠し層ニューラル ネットワークは隠し層が 1 つしか含まれていないため、ディープ ニューラル ネットワークとは見なされません。

3. ディープラーニングはどのような問題を解決できますか?

ディープラーニングの威力は、適度な数の並列非線形ステップを使用して非線形データを分類または予測する能力から生まれます。生の入力データから実際のデータの分類までのプロセスで、ディープラーニング モデルは入力データの階層的な特徴を学習します。各レイヤーは、前のレイヤーの出力から特徴を抽出します。

この本で言及されているディープラーニング モデルは、複数の隠し層を持つニューラル ネットワークです。図 2.2 に示すように、最も単純なディープ ニューラル ネットワークには、少なくとも 2 層の隠しニューロンが含まれています。各層の入力は、前の層の出力から得られます。

図2.2 2つの隠れ層を持つフィードフォワードニューラルネットワーク

多層ディープ ニューラル ネットワークには複数の非線形層があり、高度に非線形な関数や高度に変化する関数をコンパクトに表現できます。データ内の複雑なパターンを識別するのに優れており、コンピューター ビジョンや自然言語処理などのタスクの改善に使用でき、非構造化データに関する困難な問題を解決できます。

世界中で広く読まれている雑誌『IEEE Spectrum』は、「データ サイエンティストは不足しています。これらの専門家は高額の給与と多額のストック オプションを享受しています...」と報告しています。McKinsey Global Institute によると、米国だけで適切なスキルを持つデータ サイエンティストが 14 万~ 19 万人不足しており、『Harvard Business Review』は、データ サイエンスは 21 世紀で最も魅力的な職業であると主張しています。

4. ディープラーニングはどの分野で使用されていますか?

ディープラーニング技術は、ヘルスケア業界、医療画像処理、自然言語処理、広告のクリック率向上などに商業的に応用されています。 Microsoft、IBM、Yahoo、Twitter、Baidu、PayPal、Facebook はすべて、ユーザーの好みを理解し、対象とするサービスや製品を推奨するためにディープラーニングを使用しています。ディープラーニングはあらゆるところに存在し、スマートフォンの音声アシスト技術にも使用されています。

ディープラーニングの恩恵を受けられないビジネス活動を想像するのは難しいでしょう。 5 分間考えて、最も良いアイデアをいくつか書き留めてください。

私が思い浮かぶ分野をリストアップすると次のようになります。

プロセスモデリングと制御

健康診断

ポートフォリオ管理

軍事目標の識別

NMRとX線分析

銀行やその他の金融機関の個人信用格付け

マーケティング活動

音声認識

株式市場予測

テキスト検索

金融詐欺検出

リチャード・ソッチャーは独自のリストを作成し、その中に有用な応用方法を見つけ、医療画像分析と自動画像認識を専門とする会社、MetaMind を共同設立しました。他のデータ サイエンティスト、起業家、応用研究者、そしておそらくあなたも、リチャードの先導に従って、このますます収益性の高い分野に参入するでしょう。

4.1 ディープラーニングは永遠の若さの秘密を解明できるか?

ある日、私は科学研究機関から、ディープラーニングに関連した非常に興味深い出来事についての斬新なニュースを含んだプレスリリースを受け取りました。このニュースは、年間2,600億ドル以上の価値がある世界市場である美容業界に関するものです。

美容製品の核心は若さを維持し、老化を逆転させることです。この取り組みは、世界中で毎年毎日何百万ドルものマーケティング費が費やされていることに反映されています。若くて成熟した幸せな人々の画像をフィーチャーした広告が、人々の携帯電話、タブレット、ラップトップに溢れています。

あなたがこの記事を読んでいるときも、永遠の若さを約束する新しい美容製品が発売されたばかりです。信じられないなら、インターネットでちょっと検索して調べてみてください...

4.2 高齢化の課題

高齢化の課題は、歴史を通じて偉大な思想家、政治家、科学者たちの最前線にありました。アメリカの老年学者 IL ナッシャーは、彼の古典的な著作の中で次のように書いています。

「なぜ人間は老いていくのか、あるいは、身体機能が一定期間完璧に働いた後、臓器や組織が退化し、機能が弱まり、病気になって、生命維持に必要な調和のとれた相互関係を維持できなくなるのか、これは生と死という大きな疑問の一部である。」

この問題は、1601 年にイギリスのエリザベス女王が救貧法を公布して初めて緩和されました。働くことができないために貧しく無力な、見捨てられた高齢者の窮状が、この法律の制定における重要な問題でした。

「…秩序を維持し、国の福祉に貢献する。」

救貧法では、子供に両親や祖父母を扶養することを義務付けていた。I.L. ナッシャーは次のように述べている。

「中国には先祖や年長者を敬う精神があるが、ここにはそれがない」

救貧法はイギリスで250年以上続いた。この間、英国における平均寿命は40歳前後から80歳以上に倍増しました。他の国でも同様の傾向が見られます。

4.3 数多くの説

平均寿命が着実に伸びているのには多くの理由があります。臨床外科医のビクター・ホースリー卿は、老化の原因を甲状腺の退化とみなし、著名な科学者のエリー・メチニコフは、大腸の白血球が老化を促進する細菌を破壊する「貪食作用」の理論を提唱し、著名な老年学者のショック博士は白熱した議論の中で大胆に次のように宣言しました。

「おそらく、老年医学研究の最も有益な貢献の一つは、老化が必ずしも変性や疾患と関連しているわけではないという実証である。」

老化についてはいまだに数え切れないほどの理論があり、生物学者、老年学者、人口統計学者の間でも大きな意見の相違があります。老化は病気でしょうか? 人間の寿命には限界があるのでしょうか? 老化を止めたり、逆転させることはできるのでしょうか?

4.4 データサイエンティストの回答

ディープラーニングが老化の問題を永久に解決するかもしれないという新しいニュースが私の注目を集めました。 YouthLabの共同設立者アレックス・ザヴォロンコフ氏が率いる研究者らは、老化に関連する一連の生物学的マーカーを特定することを目的とした研究を実施し、成功すれば、対象を絞った長期介入の効果を追跡するために使用できる可能性がある。この研究の注目すべき点の一つは、基本的な血液検査のみが必要だったことです。

研究者たちは実際の年齢を予測するためのディープニューラルネットワークを開発した。 60,000 以上のサンプルでトレーニングされています。研究者たちは、このシステムが 5 つの主要な生物学的指標を 81.5% の予測精度で特定したことに驚きました。

この非常に斬新で画期的な分析は、世界的に有名な研究雑誌に掲載されました。研究結果は非常に価値が高いため、研究者たちは「世界美容イノベーションサミット - ディープラーニングが美容業界に参入」への参加に招待されました。

ディープラーニングには専門的なデータサイエンスの才能が必要ですが、その人材は依然として不足しています。現在、ディープラーニングの恩恵を受けることができるのはほんの一握りの企業のみであり、他の企業も追いついています。

5. ディープラーニングを使いたいが、どこから始めればいいかわからない

ディープラーニングは、人工知能を使用して現実世界の問題を解決するシステムを構築するための、これまでで最も効果的な方法の 1 つになりました。インターネット時代に生成される膨大なデータは、ディープラーニングでますます活用されるようになっています。ジャーナリストのロビン・ウィグルスワースはフィナンシャル・タイムズ紙に次のように書いている。

「簡単に言えば、ディープラーニングは1990年代のニューラルネットワークの開発に基づいており、機械は人工ニューロンのマトリックスを使用して情報をスキャンし、パターンを探し、決定を下します。人間の脳とよく似ていますが、超高速です。」

ディープラーニングは、分類や予測が必要な分野で非常に役立ちます。ビジネス、産業、研究のあらゆる分野で予測や分類の問題に関心のある人は、ディープラーニングを学ぶ必要があります。実際、予測または分類する必要がある十分な履歴データと研究事例があれば、研究用のディープラーニング モデルを構築できます。

何か新しいことを学ぶ上で最も難しいのは、理解しやすく展開しやすい例を見つけることです。このテーマに関する技術論文は数多く簡単に見つかりますが、すぐに開始して構築するための具体的な例を見つけるのは困難です。この本はこの問題を解決することを目的としています。この本には、直感的なイラスト、実用的な例、Python で直接構築およびテストできるモデルの簡単な説明が含まれています。これにより、データと Python を簡単に開始して実験できるようになります。

この本のアイデアを適用すると、データ サイエンスの実践に対する考え方が変わります。この本の各章のアイデアを 1 つだけ実装するだけでも、ディープラーニングを使用してタスクを完了できるだけでなく、より多くのデータの機会と課題に容易に対処できるようになります。

<<:  スマート街灯は明るく光るが、スマート街灯柱には隠された秘密があることが判明

>>:  多くの機械学習戦略が失敗する理由

ブログ    
ブログ    
ブログ    

推薦する

...

AIが書いた記事は教師を本当に騙すことができる

過去数年間、機械学習 (ML) と人工知能 (AI) の専門家は、以前は完全に人間が実行できると考え...

...

Ctrip旅行言語モデルシステムの紹介と応用

著者についてCtrip の自然言語処理と大規模言語モデル アルゴリズムの専門家である Terry は...

海外メディア:TikTokは米国の規制当局の支援を得るためにアルゴリズムを公開する予定

米国現地時間の水曜日、人気の短編動画プラットフォーム「TikTok」(Douyinの海外版)のCEO...

チャットボットの機械学習セキュリティの重要性

人工知能は、大手テクノロジー企業、新興企業、大学の研究チームによって推進されている成長産業です。 A...

顔認識技術の倫理

顔認識技術がさまざまな分野で持つ大きな可能性は、ほとんど想像できないほどです。ただし、使用する前に、...

コード生成のためのツリーベースのTransformerアーキテクチャ

導入:コード生成は、プログラマーの生産性を大幅に向上させる可能性を秘めた重要な AI 問題です。自然...

...

企業環境でのAIテクノロジーの活用

企業の世界における人工知能の利点は何でしょうか?企業分野における AI の主な利点の 1 つは、プロ...

Reddit ユーザーが「泣く」: 私はアルゴリズム エンジニアではなく、「パラメータ調整者」です

[[387580]]まず最初に質問させてください。あなたは自分が「スイッチャー」だと思いますか、それ...

デジタルヘルスと医療AIベンチャーキャピタル投資は2021年第1四半期に42億ドルに達した

CB Insightsのデータによると、遠隔医療は2021年第1四半期に139件の取引で過去最高の4...

...

ロボットが家庭に入り、人工知能の夢はもはや高価ではない

[[221538]]人工知能とは何ですか? 「第一次産業革命における蒸気機関、第二次産業革命における...