1. 人工知能と機械学習 記事を始める前に、下の図 1.1 に示すように、人工知能、機械学習、ディープラーニングの関係を示す図を見てみましょう。 図1.1 人工知能、機械学習、ディープラーニングの関係 さて、ここで「あなたの心の中で人工知能とはどのようなものでしょうか?」という質問をしてみましょう。読み進めていくと、退屈な文章が面白くなってくるでしょう。 人工知能の父、アラン・マシスン・チューリングは、機械が知的であるかどうかを判断するためのテスト方法、すなわちチューリングテストを提案しました。この原則は、次のようなことを述べています。人が一連の質問を使用して、見えない 2 つの対象 (1 つは通常の思考力を持つ人間、もう 1 つは機械) に質問した場合、数回の質問の後でも実質的な違いが見出せない場合は、機械も人間の「知性」を備えていると想定できます。 人工知能の最も初期の応用 - 第二次世界大戦中、チューリングはイギリス軍を支援して有名なドイツの暗号システム「エニグマ」の解読を行い、第二次世界大戦の大西洋戦場で連合軍の戦況を好転させるのに大きく貢献しました。英国の戦時情報センターが解読する情報の量が月間 39,000 件から 84,000 件に増加したことで、第二次世界大戦は少なくとも数年前に終結しました。ご興味のある方は関連映画「イミテーション・ゲーム」を観てみてはいかがでしょうか。ここでは言及しません。 機械学習: 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論などの分野を含む多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。これは人工知能の中核であり、コンピューターをインテリジェントにする基本的な方法です。 機械学習は、本質的には人間の学習方法に基づいています。たとえば、人間の知能のほとんどは、生来のものではなく、訓練と学習を通じて獲得されます。新生児は生まれたときには認知能力がありませんが、成長するにつれて情報を受け取り続け、それが脳を刺激して認知能力を構築します。子どもたちが「リンゴ」と「オレンジ」の抽象的な概念を理解できるようにするには、「リンゴ」と「オレンジ」の多くの例や写真を絶えず紹介し、「リンゴ」と「オレンジ」に対する理解を深める必要があります。
図1.2 知識カードの識別 機械学習における古典的アルゴリズムの開発の歴史 図1.3 古典的な機械学習アルゴリズム ここでは、機械学習の天井として知られる古典的な SVM アルゴリズムのみを使用して、機械学習の実装原理を説明します。 いつものように、実際の問題で SVM を理解すると、より明確になります。たとえば、「猫」と「犬」の写真がたくさん渡され、それぞれ「猫」と「犬」を識別するように求められた場合、どうしますか?
図1.4 猫と犬の写真 このような写真の場合、私たちは「猫」と「犬」の認識を早い段階で確立しているので、簡単に分類できますが、この退屈な作業を喜んで行う人は多くありません。私たちには機械があります。では、この単純で退屈な作業を完了できるように機械を訓練してみませんか? 2 デジタル画像とアナログ画像 機械学習やディープラーニングの謎を解き明かす前に、まずは画像処理で最も重要な「画像」について紹介します。画像は、大きく分けて「アナログ画像」と「デジタル画像」に分けられます。 アナログ画像:連続画像とも呼ばれ、2次元座標系で連続的に変化する画像を指します。つまり、画像ポイントは無限に密集しており、グレースケール値(つまり、暗い色から明るい色への画像の変化値)を持ちます。連続画像の代表的なものとしては、人物や風景の写真など光学レンズシステムによって取得された画像があり、アナログ画像と呼ばれることもあります。フィルムで撮影した写真はアナログ画像です。フィルムを元に1インチ写真や2インチ写真を現像しても視覚効果には影響しません。しかし、アナログ画像には膨大な情報量が含まれており、通常はコンピュータを使用して画像を処理する必要があるため、デジタル画像は有限の数の行と列で構成する必要があります。図2.1に示すように:
図2.5 猫と犬の分類ポイントセット 赤い点は「猫」、青い点は「犬」と考えることができます。上記の特徴から、赤い点と青い点の間に隙間があることがはっきりとわかります。赤い点と青い点を分ける線を機械に見つけさせれば、機械は絵が猫なのか犬なのかを識別するのに役立ちます。 (具体的なアルゴリズムについては詳しく紹介しません。興味のある方は、Baidu SVM を検索してください) 分類効果は次の図に示されています。 図2.6 SVMバイナリ分類ライン 画像に実線があることがわかります。計算後、新しい画像が実線の上にある場合は青い点「犬」と見なし、そうでない場合は赤い点「猫」と見なします。これは単純なバイナリ分類です。類推により、マルチ分類を実現できます。図に示すように: 図2.7 SVM 3分類ライン この「猫」と「犬」の分類から、基本的には機械学習が問題を解決するプロセスが得られます。 3 ディープラーニング 機械学習が人工知能に基づいて開発された分野であるのと同様に、ディープラーニングは機械学習に基づいて開発された分野です。 図3.1 ディープラーニングスケール図 ディープラーニングは人工ニューラルネットワークとも呼ばれ、私たち自身の認識レベルに基づいた製品です。下の図の生物学研究結果を例に挙げてみましょう。私たちは目を通して情報を収集し、それをニューラルネットワークを通して脳に伝え、最終的に観察した結果を得ます。
図3.2 人間の神経ネットワーク構造図 ディープラーニングでも同じことが言えます。簡単な例を使ってディープラーニングの仕組みを分析してみましょう。今私たちに与えられた問題は、0 から 9 までの 10 個の数字の簡単な手書き数字認識です。これら 10 個の数字を正しく識別してみましょう。プロセスは実際には非常に簡単です。 まず、手書きの数字画像を収集し、それに応じて対応する数字画像にラベルを付けます。 コンピュータに画像とラベルの両方を伝え、構築された畳み込みネットワークでトレーニングと学習をさせます。 学習したモデルの検証と応用。 図3.3 画像注釈トレーニング図 ディープラーニングはなぜ人工ニューラルネットワークと呼ばれるのでしょうか?次にこの写真を見てみましょう。 図3.4 手書き数字のニューラルネットワーク図 入力層は入力画像とみなすことができ、白抜きの円はとりあえずピクセルとして理解することができます。これらのピクセルは中間の隠れ層(ニューロンの伝達とみなすことができます)によって計算され、最終的に10個の数字として出力層に出力されます。計算後、これらの10個の数字は一般的に0〜1の範囲にあり、上から下に向かって0〜9と見なすことができます。これは数字の確率値です。たとえば、数字9の画像をトレーニング済みモデルに入力します。出力層に到達すると、これらの10個の数字の配列は[0.12、0.32、0.33、0.10、0.01、0.01、0.01、0.15、0.99]になります。 これらはそれぞれ、この画像が 0 である確率は 0.12...、9 である確率は 0.99 であるとコンピュータが考えていることを意味します。すると、コンピュータは最も高い確率 0.99 に対応するラベルを選択し、この絵が 9 であると判断します。これらの隠し層はニューラル ネットワークのようなもので、特徴操作を自動的に抽出する役割を果たし、従来の機械学習アルゴリズムよりも精度が高くなります。 では、ディープラーニングは従来の機械学習よりも確実に優れているのでしょうか?実際、それらはすべて独自の長所と短所を持っています。 ディープラーニングの利点: 1. 高い精度(従来の機械学習をはるかに超える)と幅広い適用性。 2. エンドツーエンドの強力な機密性(隠し層は小さなブラックボックスに相当し、最終的な出力結果が出るまでどのステップにいるのかわかりません)。 3. 手動で特徴を抽出する必要はありません。 … ディープラーニングの欠点: 1. 計算量が多く、ハードウェア要件が高い(ネットワーク層が多いほど、計算量が多くなります)。 2. トレーニング時間が長く、汎用性が低い(トレーニング済みのものは認識できるが、トレーニングされていないものは認識できない可能性がある)。 3. 未熟さ(世界中の専門家が隠れ層を研究していますが、私たち人間は具体的な原理を知らなくても実際に何かを作ることができ、このように機能を実現できることしか知りません)。 … 機械学習の利点: 1. 汎用性に優れています。 2. ハードウェア要件が低い。 3. 操作時間が短い。 4. 比較的成熟している。 … 機械学習の欠点: 1. 2値化への過度の依存。 … この時点で、人工知能、機械学習、ディープラーニングについて、皆さんはある程度理解していると思います。元の質問「皆さんにとって人工知能とはどのようなものですか?」に戻ると、現在の技術と皆さんが考えているものとの間には、少しギャップがあるかもしれません。しかし、将来的には映画のような人工知能ロボットが必ず登場するでしょう(さて、話がそれてしまいましたが) |
<<: バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする
>>: ボストン・ダイナミクスの最新倉庫ロボットは1時間あたり800個のレンガを移動できる
Salesforce が実施した調査では、生成 AI の使用に関する明確なポリシーが存在しない状況で...
[[319373]]新型コロナウイルスが昨年12月に中国・武漢で発生して以来、過去数か月間に2,00...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
順序前回の記事「大規模 Web サイトのアルゴリズムとアーキテクチャに関する簡単な説明 (パート 1...
古典作品「星の王子さま」には、蛇が象を飲み込む絵を描いた少年が、大人たちにその絵を見せて怖いかと尋ね...
規制基準の強化は、アルゴリズム推奨技術の標準化と健全な発展に根本的に利益をもたらすだろう。近年、科学...
[[178638]] [51CTO.com クイック翻訳]過去数年間で、民間および商用ドローンへの関...
2016年1月、国家衛生計画出産委員会は専門医向けの「5+3+x」標準化研修システムを発行しました。...
[[257231]]新年を迎えるにあたり、2019 年を形作る業界のトレンドに注目する時期が来ました...