AIは単なる機械学習ですか?機械学習とは何かを3000語でわかりやすく説明します

AIは単なる機械学習ですか?機械学習とは何かを3000語でわかりやすく説明します

コンピューター科学者は、人工知能の中核技術である機械学習とディープラーニングにおいて大きな進歩を遂げ、機械に強力な認知能力と予測能力を与えました。歴史を振り返ると、1997年にIBM Deep Blueがチェスのチャンピオンであるカスパロフを破り、2011年には機械学習機能を持つIBM Watsonがバラエティ番組に出場して100万ドルを獲得し、2016年にはディープラーニングで訓練されたAlphagoが人間の世界チャンピオンを破ることに成功しました。さまざまな出来事から、機械は人間のように考えることができ、さらには人間よりも優れた能力を発揮できることがわかっています。

現在、人工知能は金融、医療、製造などの業界で広く活用されています。その中でも、機械学習は人工知能技術の発展の主な方向です。

1. 機械学習、人工知能、ディープラーニングの関係

機械学習を紹介する前に、人工知能、機械学習、ディープラーニングの関係を整理する必要があります。業界で最も一般的な部門は次のとおりです。

  • 人工知能: 従来のコンピュータ システムとはまったく異なる動作モードを使用します。一般的な学習戦略に基づいて大量のビッグ データを読み取り、そこからパターン、関連性、洞察を発見できます。そのため、人工知能はプログラムをリセットすることなく、新しいデータに応じて自動的に調整できます。
  • 機械学習:人工知能研究の中核技術です。ビッグデータのサポートにより、さまざまなアルゴリズムを使用して、機械がデータの詳細な統計分析を実行し、自己学習できるようにします。機械学習を使用して、人工知能システムは帰納的推論と意思決定機能を獲得し、ディープラーニングによりこの機能がさらに高いレベルに押し上げられました。
  • ディープラーニングは、人工ニューラルネットワークシステムに属する機械学習アルゴリズムの一種です。現在、多くの応用分野で最も優れたパフォーマンスを発揮する機械学習は、人間の脳の構造を模倣したニューラルネットワーク設計に基づいています。これらのコンピューターシステムは、完全に自律的にルールを学習、発見、適用できます。他の方法と比較して、ディープラーニングは機械が独立して考え、より複雑な問題を解決する上で優れたパフォーマンスを発揮できるようにする方法です。

つまり、人工知能は社会発展の重要な原動力であり、機械学習、特にディープラーニング技術は人工知能発展の中核であり、この3つの関係は包摂と包摂される関係です。以下のように表示されます。


2. 機械学習: 人工知能を実装する効率的な方法

機械学習とは、広義では、直接プログラミングでは実現できない機能を機械が学習して実行できるようにする手法です。しかし、実際的には、機械学習は経験やデータを通じてアルゴリズムを改善する研究です。アルゴリズムにより、機械は大量の履歴データからパターンを学習し、特定のパターンを取得し、このモデルを使用して未来を予測することができます。学習プロセス中に機械が処理するデータが多いほど、予測結果はより正確になります。

機械学習は人工知能の研究において非常に重要な役割を果たします。これは人工知能の中核であり、コンピューターをインテリジェントにする基本的な方法です。その応用は人工知能のあらゆる分野に広がっています。機械学習の研究は1950年代から始まりました。ニューロンモデルと関数近似理論に基づく初期の研究方法から、記号計算に基づくルール学習と決定木学習の出現、その後の認知心理学における帰納、解釈、類推などの概念の導入、最新の計算学習理論と統計学習の台頭まで、機械学習は常に関連分野の実用化において主導的な役割を果たしてきました。多くの成果が得られ、主に記号学習、接続学習、統計学習を中心に多くの研究方向が差別化されました。

01 機械学習の構造モデル

機械学習の本質は、問題を解決するために使用される一連の命令であるアルゴリズムです。プログラマーがコンピューターに新しいタスクを実行するよう指示するために開発したアルゴリズムは、今日の高度なデジタル世界の基礎となっています。コンピュータ アルゴリズムは、特定の指示とルールに従って、大量のデータを情報とサービスに整理します。機械学習は、プログラマーからの新しいステップバイステップの指示を必要とせずに、コンピューターがデータから学習できるようにする指示をコンピューターに与えます。

機械学習の基本的なプロセスは、学習アルゴリズムにトレーニングデータを提供することです。次に、学習アルゴリズムはデータからの推論に基づいて新しいルールのセットを生成します。これにより、本質的には機械学習モデルと呼ばれる新しいアルゴリズムが生成されます。同じ学習アルゴリズムでも、異なるトレーニング データを使用することで異なるモデルを生成できます。データから新しい指示を推論することは、機械学習の中心的な強みです。また、データの重要な役割も強調されています。アルゴリズムのトレーニングに利用できるデータが増えるほど、アルゴリズムはより多くのことを学習できます。実際、AI の最近の進歩の多くは、学習アルゴリズムの急進的な革新によるものではなく、現在蓄積されている膨大な量の利用可能なデータによるものです。

02 機械学習ワークフロー

  • ステップ1 データを選択

まず、元のデータはトレーニング データ、検証データ、テスト データの 3 つのグループに分割されます。

  • ステップ2 データモデリング

トレーニング データを使用して、関連する機能を使用するモデルを構築します。

  • ステップ3: モデルを検証する

検証データを使用して、既に構築されたデータ モデルに入力します。

  • ステップ4 モデルをテストする

テスト データを使用して検証済みモデルのパフォーマンスを確認します。

  • ステップ5 モデルを使用する

完全にトレーニングされたモデルを使用して新しいデータの予測を行います。

  • ステップ6 データを選択

より多くのデータ、さまざまな機能、または調整されたパラメータを使用することで、アルゴリズムのパフォーマンスを向上させます。

03 機械学習の発展の重要な基礎

  • 膨大なデータ

人工知能のエネルギー源は、継続的に得られるデータです。機械学習は、膨大な量のデータで自らをトレーニングすることによってのみ、ますます複雑化するタスクを完了するための新しいルールを開発することができます。現在、私たちは常に大量のデータを生成しており、データ保存コストの削減により、このデータを簡単に利用できるようになりました。

  • スーパーコンピューティング

強力なコンピューターとインターネット接続を介したリモート処理機能により、膨大な量のデータを処理できる機械学習技術が可能になりました。 ALPHGOがイ・セドルとの対戦で歴史的な勝利を収めることができた理由は、1920個のCPUと280個のGPUというハードウェア構成と深く関係しており、機械学習には計算能力が極めて重要であることを示しています。

  • 優れたアルゴリズム

機械学習では、学習アルゴリズムによって、コンピューターがデータから学習して新しい指示(アルゴリズム モデル)を推論できるようにするルールが作成されます。これは、機械学習の中心的な利点でもあります。新しい機械学習技術、特にディープラーニングとしても知られる階層型ニューラルネットワークは、新しいサービスを生み出し、人工知能の他の分野への投資と研究を促進しました。

04 機械学習アルゴリズムの分類

機械学習は、一般的に、学習の形式の違いに基づいて 3 つのカテゴリに分類されます。

  • 教師あり学習

学習アルゴリズムには、ラベル付けされたデータと目的の出力が提供されます。各入力に対して、学習者に応答のターゲットが提供されます。教師あり学習は主に AI に既存の知識を迅速かつ効率的に教えるために使用され、分類や回帰の問題を解決するために使用されます。一般的なアルゴリズムには、決定木、Adaboost アルゴリズム、人工ニューラル ネットワーク (ANN) アルゴリズム、SVM (サポート ベクター マシン) アルゴリズムなどがあります。

  • 教師なし学習

学習アルゴリズムに提供されるデータにはラベルが付いておらず、アルゴリズムは入力データ内のパターンを認識する必要があり、基本的には入力データを解釈して次の入力に使用するために使用するモデルを構築します。実際には、多くのデータ セットにはラベル付けされていないサンプルが多数含まれますが、ラベル付けされたサンプルは比較的少数です。そのまま放棄すると、モデルの精度が大幅に低下することになります。この問題の解決策は、多くの場合、ラベル付きサンプルを組み合わせ、推定方法を使用してラベルなしサンプルを疑似ラベル付きサンプルに変換することです。そのため、教師なし学習は教師あり学習よりも習得が困難です。これは主にクラスタリングと次元削減の問題を解決するために使用されます。一般的なアルゴリズムには、クラスタリング アルゴリズム、K 平均法アルゴリズム、期待値最大化 (EM) アルゴリズム、アフィニティ プロパゲーション クラスタリング アルゴリズム、階層型クラスタリング アルゴリズムなどがあります。

  • 強化学習

アルゴリズムは動的な環境と対話し、環境からのフィードバックを入力として受け取り、学習を通じて目標を達成するための最適なアクションを選択します。強化学習の背後にある数学は、教師あり学習/教師なし学習とは少し異なります。教師あり学習/教師なし学習では統計がより多く適用されますが、強化学習では離散数学や確率過程などの数学的手法がより多く組み合わされます。一般的なアルゴリズムには、TD(λ) アルゴリズム、Q 学習アルゴリズムなどがあります。

3. BIにおける機械学習の応用:自然言語分析

機械学習の普及に伴い、会話型ユーザーインタラクションインターフェースが業界で徐々に話題になってきました。 Natural Language to SQL (NL2SQL) はそのようなテクノロジーです。ユーザーの自然なステートメントを実行可能な SQL ステートメントに変換することで、ビジネス ユーザーが SQL 言語を学習する手間を省き、自然言語を BI 分野にうまく適用できるようにします。

Smartbi の自然言語分析では、NL2SQL テクノロジーを使用して、自然言語をニューラル ネットワークを通じてコン​​ピューターが認識できるデータベース クエリ言語に変換します。ユーザーが音声またはキーボードで入力すると、「AI Smart Wheat」は入力された自然言語を言語メタモデルの形式に変換します。Wheatに組み込まれた知識抽出アルゴリズムとディープラーニングモデルにより、メタモデルは機械が理解できるデータベース言語に変換されます。最後に、Smartbi のプリセット クエリ エンジンとグラフィック エンジンを使用すると、必要なクエリ結果をすばやく正確に見つけ、グラフィック出力を自動的に生成し、Smartbi でクエリ結果を組み合わせてさらに分析することもできます。

4. BIにおける機械学習の応用:データマイニング

データマイニングでは、機械学習技術を使用して大量のデータから貴重な情報を抽出します。従来のデータ分析と比較して、データマイニングではデータ間の未知の関係性が明らかになり、精密マーケティング、売上予測、顧客離脱警告などの予測分析を実行できます。

データマイニングには高い学習しきい値がありますが、さまざまなアルゴリズムを試して最も成功するアルゴリズムを見つけることができる機械学習モデルの自動構築をサポートするソフトウェアツールが増えています。トレーニング データに対して予測を行うための最適なモデルを見つけたら、それをデプロイして新しいデータに対して予測を行うことができます。たとえば、Smartbi のデータ マイニング プラットフォームは、データの前処理、アルゴリズムの適用、モデルのトレーニング、評価、展開を含む完全なライフ サイクル管理を、単一のインターフェイスでの視覚的な操作を通じて実装します。同時に、分類、クラスタリング、関連付け、回帰の 5 つのカテゴリに数十のアルゴリズム ノードがあり、自動推奨をサポートし、パラメータも自動的に調整できます。

機械学習は、人工知能アプリケーションにおけるもう一つの重要な研究分野です。現在、機械学習の分野では大きな技術的進歩が遂げられていますが、機械学習の発展の現状は、自律学習能力がまだ非常に限られており、人間の学習能力にはまだ達していません。同時に、機械学習の発展は大きな課題にも直面しています。一般化能力、速度、理解可能性、データ活用能力などの技術的な困難を克服する必要があります。しかし、良いニュースとしては、コンピューターの専門家が、人間のような複雑な神経分析アルゴリズムの開発で大きな進歩を遂げていることです。機械が効率的な学習能力を発揮できるように、多くの自律アルゴリズムとモデルを開発することができました。機械学習に関するさらなる徹底的な研究は、必然的に人工知能技術の徹底的な応用と発展を促進するでしょう。

<<:  人工知能にはどのような専攻が含まれますか?どのような関連専攻を選択できますか?

>>:  ビデオ分析が物流と製造業の業務と安全性をどのように改善するか

ブログ    
ブログ    

推薦する

マイクロソフトのGitHubはAIを使ってソフトウェア開発者の心を理解しようとしている

コード共有サービス GitHub は、ソフトウェア開発者向けの人工知能アシスタント「GitHub C...

機械学習は言語から意味を抽出するのにまだ苦労している

私たちは幼児期から言語を吸収し始めます。簡単な単語は1年目か2年目に出てきます。 6 歳までに語彙は...

...

マイクロソフトが人工知能の小規模スタートアップBonsaiを買収

海外メディアの報道によると、マイクロソフトは水曜日、小規模な人工知能スタートアップ企業であるボンサイ...

マスク氏はAIが人間を超えると述べ、それを信じない人は単に賢いだけだと語る

北京時間7月23日、テスラのCEOイーロン・マスク氏は水曜日、人工知能(AI)の将来についての懸念を...

ガベージクリーニングは必須 - Java ガベージコレクションアルゴリズム

1. Javaガベージコレクションアルゴリズムの核となる考え方Java 言語は、使用中のオブジェクト...

グーグルは、人工知能の進歩により飛行機による地球温暖化への影響を大幅に軽減できると主張

グーグルは8月14日、飛行機による気候への影響を大幅に軽減できる人工知能の分野で大きな進歩を遂げたと...

2019年のAI業界の再編:疑似AI企業は淘汰される

起業プロジェクトの数、資金調達額、資金調達のスピードなど、AIは近年間違いなく注目の産業です。しかし...

オーディオソーシャルネットワーキングでの音声変更にはどのようなアルゴリズムが使用されていますか?

モバイルインターネット技術のサポートにより、オーディオソーシャルネットワーキングは、さまざまなシナリ...

HumanGaussian オープンソース: ガウススプラッティングに基づく高品質な 3D 人体生成のための新しいフレームワーク

3D 生成の分野では、テキスト プロンプトに基づいて高品質の 3D 人間の外観と形状を作成することは...

勉強!機械学習アルゴリズムの長所と短所の概要

目次正規化アルゴリズムアンサンブルアルゴリズム決定木アルゴリズム回帰人工ニューラルネットワークディー...

AIが70年間で急成長した理由が明らかに!タイム誌の4枚の写真がアルゴリズムの進化の謎を明らかにする

過去 10 年間の AI システムの進歩のスピードは驚くべきものでした。 2016年の囲碁対局でアル...

人工知能か、それとも人工的な愚かさか?予想外の大規模なアルゴリズムのロールオーバー

あなたはアルゴリズムを信じますか?答えが何であれ、私たちの生活はアルゴリズムによって完全に変わりまし...

AIが普及するにつれ、テクノロジー企業には「最高バイアス責任者」が必要だ

王立歴史協会は最近、人工知能アルゴリズムを使用した初の研究で、英国の労働力に「大きな性差別」があるこ...