機械学習は計算知能とも呼ばれ、近年いくつかの技術的障壁を突破し、ロボット工学、機械翻訳、ソーシャルネットワーキング、電子商取引、さらには医療やヘルスケアなどの分野で大きな進歩をもたらしました。機械学習は、学習コンピューティング技術を開発し、知識を自動的に獲得できるシステムを構築することを目的とした人工知能の分野です。 学習システムとは、過去の問題をうまく解決して得た経験に基づいて意思決定を行うコンピュータ プログラムです。それほど古いものではありませんが、さまざまな学習アルゴリズムがあり、この分野はコンピューティング分野で最もホットな分野の 1 つであり、新しい技術やアルゴリズムが定期的にリリースされています。 機械学習と人工知能 多くの人は機械学習と人工知能は同じことを意味すると考えていますが、これは完全に正確ではありません。人工知能にはいくつかの定義があり、その中には機械学習という広い概念も含まれます。広く受け入れられている定義は、AI は問題を解決するために人間の行動に依存するコンピューティング メカニズムで構成されているというものです。言い換えれば、この技術により、コンピューターは人間のように「考え」ながらタスクを実行できるようになります。 人間はデータを分析し、その中のパターンや傾向を発見し、そこからより情報に基づいた分析を行い、その結論を使って意思決定を行うことができます。ある意味では、人工知能も同じ原理に従います。一般的に、人はより多くのタスクを完了すればするほど、より熟練した人になります。これは学習能力があることの結果です。手順を頻繁に繰り返したり実行したりすることは、人にとって一種のトレーニングです。 AI システムでも同様のことが起こります。公開されているデータや専用プラットフォームに記録されたデータが、AI アルゴリズムのトレーニングとして使用されます。 では、トレーニングはどのように行われるのでしょうか? この目的のためのアルゴリズムはいくつかあります。それはすべて、アプリケーションと、その背後にある組織や人々に依存します。ここで最も重要なことは、この時点で機械学習が意味をなすということを知ることです。 機械学習とは何ですか? 機械学習もさまざまな定義を持つ概念ですが、本質的には、機械学習は人間の介入を最小限に抑えながら、経験に基づいて動作を自律的に変更できるシステムです。この動作修正は基本的に、タスクのパフォーマンスを向上させること、またはアプリケーションに応じてシナリオに最も適切な決定を下すことを目的とした論理ルールを確立することから構成されます。これらのルールは、分析されたデータ内のパターン認識に基づいて生成されます。 たとえば、ユーザーが検索エンジンに「brave」という単語を入力すると、サービスは一連のパラメータを分析して、2 つの意味を持つ可能性がある enraged や brave に似た結果を表示するかどうかを決定する必要があります。利用可能な多くのパラメータの中には、ユーザーの検索履歴があります。たとえば、数分前に「brave」を検索した場合、2 番目の意味が表示される可能性が最も高くなります。これは非常に単純な例ですが、機械学習のいくつかの重要な側面を示しています。 システムは大量のデータに基づいて分析されることが重要であり、検索者は数百万回の訪問を受けるため、この基準をあきらめざるを得ないため、これはトレーニング基準となります。 もう 1 つの側面は、継続的なデータ入力であり、これにより新しい標準の識別が容易になります。 「brave」という単語が、ある文化運動に関連する俗語になったとします。機械学習を通じて、検索エンジンは、その単語の新しい意味を示すパターンを認識できるようになり、しばらくすると、その単語を検索結果に反映できるようになります。 機械学習にはいくつかのアプローチがあります。よく知られているアプローチの 1 つは「ディープラーニング」と呼ばれ、大量のデータが多層の人工ニューラル ネットワークに入力され、画像内のオブジェクトの識別などの複雑な問題を解決する脳のニューロンの構造にヒントを得たアルゴリズムが採用されています。 機械学習の例 機械学習の使用は多種多様なアプリケーションに進化しており、今日私たちが持つ技術リソースの多くは人工知能と機械学習に基づいています。 自律型データベース - 機械学習を使用して、自律型データベースは、以前は管理者 (DBA) が実行していたいくつかのタスクを処理します。これにより、経験豊富な担当者が他のアクティビティを処理できるようになり、人為的エラーによるアプリケーションの使用不可のリスクが軽減されます。 決済システムにおける詐欺行為との戦い - クレジットカードやその他の決済方法に対する詐欺行為は毎秒行われています。機械学習により、不正行為防止システムは、不正行為が成功する前に、これらのほとんどを識別できるようになります。 テキスト翻訳 – 翻訳では、文脈、地域表現、その他のパラメータを考慮する必要があります。機械学習のおかげで、自動翻訳はますます正確になってきています。 コンテンツの推奨 – ビデオおよびオーディオ ストリーミング プラットフォームは、機械学習を使用して、ユーザーが視聴または拒否したコンテンツの履歴を分析し、ユーザーの好みに合った推奨を提供します。 マーケティングと販売 – 過去の購入履歴に基づいて製品やサービスを推奨する Web サイトでは、機械学習を使用して購入履歴を分析し、顧客が興味を持つ可能性のある他のアイテムを宣伝します。データを収集し、分析し、それを使用してショッピング体験をカスタマイズしたり、マーケティング キャンペーンを実施したりする能力こそが、小売業の未来です。 輸送 – パターンと傾向を特定するためにデータを分析することは、信頼性と収益性を向上させるために、より効率的なルートを開発し、潜在的な問題を予測することに依存している輸送業界にとって非常に重要です。機械学習のデータモデリングと分析の側面は、運輸会社、公共交通機関、および業界の他の組織にとって重要なツールです。 石油とガス – 機械学習は、新しいエネルギー源の発見、土壌中の鉱物の分析、製油所のセンサーの故障の予測、石油の流通の高速化に役立ち、より効率的かつ経済的になります。この業界における機械学習アプリケーションの数は膨大であり、増え続けています。 ヘルスケア - 医療従事者が患者データにリアルタイムでアクセスできるウェアラブル デバイスやセンサーの登場により、機械学習はヘルスケア分野で成長傾向にあります。この技術は、医療専門家がデータを分析して傾向や警告を特定し、診断や治療を改善するのにも役立ちます。 機械学習で使用される手法 最も広く採用されている 2 つの機械学習アプローチは、教師あり学習と教師なし学習ですが、これらが唯一のアプローチではありません。 教師あり学習アルゴリズムは、望ましい出力がわかっているラベル付きの例を入力として使用してトレーニングされます。たとえば、デバイスには「F」(失敗) または「E」(実行済み) というラベルの付いたデータ ポイントがある場合があります。学習アルゴリズムは、一連の入力とそれに対応する正しい出力を受け取り、実際の出力と正しい出力を比較することでエラーを見つける方法を学習します。次に、決済モデルを変更します。教師あり学習では、分類、回帰、勾配ブースティングなどの方法を通じて、基準を使用して追加のラベルなしデータからラベル値を予測します。教師あり学習は、過去のデータを使用して将来の起こりうる出来事を予測するアプリケーションでよく使用されます。たとえば、クレジットカード取引が不正である可能性が高い場合や、どの保険契約者が保険金を請求する可能性が高いかを予測できます。 教師なし学習は、履歴ラベルを持たないデータに使用されます。 「正解」はシステムに報告されません。アルゴリズムは、何が表示されるかを判断する必要があります。目標は、データを探索し、その中に何らかの構造を見つけることです。教師なし学習はトランザクション データに適用できます。たとえば、類似した属性を持つ顧客グループを識別して、マーケティング キャンペーンで同様に扱ったり、異なる顧客グループを区別する主要な属性を見つけたりすることができます。一般的に使用される手法には、自己組織化マップ、近傍マップ、k-means グループ化、特異値への分解などがあります。これらのアルゴリズムは、テキスト トピックをセグメント化したり、アイテムを推奨したり、データの違いを識別したりするためにも使用されます。 半教師あり学習は、教師あり学習と同じ用途に使用されますが、トレーニングのためにラベル付きデータとラベルなしデータの両方を処理します。通常、ラベル付きの少量のデータと大量のラベルなしデータが使用されます (ラベルなしデータの方が安価で、取得にかかる労力も少ないため)。このタイプの学習は、分類、回帰、予測などの方法で使用できます。半教師あり学習は、ラベルに関連するコストが高すぎて完全にラベル付けされたトレーニング プロセスを実装できない場合に役立ちます。典型的な例としては、ウェブカメラでの顔の認識が挙げられます。 強化学習は、ロボット工学、ゲームプレイ、ナビゲーションなどでよく使用されます。これにより、アルゴリズムは試行錯誤を通じて、どのアクションがより大きな報酬につながるかを発見します。このタイプの学習には、エージェント (学習者または意思決定者)、環境 (エージェントが対話するすべてのもの)、アクション (エージェントが実行できること) という 3 つの主要なコンポーネントがあります。目標は、エージェントが指定された期間内に期待される報酬を伴うアクションを選択できるようにすることです。エージェントが適切なポリシーに従えば、目標をより早く達成できます。したがって、強化学習の焦点は優れた戦略を見つけることにあります。 これらの方法はすべて、意思決定に使用できる洞察、パターン、関係性を抽出するという同じ目標を持っていますが、アプローチと機能はそれぞれ異なります。 データ マイニングは、データから洞察を抽出するためのさまざまな方法のスーパーセットとして考えることができます。従来の統計手法と機械学習の両方が含まれる場合があります。データ マイニングでは、複数の分野の方法を適用して、データ内のこれまで知られていなかったパターンを識別します。これには、統計アルゴリズム、機械学習、テキスト分析、時系列分析、その他の分析領域が含まれる場合があります。データ マイニングには、データの保存と操作の研究と実践も含まれます。 機械学習では、データの構造を理解することが目標です。したがって、統計モデルの背後には数学的に証明された理論がありますが、そのためにはデータが特定の仮定を満たすことも必要です。機械学習は、人々がその構造がどのようなものか知らなくても、コンピューターを使用してデータの構造を調べる能力から発展しました。機械学習モデルのテストは、新しいデータにおけるエラーの検証であり、帰無仮説を証明するための理論的なテストではありません。機械学習では通常、反復的なアプローチを使用してデータから学習するため、簡単に自動化できます。信頼できる標準が見つかるまで、これらの手順がデータを通じて実行されます。 ディープラーニングは、コンピューティング能力の進歩と特殊なタイプのニューラル ネットワークを組み合わせて、大量のデータ内の複雑なパターンを学習します。ディープラーニング技術は現在、画像内の物体や音声内の単語を認識するために使用される最も先進的な技術です。研究者たちは現在、パターン認識の成功を、機械翻訳、医療診断、その他多くの社会的およびビジネス上の問題など、より複雑なタスクに適用しようとしています。 人工知能と機械学習の概念は長い間存在してきましたが、主流のアプリケーションの一部になり始めています。しかし、まだ初期段階です。 AI と機械学習が有用かつ優れたものであれば、より適切にトレーニングされ、改善されるにつれて、その実装はより効果的になります。 |
<<: 中国の学部生が新しいAIアルゴリズムを提案:その速度はAdamに匹敵し、パフォーマンスはSGDに匹敵する
>>: 2019年自動車向け人工知能コンピューティング技術と市場動向
[[437808]]人間とコンピュータのゲームは長い歴史があり、人工知能の主要技術を検証するための主...
大規模言語モデル (LLM) は、さまざまな自然言語タスクで優れたパフォーマンスを発揮しています。た...
1. CPUとGPUの比較CPUは複数の機能を備えた優れたリーダーです。その利点は、強力なスケジュ...
ヘルスケア業界とそのサービス技術が急速に発展するにつれて、大量のデータと情報が生成されます。統計レポ...
全米技術アカデミー (NAE) の会員リストが発表されました。 「狂人」マスク氏も選ばれたとは誰が予...
本日は、シンガポール科学技術研究庁 (A*STAR) と南洋理工大学 (シンガポール) が AAAI...
DeepRec(PAI-TF)は、アリババグループの統合オープンソース推奨エンジン(https://...
予想外かもしれませんが、消費者のかなりの部分は、サイバーセキュリティを生身のサイバーセキュリティ専門...
股関節置換手術にはどれくらいの時間がかかりますか?これは病院にとって学術的な問題ではありません。 2...
組織が高度な分析ソリューションを検討している場合、IT チームと管理チームはおそらく何らかの調査と分...