企業による AI の利用を複雑にする要因の 1 つは、このトピックに複数の異なる基盤技術が含まれることです。これらのテクノロジーのほとんどは、さまざまな代替機能を実行できます。テクノロジと機能の組み合わせは非常に複雑です。表 1-1 には、7 つの主要なテクノロジがリストされており、各テクノロジの簡単な説明と、それらが実現できる一般的な機能やアプリケーションが示されています。 表1-1 人工知能の主要技術 この記事では、この表にある各テクノロジとその機能について詳しく説明します。また、各技術が商用 AI の世界でどれほど一般的であるかについても説明します。私の本業はビジネススクールの教授(さまざまな企業と連携)ですが、人工知能に関するコンサルティング業務も手掛けるデロイトの戦略および分析部門のシニアコンサルタントでもあります。 以下に、各テクノロジーとその機能について詳しく説明します。 01~03 統計的機械学習、ニューラルネットワーク、ディープラーニング 機械学習は、モデルをデータに自動的に一致させ、モデルをトレーニングすることでデータから「学習」するテクノロジーです。機械学習は AI の最も一般的な形式の 1 つです。 2017 年にデロイトが実施した、AI の導入を検討している企業のマネージャー 250 名を対象とした「認知の理解」調査では、調査対象企業の 58% がビジネスに機械学習を導入していました。これは多くの人工知能手法の中核技術であり、多くのバージョンがあります。企業内外のデータ(特に外部データ)が爆発的に増加しているため、企業がこのデータを完全に理解するには機械学習を導入することが現実的かつ必要になっています。 ニューラル ネットワークは、1960 年代に登場した、より洗練された形式の機械学習であり、クレジット取引が不正であるかどうかを判断するなどの分類アプリケーションに使用されます。入力、出力、変数の重み、または入力と出力を関連付ける「機能」の観点から問題を分析します。これはニューロンが信号を処理する方法に似ていますが、脳と比較するのは少し無理があります。 最も複雑な形式の機械学習には、多くのレベルの特徴と変数を使用して結果を予測するディープラーニング、つまりニューラル ネットワーク モデルが含まれます。現在のコンピュータ アーキテクチャの処理速度が高速化しているため、このようなモデルは数万の特徴を処理できます。 以前の形式の統計分析とは異なり、ディープラーニング モデルの各機能は、通常、人間の観察者にとってほとんど意味を持ちません。その結果、モデルの使用や解釈が難しくなります。デロイトの調査では、ディープラーニング技術を使用している人はわずか34%でした。 ディープラーニング モデルでは、バックプロパゲーションと呼ばれる手法を使用して、モデルを通じて予測を行ったり出力を分類したりします。 AI 技術は、囲碁で人間の専門家に勝つことから、バックプロパゲーションによるディープラーニングを使用してインターネット画像を分類することまで、この分野における最近の多くの進歩を推進してきました。トロント大学とグーグルのジェフリー・ヒントンは、バックプロパゲーションに関する初期の研究のおかげで、しばしばディープラーニングの父と呼ばれています。 機械学習で使用されるアルゴリズムは数百種類ありますが、そのほとんどはやや難解です。これらは、勾配ブースティング(以前のモデルのエラーに対処し、予測機能や分類機能を向上させるモデルを構築する方法)からランダム フォレスト(決定木モデルのアンサンブルであるモデル)まで多岐にわたります。 DataRobot、SAS、Google の AutoML など、さまざまなアルゴリズムを試して最も成功するアルゴリズムを見つける機械学習モデルの自動構築を可能にするソフトウェア ツールが増えています。トレーニング データを使用して予測や分類を行うための最適なモデルを見つけたら、それをデプロイして、新しいデータに対して予測や分類を行うことができます (スコアリング プロセスと呼ばれることもあります)。 使用されるアルゴリズムに加えて、機械学習のもう 1 つの重要な側面は、モデルがどのように学習するかです。教師あり学習モデル (ビジネスで使用される最も一般的なタイプ) は、ラベル付けされた出力を持つ一連のトレーニング データを使用して学習します。 たとえば、銀行詐欺を予測しようとする機械学習モデルは、詐欺を構成する要素を明確に示すシステムでトレーニングする必要があります。実際の詐欺の発生頻度は 10 万分の 1 に過ぎない可能性があるため、これは容易なことではありません (不均衡な分類問題と呼ばれることもあります)。 教師あり学習は、スコアリング モデルで展開される回帰分析などの従来の分析手法と非常によく似ています。回帰分析では、値が既知で出力に関連する一連の入力変数を使用して、既知の結果を予測するモデルを作成することが目標です。モデルが開発されると、同じ入力変数の既知の値を使用して未知の結果を予測するために使用できます。 たとえば、患者の年齢、身体活動レベル、カロリー消費量、BMI に基づいて、糖尿病を発症する可能性を予測する回帰モデルを開発できます。 私たちは、糖尿病と診断された患者と糖尿病ではない患者の両方を対象にモデルを構築します(通常は利用可能なすべてのデータを使用して回帰モデルを構築します)。適切な予測回帰モデルが見つかったら、それを使用して、新しいデータセットに基づいて未知の結果(入力変数が特定のレベルに達したときに患者が糖尿病を発症する可能性)を予測できます。その後のアクティビティ(回帰分析と機械学習)はスコアリングと呼ばれます。 回帰プロセスは、次の点を除いて、教師あり機械学習と同じです。
一般に、ラベル付けされていないデータからパターンを検出し、未知の結果を予測する、教師なしモデルの開発はより困難です。 強化学習は 3 番目のバリエーションであり、機械学習システムに目標が与えられ、その目標に向かう各ステップに対して何らかの形の報酬を受け取ります。これはゲームをプレイする際に非常に便利ですが、大量のデータも必要になります (多くの場合、この方法が機能するにはデータが多すぎます)。 教師あり機械学習モデルは通常、継続的に学習するわけではないことを指摘することが重要です。一連のトレーニング データから学習し、新しいモデルをトレーニングするために新しい一連のトレーニング データが使用されない限り、同じモデルを引き続き使用します。 機械学習モデルは統計に基づいており、その増分値を明確にするには従来の分析と比較する必要があります。これらは、人間の仮定と回帰分析に基づく従来の「手作り」の分析モデルよりも正確である傾向がありますが、より複雑で解釈が困難でもあります。従来の統計分析と比較すると、自動化された機械学習モデルは作成が簡単で、データのより詳細な情報を明らかにすることができます。 学習に必要なデータの量を考えると、ディープラーニング モデルは画像認識や音声認識などのタスクに非常に優れています (これらのタスクに対する従来の自動化されたアプローチよりもはるかに優れており、一部の領域では人間の能力に近づくか、それを上回ります)。 04 自然言語処理 人間の言語を理解することは、1950 年代以来、人工知能研究者の目標となってきました。この分野は自然言語処理 (NLP) と呼ばれ、音声認識、テキスト分析、翻訳、生成、その他の言語関連の目標などのアプリケーションが含まれます。 Know Cognition の調査によると、53% の企業が NLP を使用しています。 NLP には、統計 NLP とセマンティック NLP という 2 つの基本的なアプローチがあります。統計的 NLP は機械学習に基づいており、そのパフォーマンスはセマンティック NLP よりも速く向上しています。学習するには大規模な「コーパス」または言語システムが必要です。 たとえば、翻訳では大量の翻訳テキストが必要であり、統計分析により、スペイン語とポルトガル語の「amor」という単語は、英語の「love」という単語と統計的に高い相関関係にあることがわかります。これは少し強引なアプローチですが、通常は非常に効果的です。 セマンティック NLP は過去 10 年間で唯一の現実的な選択肢であり、単語、文法、概念の関係を使用してシステムを効果的にトレーニングできれば、非常に効果的になります。 言語トレーニングと知識エンジニアリング (通常は特定のドメインの知識グラフの作成を指します) は、労力と時間がかかります。ただし、単語とフレーズの関係に関する知識体系またはモデルの開発が必要です。セマンティック NLP モデルを作成するのは困難ですが、一部のインテリジェント エージェント システムではすでにこのアプローチが使用されています。 NLP システムのパフォーマンスは 2 つの方法で測定する必要があります。 1 つは、話し言葉のどの程度を理解できるかを確認することです。ディープラーニング技術の発展により、この指標は向上し続け、95%を超えることもよくあります。 NLP を測定する別の方法は、NLP が何種類の質問に答えられるか、または何種類の問題を解決できるかを確認することです。これには通常、セマンティック NLP が必要ですが、この分野では大きな技術的進歩がないため、質問応答システムと問題解決システムはどちらも特定のコンテキストに基づいており、トレーニングする必要があります。 IBM Watson は Jeopardy! の質問に非常にうまく答えますが、(通常は手間のかかる方法で) トレーニングしない限り、Wheel of Fortune の質問には答えられません。将来的にはディープラーニングが問題解決に応用されるかもしれませんが、まだそこまでには至っていません。 05 ルールベースのエキスパートシステム 1980年代には、AIの主流技術は「if-then」ルールに基づくエキスパートシステムであり、その頃ビジネス分野で広く使用され始めました。現在ではAIはそれほど進んでいないと考える人が多いようですが、2017年のデロイトの「認知を理解する」調査では、AIを導入している米国企業の49%がこの技術を使用していることが分かりました。 エキスパート システムでは、特定の知識領域で一連のルールを構築するために、人間の専門家と知識エンジニアが必要です。たとえば、保険の引受や銀行の信用引受でよく使用されます (ただし、Fogg's でのコーヒー焙煎や Campbell のスープ缶でのスープの混合などの難解な分野でも使用されます)。 エキスパートシステムはある程度まではうまく機能し、理解しやすいものです。ただし、ルールの数が多くなると (通常は数百以上)、またルールが互いに矛盾し始めると、機能しなくなる傾向があります。そして、知識領域が変化すると、ルールを変更するのは困難で時間がかかります。 ルールベースのシステムは初期の全盛期からあまり進歩していませんが、保険や銀行など、ルールベースのシステムを多用する業界では、新世代のルールベースのテクノロジーに期待が寄せられています。研究者やベンダーは、新しいデータやルール エンジンと機械学習の組み合わせに基づいてルールを継続的に変更する「適応型ルール エンジン」について議論し始めていますが、まだ広く利用できる状態にはなっていません。 06 物理ロボット 世界中で毎年 20 万台以上の産業用ロボットが設置されており、物理的なロボットはすでによく知られています。米国のUnderstanding Cognition調査では、32%の企業が何らかの形で物理的なロボットを使用しています。彼らは、工場や倉庫などで製品の持ち上げ、再配置、溶接、組み立てなどの作業を行います。歴史的に、これらのロボットは特定のタスクを実行するために詳細なコンピュータ プログラムによって制御されてきました。 しかし、今日のロボットは人間と協力する能力がますます高まっており、事前に決められたタスクに従ってロボットの部品を動かすだけで、トレーニングも容易になっています。また、追加の AI 機能が「脳」(実質的にはオペレーティング システム)に組み込まれるにつれて、より賢くなります。時間が経つにつれて、AI の他の分野で見られる改善が物理的なロボットにも取り入れられるようになるでしょう。 07 ロボティックプロセスオートメーション ロボティック プロセス オートメーション (RPA) テクノロジーは、スクリプトやルールに従って作業する人間のユーザーと同じように、構造化されたデジタル タスク (情報システムに関連するタスクなど) を実行します。 RPA はそれほどインテリジェントではないため、AI/認知技術の範疇に入るかどうかについては議論があります。しかし、RPA システムは非常に人気があり、自動化され、ますますインテリジェントになっているため、私は RPA も AI の世界の一部だと考えています。 これを「デジタル労働者」と呼ぶ人もいますが、他の形態の AI と比較すると、安価で、プログラミングが容易で、動作が透明です。マウスを操作でき、フローチャートが理解でき、if-then のビジネス ルールを理解できれば、RPA を理解して開発することもできます。これらのシステムは、他のアプローチ (プログラミング言語で独自のプログラムを開発するなど) よりも構成と実装が簡単です。 RPA は実際にはロボットではなく、サーバー上のコンピューター プログラムにすぎません。これは、ワークフロー、ビジネス ルール、および情報システム統合の「プレゼンテーション層」の組み合わせに依存し、システムの半インテリジェントなユーザーとして機能します。 RPA をスプレッドシートのマクロと比較する人もいますが、それは公平な比較ではないと思います。RPA ははるかに複雑なタスクを実行できます。他の人は、これをビジネス プロセス管理 (BPM) ツールと比較します。BPM ツールには、ある程度のワークフロー機能がありますが、通常はビジネス プロセスを実際に自動化するのではなく、文書化して分析するように設計されています。 一部の RPA システムには、すでにある程度のインテリジェンスが備わっています。ロボットは、人間の同僚が仕事をしているところ(たとえば、よくある顧客の質問に答えるところ)を「観察」し、その行動を真似することができます。プロセス自動化とマシンビジョンを組み合わせるものもあります。物理的なロボットと同様に、RPA システムも徐々にインテリジェント化が進んでおり、その動作をガイドするために他の種類の AI 技術が使用されています。 私はこれらの技術を個別に説明しましたが、実際には、これらの技術はますます組み合わせられ、統合されています。しかし、現時点では、ビジネス上の意思決定者にとって、どのようなテクノロジーがどのようなタスクを達成できるかを理解することが非常に重要です。 Global Inc. の CIO である Krishna Nathan 氏は、2018 年の主な優先事項の 1 つとして、「AI で何ができて何ができないかを関係者に理解してもらい、AI を適切に活用できるようにする」ことを挙げています。おそらく将来的には、これらの技術は複雑に絡み合うようになり、そのような理解はもはや必要なくなるか、あるいは実現不可能になるかもしれません。 |
<<: 新しいヘルスケアソリューション: ヘルスケアにおける AI と IoT が認知症患者をどのように支援できるか
人工知能 (AI) は誕生以来長い道のりを歩み、大きな進歩を遂げています。これは、Amazon や ...
2月6日、崑崙万為はMoE大規模言語モデルの新バージョン「天宮2.0」と「天宮AIスマートアシスタン...
【51CTO.com クイック翻訳】はじめに列車が走行しているとき、線路には大きな圧力がかかることが...
[51CTO.com からのオリジナル記事] ロボット製造は現在、知能ロボットの時代である 2.0 ...
今年の618が終わったばかりですが、宅配業者だけでなく、JDのインテリジェント配達ロボットも忙しかっ...
「まあまあ、今のところ需要はないんですが、ありがとうございます。」今週、子供向け番組を「販売」する...
メタバースの概念が誇張され、まるでそれが本当に存在するかのように人々が話していることは間違いありませ...
インターネット上の言語と画像を習得した後、大きなモデルが最終的に現実世界に入り、「具現化された知能」...
[[197626]]人工知能は新しい用語ではなく、その開発の歴史は数十年にわたります。それは 19...
「中関村スマート人工知能パートナープログラム」(以下、プログラム)の登録は2021年3月1日に正式に...
ケビン・ケリー氏は「人工知能は人類社会を混乱させる次のものだ」と語った。 2020年は、全世界が前例...
人工知能とモノのインターネットを組み合わせたこの新しい技術の波は、新たな機会をもたらし、業界全体の運...
近年、急速に発展している人工知能の分野のひとつであるディープラーニングは、NLP、画像認識、音声認識...