250年以上にわたり、技術革新は経済発展の根本的な原動力となってきました。これらの技術革新の中で最も重要なのは、経済学者が「汎用技術」と呼ぶもので、蒸気機関、電気、内燃機関などが含まれます。それぞれがイノベーションと機会の相補的な波を引き起こします。たとえば、内燃機関によって、自動車、トラック、飛行機、チェーンソー、芝刈り機、さらには大型小売店、ショッピングモール、クロスドッキング倉庫、新しいサプライチェーン、郊外住宅地も実現しました。 Walmart、UPS、Uber など多様な企業が、新しいテクノロジーを活用して新しいビジネス モデルを生み出す方法を見つけました。 現代の最も重要な汎用テクノロジーは人工知能、特に機械学習です。機械学習とは、人間がすべてのタスクの実行方法を明示的に説明しなくても、機械が継続的にパフォーマンスを向上させることができることを意味します。過去数年間で、機械学習はますます強力になり、広く使用されるようになりました。今では、タスクを完了する方法を自ら学習するシステムを構築できるようになりました。 なぜこれが重要なのでしょうか? 理由は 2 つあります。まず、人間は表現できる以上のことを知っており、顔を認識することから古代アジアの戦略ゲームである囲碁で見事な動きをすることまで、人間がなぜこれほど多くのことを達成できるのかを説明することはできません。機械学習が登場する前は、知識を正確に表現できなかったため、多くのことを自動化することができませんでしたが、今ではそれが可能になりました。 第二に、機械学習システムは非常に優れた学習者です。これらのシステムは、詐欺の検出や病気の診断など、幅広い分野で超人的なパフォーマンスを達成できます。これらの素晴らしいデジタル学習者が経済全体に展開されるにつれ、その影響は計り知れないものとなるでしょう。 ビジネスの世界では、人工知能は、汎用技術の初期の段階であっても変革をもたらす影響力を持つと考えられています。現在、世界中の何千もの企業で使用されていますが、大きな機会のほとんどは活用されていません。製造、小売、輸送、金融、医療、法律、広告、保険、エンターテインメント、教育、そして事実上あらゆる他のセクターが、機械学習の恩恵を受けるためにコアプロセスとビジネスモデルを変革するため、AI の影響は今後 10 年間で確実に拡大するでしょう。現在、ボトルネックとなっているのは、管理、実行、そしてビジネスの想像力です。 しかし、他の多くの新技術と同様に、人工知能もまた多くの非現実的な期待を生み出しています。機械学習、ニューラル ネットワーク、その他のさまざまな形式のテクノロジーに惜しみなく費やされているが、実際の機能とはほとんど関係のないビジネス プランが数多く見られます。たとえば、出会い系サイトを単に「AI 搭載サイト」と呼ぶだけでは効率は上がりませんが、資金調達には役立つかもしれません。この記事では、雑音を排除して、AI の真の可能性、その実際的な影響、そして AI の導入で直面する障害について説明します。 今日、AIは何ができるのでしょうか? 「人工知能」という用語は、1955年にダートマス大学の数学教授ジョン・マッカーシーによって造られ、翌年、人工知能に関する画期的な会議を主催しました。それ以来、おそらくその刺激的な名前のせいもあって、人工知能の分野は単なる空想上の主張や約束以上のものへと成長し始めました。 1957年、経済学者ハーバート・サイモンは、10年以内にコンピューターがチェスで人間に勝つだろうと予測した。 (実際、コンピューターの誕生にはわずか 40 年しかかかりませんでした。) 1967 年、認知科学者のマービン・ミンスキーは、「1 世代以内に、『人工知能』を作成する問題は事実上解決されるだろう」と述べました。サイモンとミンスキーはどちらも知識の巨人でしたが、どちらも間違っていました。そのため、将来の画期的な進歩に関する劇的な主張には、ある程度の懐疑的な見方が寄せられる。 まず、AI が現在何をしているのか、そしてどれくらいの速さで発展しているのかを見てみましょう。最も大きな進歩は、知覚と認知という 2 つの広範な領域で起こりました。初期のカテゴリーでは、最も実用的な進歩は音声に関するものでした。音声認識はまだ開発中ですが、Siri、Alexa、Google の音声アシスタントなど、今では何百万人もの人々が使用しています。あなたが今読んでいる記事は、もともと私がコンピューターに口述し、タイピングするよりも速く書けるほど正確に書き起こしたものです。スタンフォード大学のコンピューター科学者ジェームズ・ランディ氏とその同僚による研究によると、音声認識は平均して携帯電話で入力するよりも3倍速く、エラー率は8.5%から4.9%に低下したという。驚くべきことに、この劇的な改善は10年以上もかかって起こったのではなく、2016年の夏になってから始まったばかりでした。 同様に、画像認識も驚くべき進歩を遂げています。 Facebook やその他のアプリが、送信した写真内の多くの友達の顔を認識し、タグ付けを促すようになったことに気づいたかもしれません。スマートフォンのアプリを使えば、野生のあらゆる鳥を識別できます。一部の企業本社では、画像認識が ID カードに取って代わっています。自動運転車などに使用されている視覚システムは、以前は歩行者の識別で30フレームに1回ミスをしていましたが、現在では3000万フレームに1回未満しかミスをしません。 ImageNet と呼ばれる画像認識用の巨大なデータベースがあり、そこには何百万枚ものありふれた写真、ぼやけた写真、あるいはまったく奇妙な写真が含まれています。トップクラスのシステムの画像認識エラー率は、2010 年の 30% 以上から 2016 年には 4% にまで低下しました。 近年、巨大な、つまり「ディープ」なニューラル ネットワークに基づく新しい手法のおかげで、画像認識の改善が急速に進んでいます。視覚システムの機械学習は完璧には程遠いですが、人間でさえ子犬を素早く識別するのが難しい場合があり、かわいい子犬がまったくいない場所にも子犬が見える場合があります。 子犬かマフィンか?画像認識の進歩 機械は類似画像のカテゴリーを識別する点で大きな進歩を遂げました。 画像認識のエラー率 2番目に改善が見られた分野は、認知と問題解決でした。機械はすでにポーカーや囲碁の最強プレイヤーに勝利しているが、専門家らはそれが達成されるまでには少なくともあと10年はかかると予想していた。 Google の DeepMind チームは機械学習システムを使用して、データセンターの冷却効率を最大 15 パーセントポイント向上させました。これは、人間の専門家がデータセンターを最適化した後でも達成できるレベルです。サイバーセキュリティ企業の Deep Instinct はマルウェアの検出にインテリジェントエージェントを使用しており、PayPal はマネーロンダリングの防止にそれを使用しています。 IBM テクノロジーを使用するシンガポールの保険会社は、ユーザーが請求プロセスを自動化できるようにし、データ サイエンス プラットフォーム Lumidatum は顧客サポート システムを改善するためのリアルタイムの推奨事項を提供します。多数の企業が、ウォール街でどの取引を受け入れるかを決定するために機械学習を使用しており、機械学習の助けを借りて行われる信用決定の数も増加しています。 Amazon は機械学習を使用して在庫を最適化し、顧客に送信する製品の推奨事項を改善します。 Infinite Analytics は、世界的な消費財企業のオンライン広告レイアウトを改善するために、ユーザーが特定の広告をクリックするかどうかを予測する機械学習システムと、ブラジルのオンライン小売業者のユーザー検索および発見プロセスを最適化するシステムを開発しました。最初のシステムにより広告の ROI が 3 倍になり、2 番目のシステムにより年間収益が 1 億 2,500 万ドル増加しました。 機械学習システムは、多くのアプリケーションで基本的なアルゴリズムを置き換えるだけでなく、かつて人間が最も得意としていた多くのタスクよりも優れたパフォーマンスを発揮します。このシステムには改善の余地がありますが、ImageNet データベースでのエラー率 (約 5%) は人間レベルのパフォーマンスに達しているか、それを上回っています。音声認識についても同様で、現在では騒がしい環境でもほぼ人間のレベルに達しています。機械学習システムはその限界に達し、職場と経済を変革する新たな大きな可能性を切り開きました。 AI ベースのシステムが特定の分野で人間のパフォーマンスを上回ると、急速かつ広範囲に普及する可能性が高くなります。たとえば、ドローンやロボットを製造している Aptonomy や Sanbot などの企業は、改良された視覚システムを使用して多くのセキュリティ タスクを自動化しています。他の企業としては、ソフトウェア会社Affectivaが機械学習を利用して、特定のグループにおける幸福、驚き、怒りなどの感情を識別している。 Enlitic は、機械学習を使用して医療画像をスキャンし、がんの診断に役立てている数社のディープラーニング スタートアップ企業の 1 つです。 これらは注目すべき成果ですが、AI ベースのシステムの適用範囲は依然として非常に狭いままです。たとえば、機械学習が数百万枚の画像を含む ImageNet データベースで優れたパフォーマンスを発揮するからといって、照明条件、角度、画像解像度、コンテキストが大きく異なる可能性のある「実際の」環境でも常に同じように成功するとは限りません。もっと根本的な問題として、中国語を理解して英語に翻訳できるシステムには驚嘆するかもしれないが、そのシステムが特定の中国語の文字の意味を理解することは期待できないし、ましてや北京でどこで食事をすればよいかなど知るはずもない。ある人がタスクをうまく実行できる場合、関連するタスクも実行できると想定するのは自然なことです。しかし、機械学習システムは特定のタスク向けにトレーニングされており、従来の知識は拡大または拡張されません。コンピューターの理解力が狭いからといって、より広い理解力にまで拡張できると想定するのは、典型的な誤りです。そして、人工知能が独力で進歩できるというさらに誇張された主張と同様、これがおそらく最大の混乱の原因です。複数の分野で汎用的な知能を備えた機械が実現するまでには、まだ程遠い道のりです。 機械学習を理解する 機械学習について理解する上で最も重要なことは、それがソフトウェアを作成するための根本的に異なるアプローチを表しているということです。たとえば、機械は特定の結果を達成するように明示的にプログラムされるのではなく、何かを学習します。過去 50 年間の大部分において、情報技術とその応用の進歩は、既存の特定の知識と手順を命令にコード化し、その命令をマシンに埋め込むことに重点を置いてきました。実際、「プログラミング」という言葉は、開発者の頭の中にある知識を機械が理解して実行できる形式に変換する骨の折れるプロセスを常に意味してきました。このアプローチには根本的な弱点があります。既存の知識の多くは暗黙のものであり、それを完全に説明することはできないということです。自転車の乗り方から友人の顔の見分け方まで、あらゆる指示を他の人が理解できるように書き留めるのはほぼ不可能でしょう。 上:これが人工知能を使うということの意味です。その結果、人間ではない人々が生まれ、認識はできるものの、期待通りの人物ではない人々が生まれます。彼らは美しいのでしょうか、恐ろしいのでしょうか、それとも楽しいのでしょうか? 言い換えれば、私たちは表現できる以上のことを知っているのです。機械学習はこの困難を克服しています。第二次機械革命のこの第二波では、人間が作った機械が例から学び、適切に構造化されたフィードバックを使用して、顔認識などの独自の問題を解決しています。 機械学習のさまざまな種類 人工知能と機械学習にはさまざまな種類がありますが、近年の成功事例のほとんどは、機械に特定の問題について学習させるために大量の正しい例を与える教師あり学習に焦点を当てています。このプロセスには、ほとんどの場合、入力セット X から出力セット Y へのマッピングが含まれます。たとえば、入力はさまざまな動物の写真であり、正しい出力はこれらの動物のラベル(猫、犬、馬など)です。入力はオーディオのサウンド波形にすることもでき、正しい出力は「はい」「いいえ」「こんにちは」「さようなら」などの単語になります。 成功するシステムでは通常、それぞれに正解のラベルが付けられた数千または数百万の例のトレーニング データ セットを使用します。次に、システムは新しい例をざっと確認し、トレーニングがうまくいけば、システムは非常に正確に答えを予測します。 アルゴリズムの成功は、ニューラル ネットワークを使用する「ディープ ラーニング」と呼ばれる手法に大きく依存しています。ディープラーニング アルゴリズムには、以前の機械学習アルゴリズムに比べて重要な利点があります。それは、ディープラーニングでは、はるかに大規模なデータベースをより適切に使用できることです。古いシステムは、トレーニング データ インスタンスが追加されるにつれて改善されましたが、データを追加しても予測精度が向上しないという点に達しました。 「ディープ ニューラル ネットワークはこのようには機能しません」と、この分野のリーダーの 1 人であるアンドリュー ン氏は言います。「データが増えると予測精度が向上します。」非常に大規模なシステムの中には、3,600 万以上の例でトレーニングされたものもあります。もちろん、非常に大規模なデータベースを扱うには、さらに多くの処理能力が必要になるため、非常に大規模なシステムはスーパーコンピューターや専用コンピューターで実行されることがよくあります。 行動に関する大量のデータがあり、結果を予測しようとしている場合、それは教師あり学習システムの潜在的な応用です。 「顧客にパーソナライズされた提案を行うために使用されていたメモリベースのフィルタリング アルゴリズムは、教師あり学習システムにほぼ取って代わられました」と、アマゾンのワールドワイド コンシューマー部門 CEO のジェフ ウィルケ氏は言う。JP モルガン チェースは、商業ローン契約書を確認するシステムを導入した。この作業は、かつてはローン担当者が完了するのに 36 万時間を要していたが、今ではわずか数秒で完了する。教師あり学習システムは皮膚がんの診断にも使用されています。上記はほんの一例です。 データセットにラベルを付け、それを使用して教師あり学習システムをトレーニングするのは比較的簡単です。このため、少なくとも現時点では、教師あり機械学習システムが教師なし学習システムよりもはるかに一般的です。教師なし学習システムは自ら学習しようとします。私たち人間は優れた教師なし学習者です。ラベルのないデータがほとんどなくても、木の識別など、世の中の知識のほとんどを獲得できますが、このように機能する機械学習システムを開発するのは極めて困難です。 強力な教師なし学習システムを構築できれば、刺激的な新しい可能性が開かれるでしょう。これらのマシンは、複雑な問題をまったく新しい方法で分析できるようになり、病気の蔓延、市場での証券の価格変動、顧客の購買行動などを観察する際のパターンを見つけるのに役立ちます。この可能性から、Facebook の AI 研究責任者でありニューヨーク大学の教授でもある Yann LeCun 氏は、教師あり学習システムをケーキのアイシングに、教師なし学習をケーキそのものに例えています。 この分野でもう一つ小さいながらも成長している分野が強化学習です。これは、Atari のビデオ ゲームや、囲碁などのボード ゲームに組み込まれています。また、データセンターの電力使用量の最適化や、株式の取引戦略の開発にも役立ちます。 Kindred は、機械学習を使用してこれまで遭遇したことのない物体を認識して分類し、消費財の配送センターでの配送をスピードアップするロボットを製造しています。強化学習システムでは、プログラマーはシステムの現在の状態と目標を指定し、許容される動作をリストし、動作の結果に影響を与え制約する環境要因を記述します。システムは、許可された動作を前提として、目標に可能な限り近づく方法を見つけようとします。システムは、人間がそこに到達する方法を説明せずに目標を指定できる場合に最も効果的に機能します。たとえば、Microsoft は、より多くのユーザーがリンクをクリックするほどシステムに高いスコアを与えることで、強化学習を使用して MSN Web サイトのニュース レポートの見出しを選択しています。システムは、プログラマーによって与えられたルールに基づいてスコアを最大化しようとします。もちろん、これは強化学習システムが、必ずしも実際に重視している目標ではなく、明示的に報酬を与える目標に合わせて最適化されることを意味します。そのため、目標を正確かつ明確に指定することが重要です。 上: 今日の AI アプリケーションは、がん患者の痛みを解決しようとする医師、新しいレシピを探している家庭料理人、運転方法を決める通勤者など、人間によって操作されています。 機械学習を活用する 機械学習の実践を検討している組織にとって、朗報が 3 つあります。まず、人工知能が広く普及しつつあります。世界にはデータ サイエンティストや機械学習の専門家が不足していますが、オンライン教育リソースや大学は需要に応えるために懸命に取り組んでいます。最適なリソースとしては、Udacity、Coursera、fast.ai などが挙げられます。これらは概念的な内容を教えるだけでなく、学生が実際に産業グレードの機械学習の展開を実装できるようにします。関心のある企業は、自社の従業員を育成するだけでなく、Upwork、Topcoder、Kaggle などのオンライン人材プラットフォームを使用して、専門知識を持つ機械学習の専門家を見つけることもできます。 第二に、現代の AI に必要なアルゴリズムとハードウェアはすでに購入またはレンタル可能です。 Google、Amazon、Microsoft、Salesforce などの企業はすべて、クラウド システムを通じて利用できる強力な機械学習インフラストラクチャを構築しています。これらの競合他社の間では熾烈な競争が繰り広げられており、機械学習の実験や導入を希望する企業にとっては、時間の経過とともに、より手頃な価格の機能がますます利用できるようになることを意味します。 3 番目に、機械学習を活用するには、それほど多くのデータは必要ないかもしれません。ほとんどの機械学習システムでは、データが増えるにつれてパフォーマンスが向上するため、最も多くのデータを持つ企業が勝利すると思われます。この場合の「勝つ」とは、「広告ターゲティングや音声認識などの単一のアプリケーションで世界市場をコントロールする」ことを意味します。しかし、勝利の定義を「パフォーマンスの大幅な向上」に変更すれば、十分なデータを簡単に取得できます。 機械学習は、タスクと職業、ビジネス プロセス、ビジネス モデルという 3 つのレベルで変化を推進しています。マシン ビジョン システムを使用して潜在的な癌細胞を特定することは、最初のレベルの変化の優れた例であり、これにより放射線科医は、患者とのコミュニケーションの改善や他の医師との連携という本当に重要なことに集中できるようになります。ビジネスプロセスの変更のもう 1 つの例として、Amazon がロボットを導入し、機械学習ベースの最適化アルゴリズムを使用してワークフローを再構築し、Amazon のフルフィルメント センターを再編成したことが挙げられます。同様に、音楽や映画などの推奨をインテリジェントかつカスタマイズできる機械学習システムを使用して、ビジネス モデルを再考する必要があります。消費者の選択に基づいて個々の曲を販売するのではなく、特定のユーザーが好む可能性のある音楽を、たとえそのユーザーが聞いたことがなくても、事前注文して再生するパーソナライズされたサブスクリプション サービスを提供する方がよいモデルです。 リスクと限界 第二次機械革命の第二波も新たなリスクをもたらします。特に、機械学習システムは「説明が難しい」ため、システムがどのように決定を下すのかを人間が理解するのは困難です。ディープ ニューラル ネットワークには何億もの接続があり、それぞれの接続が最終的な決定に少しずつ貢献します。その結果、これらのシステムの予測は単純かつ明確な方法で説明することができず、機械は人間に伝えられる以上のことを知っていることになります。 これにより、3 つのリスクが発生します。まず、機械には、設計者の意図ではなく、機械のトレーニングに使用されたデータから生じる隠れた偏見がある場合があります。たとえば、システムが人間の意思決定のデータベースを使用して、面接でどの求人応募を受け入れるかを学習する場合、候補者の人種、性別、民族などを誤って評価してしまう可能性があります。さらに、それらの偏見は明確なルールとして現れるのではなく、何千もの考慮事項の微妙な相互作用に埋め込まれている可能性があります。 第二に、明確な論理ルールに基づいて構築された従来のシステムとは異なり、ニューラル ネットワーク システムは絶対的な事実ではなくデータ事実を処理します。あらゆる状況、特にトレーニング データに含まれていない状況でシステムが適切に動作することを絶対的な確実性を持って証明することは難しい場合があります。原子力発電所の制御などの重要なタスクを扱う場合や、生死に関わる決定を下す場合には、確実性の欠如が問題となる可能性があります。 3 番目に、機械学習システムが間違いを犯した場合 (ほぼ必然的に間違いを犯します)、そのエラーを診断して修正することは非常に困難です。ソリューションを生み出す基礎構造は非常に複雑である可能性があり、システムがトレーニングされた条件が変更されると、結果として得られるソリューションは最適なものからは程遠いものになる可能性があります。 これらのリスクは非常に現実的であり、適切なベンチマークは完璧さを追求することではなく、最善の選択肢を追求することです。結局のところ、私たち人間は偏見を持ち、間違いを犯し、どのように意思決定を行うかを正直に説明するのが難しいのです。機械ベースのシステムの優れた点は、時間の経過とともに改善され、どのようなデータを与えても一貫した回答が得られることです。 これは、AI と機械学習にできることに限界がないことを意味するのでしょうか? 知覚と認知は、車の運転から売上の予測、さらには誰を雇用して昇進させるかの決定まで、ほとんどの領域をカバーしています。私たちは、ほとんどの分野で AI がすぐに人間レベルのパフォーマンスを上回ると信じています。では、AI と機械学習ではできないことは何でしょうか? 人工知能は、感情的で器用で抜け目ない人間を評価することは決してできない、あまりにも鈍くて非人間的だ、という話を時々耳にします。私たちはこの声明に同意しません。機械学習システムは、声のトーンや表情を通じて人の感情状態を認識する点で、すでに人間と同等かそれ以上のレベルに達しています。一部のシステムは、世界のトップポーカープレイヤーがブラフをしていることさえも判別できます。それは非常に繊細な仕事ですが、魔法ではありません。これには知覚と認知が必要であり、機械学習がますます強力になっています。 人工知能の限界について議論する場合、まずはピカソから始めるのがベストです。彼はコンピューターを観察して「コンピューターは役に立たない。答えを出すことしかできない」と結論付けました。実際、コンピューターは決して役に立たないわけではありませんが、ピカソの観察は依然としていくつかの洞察を与えてくれます。コンピュータは質問に答える装置であり、質問する装置ではありません。つまり、起業家、革新者、科学者、クリエイター、そして次の問題や機会を探している人々、新たな領域を開拓している人々は、依然として重要なのです。 私たちは、この超強力な機械学習の時代において、人間の知能にとって最大かつ最も重要な機会は、次に解決すべき問題を見つけることと、多くの人々にその問題を解決し、解決策を見つけるために協力するよう説得することという 2 つの領域の交差点にあると考えています。これは、第二機械時代においてますます重要になっている「リーダーシップ」の適切な定義でもあります。 私たちは、人工知能、特に機械学習が現代の最も重要な汎用技術であると信じています。こうしたイノベーションが企業や経済に与える影響は、直接的な貢献だけでなく、補完的なイノベーションを刺激する能力にも反映されています。より優れたビジョン システム、音声認識、インテリジェントな問題解決システム、機械学習を活用したその他多くの機能により、新しい製品やプロセスが実現可能になっています。 新しい環境でどの企業が優位に立つかを予測することは困難ですが、1 つの一般的な原則は明らかです。それは、最も柔軟性と適応力のある企業と経営者が繁栄するということです。機会を素早く察知し、それに対応できる組織は、人工知能のホットな領域で最終的に優位に立つことになるでしょう。したがって、成功するための戦略は、実験して素早く学ぶ意欲を持つことです。マネージャーが機械学習を試していないのであれば、彼らは仕事をしていないことになります。今後 10 年間で、人工知能が管理者に取って代わることはありませんが、人工知能をうまく活用する管理者が、活用しない管理者に取って代わるでしょう。 上: よく見ると、アルゴリズムの中に人間がいます。さらによく見ると、知性の中にアルゴリズムが見えます。 |
<<: データ サイエンティストが知っておくべき 10 のディープラーニング アーキテクチャ
>>: ディープラーニング以外に機械翻訳には何が必要ですか?
[[380661]] [51CTO.com クイック翻訳] 会話型 AI により、アプリケーションは...
米国第2位の信用組合であるPenFedは、人工知能を活用して顧客とのやり取りの方法を変えようとしてい...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
[[270607]]看護師は医療現場を問わず需要が高いです。米国労働統計局の報告によると、看護師の求...
[[431125]]自動車金融サービスの分野では、ディーラーと顧客が意思決定のスピードを追求していま...
クラスの不均衡: 希少疾患の機械学習データセット(陽性が約 8%)があるとします。この場合、トレーニ...
人工知能(AI)は1950年代に誕生し、3つの発展の波を経てきました。研究段階から大規模な産業化段階...
2024年にAI業界はどのように進化するのでしょうか? OpenAIのグレッグ・ブロックマン会長は...
実際の運転シナリオでは、観察と相互作用を通じて、インテリジェント運転車は知識を蓄積し、予測できない状...
[[311550]] [51CTO.com クイック翻訳] 人工知能は最新の開発トレンドであり、その...