20 世紀初頭から、ロボットが人間のように考え始めることができるかどうかについて、人々は疑問を持ち始めました。さまざまな文学作品やSF映画に登場する「考えるロボット」は、実は人工知能の起源です。人工知能の概念が正式に提案されたのは 1950 年代になってからでした。 1950 年、イギリスの科学者チューリングは、「人間が既存のデータに基づく論理的推論を使用して現実世界の問題を解決できるのに、なぜロボットは同じことができないのか」という疑問を提起しました。 今のところ、多くの人がそれが可能だと考えています。 そのため、政府、企業、機関、大学は、この質問に肯定的に答えることを期待して、多額の資金、財源、人材を投入してきました。しかし、現状から見ると、これほどの巨額の投資がほとんど成果を生んでいないのはやはり残念です。人工知能技術は大きな進歩と飛躍を遂げてきましたが、実際の実用化にはまだ程遠い状況です。 人工知能は、ディープラーニングアルゴリズムの進歩、コンピュータの計算能力の飛躍的向上、情報データの爆発的な増加という、これら 3 つが不可欠な要素であったおかげで、21 世紀になってようやく発展しました。人工知能の成果が継続的に現れていることから、研究者や投資家は、人工知能が実際に生産効率を向上させ、人々の日常生活を変えることができることを証明しました。 過去 10 年間で、人工知能は研究室から商業アプリケーションへと移行し、私たちの日常生活のさまざまな細部に浸透してきました。ショッピング ウェブサイトは、ユーザーの閲覧情報や購入情報に基づいて、パーソナライズされた製品をユーザーに推奨できます。スマートフォンは、スケジュールに基づいて最適なルートとホテルを推奨できます。最近では、自動車やバスの一部が「自動運転」を実現しています。 現在、人工知能は高い成長率で発展を続けています。Google、Amazon、Alibaba、Tencent、Baiduなどのデータに重点を置いたテクノロジー大手が、人工知能の発展の主な原動力となっています。確かなのは、人工知能は現時点では人間のように考えることができないということだ。 人工知能学習システムに必要なデータと計算能力は、人間の脳の能力をはるかに超えていると言う人もいます。最先端の画像認識アルゴリズムは、写真の認識において人間のレベルを超えることができますが、写真に写っている猫が何であるかを理解することはできません。 現在の AI 開発の方向性に何か問題があるのでしょうか? 百度のCEO、ロビン・リー氏はかつて人工知能について、「人工知能は人間のように見えるべきではないが、機械は人間の価値観を実現できるべきだ」と説明した。この観点から見ると、現在の人工知能の発展は、人間が達成できる聞く、話す、読む、書くという能力を実現しており、その発展の方向に大きな問題はない。しかし、人工知能が人間の知能に近づくことができるかどうかという観点から見ると、その方向性に間違いがあるかどうかについては、現時点では明確な結論は出ていません。 では、人工知能は現在どのように発展しているのでしょうか。発展の過程ではどのような問題が存在するのでしょうか。将来、人工知能はどのような形で発展し、人間のような思考を実現するのでしょうか。 人工知能開発の現状人工知能を現在のレベルまで発展させる上で最も大きな技術的貢献をしたのは、ディープラーニング アルゴリズムであるはずです。ディープラーニング アルゴリズムは、多層ニューラル ネットワークを使用して膨大な量のデータから学習し、将来の予測を実現して人工知能システムをますますインテリジェントにします。 従来の人工ニューラル ネットワーク アルゴリズムは、入力層と出力層で構成される浅いニューラル ネットワークです。ニューラルネットワークでは、各接続間の重みにランダムな値が割り当てられ、エラーが最小になるようにトレーニングされます。しかし、これまでのニューラル ネットワークでは、ニューラル ネットワーク パラメータをあまり多くトレーニングすることができなかったため、複雑すぎるパターンを認識できませんでした。 ディープラーニングネットワーク ディープラーニングは、その名前が示すように、より多くの層と複数の隠れ層を持つニューラル ネットワークを指します。複数の隠し層により、単純な特徴を層ごとに追加してより複雑な特徴を形成できるため、ニューラル ネットワークは階層的にデータの特性を学習できます。アルゴリズムのフレームワークが構築されると、さらなる「トレーニング」を通じてエラーは最小限に抑えられます。 つまり、深度(多層ニューラル ネットワーク アルゴリズム)と学習(ビッグ データのトレーニング)は、ディープラーニングの重要な部分です。 他の重要な人工知能技術の開発も、ディープラーニングの技術的サポートの恩恵を受けています。ディープラーニングに加えて、強化学習も機械学習の分野で人気の技術です。強化学習により、コンピューターからの明示的な指示がなくても、人間のように自律的に学習できるようになります。一定量の学習に達すると、強化学習システムは正しい結果を予測できるようになります。 強化学習の基本的な考え方は、さまざまな環境やさまざまな条件下で、どの動作が期待される利益を最大化できるかを学習することです。強化学習の学習プロセスではデータの注釈は必要ありませんが、報酬関数によって支配されます。赤ちゃんが歩き方を学ぶのと同じように、結果が良いか悪いかに応じて行動を調整します。 ディープラーニングと強化学習の融合により、ディープラーニング強化学習が登場しました。 2016年、Googleの囲碁プログラム(AlphaGo)はこの深層強化学習を利用して世界トップの囲碁プレイヤーに勝利し、人工知能の分野における新たなマイルストーンを打ち立てました。 アルファ碁 強化学習は囲碁などのゲーム競技で活躍していますが、現時点では実際の応用例が少なく、その商業的価値はディープラーニングとは比較になりません。その理由は、強化学習に必要な膨大なデータを提供できるプラットフォームが現在存在せず、現実に遭遇する可能性のある複雑な状況をすべて列挙することは不可能だからです。この種のデータの「渇望」は、現実世界の多くの領域では達成不可能です。 ディープラーニングと強化学習を組み合わせると、現実世界の状況の列挙は、まず現実世界の状況のパターン認識になり、次に有限パターンの列挙になるため、計算負荷は軽減されますが、必要なデータは他の機械学習アルゴリズムよりもはるかに大きくなります。 ディープラーニングと強化学習はどちらもトレーニングに大量のデータに大きく依存しており、計算プロセスはより力ずくになる傾向があります。生成的敵対的ネットワーク (GAN) は、近年このボトルネックを解決する可能性が最も高い機械学習モデルです。 敵対的ニューラル ネットワークは、2 つの人工知能システムを使用して互いに競争し、超リアルなオリジナルの画像とサウンドを生成します。敵対的ニューラル ネットワークは、機械に創造力と想像力を与え、機械学習のデータへの依存度を軽減します。これは、人工知能分野におけるもう 1 つの大きな進歩です。 敵対的ニューラルネットワーク 2018年にArxivのウェブサイトで公開された論文「StackGAN: スタックされた生成的敵対的ネットワークによるテキストから写実的な画像への合成」では、敵対的ニューラルネットワークを使用することで、システムに単純なテキストを入力するだけで画像が生成できることが示されました。 しかし、敵対的ニューラルネットワークの研究は4、5年しか行われていないため、研究は基本的に証拠収集の段階にあります。しかし、機械に「創造性」を与えるこのGANは、人工知能が常に悩まされてきたデータソース問題を解決し、人間に頼らない真の教師なし学習を実現したと言えます。 優れた敵対的ニューラル ネットワークに関しては、その真の技術的進歩と商業的応用には、さらに時間が必要です。 人工知能システムの画期的な応用昨今、人工知能技術の継続的な進歩により、その商業的応用もあらゆるところで開花しています。 MIT テクノロジーは、最も画期的なアプリケーションは、人工知能に基づく自動運転、画像認識、音声認識であると考えています。 自動運転 テスラのオートパイロットと自動運転トラックは、それぞれ2016年と2017年にMITテクノロジーレビューによってトップ10の画期的技術に選ばれました。過去数年間、自動運転技術の急速な発展は主にディープラーニングと強化学習における大きな進歩に依存してきました。 しかし、多くの進歩にもかかわらず、自動運転はまだ人間を完全に置き換えるレベルには達しておらず、ドライバーを支援するための半自動運転としか考えられないというのが一般的な見方です。特に天候、予期せぬ障害物、複雑な都市交通などの状況では、自動運転のセンサーやソフトウェアはエラーを起こしやすいため、人間による操作は現状不可能です。 自動運転 現在、多くの人々は、車車間(V2V)通信に基づく車両ネットワーキング技術が、自動運転が直面する主要な問題を効果的に解決できると信じています。車車間通信は、車両の位置、速度、ブレーキ状態などの車両データを100メートル以内の範囲の車両に送信できるため、自動運転車は全方向を監視し、全方向の音を聞くことができ、車両衝突を効果的に回避できます。 自動運転はまだ十分に成熟していないため、無線通信技術を利用することで道路交通事故を効果的に減らすことができると思われます。しかし、こうした車両間通信には比較的高度な通信技術が必要であり、情報セキュリティやプライバシー保護の問題から、V2Vはまだ商用化の試験段階にあり、近年の開発スピードは自動運転に比べてはるかに遅い。 画像認識、音声認識 最近では、外出時に財布を持っていく必要のない人が多く、ショッピングモールでは携帯電話で支払いができるようになっています。モバイル決済は現金や銀行カードに取って代わり、多くの人にとって主な支払い方法となっています。 2015年、Apple Payは世界の画期的なテクノロジーのトップ10に選ばれました。初期のApple Payは、NFC近距離無線通信と指紋認識(画像認識)を組み合わせたもので、モバイル決済のユーザーエクスペリエンスが大幅に向上しました。 Apple Pay は、Google Wallet、WeChat、Alipay、Paypal とは異なります。アプリケーションを起動したり、クリックして支払ったり、金額を入力したり、QR コードをスキャンしたりする必要はありません。 携帯電話をレジカウンターに近づけると、Apple Pay が自動的に起動し、指紋認証で支払いが完了します。さらに、Apple Payはセキュリティ面でもリードしています。AlipayやWeChat Payとは異なり、Apple Payで使用される電話には実際のカード番号が保存されず、販売者はそれを見ることはなく、カード番号をデータベースに保存する必要もありません。各支払い取引ごとに一意のコードが生成され、一度しか使用できません。 それだけでなく、Appleは人工知能をベースにした正確な画像認識技術により顔認証による決済を可能にしました。顔スキャン決済は2017年に最も画期的な技術の一つとなったが、顔スキャン決済を商業的に適用した最初の国は中国であった。 2015年、アリババのジャック・マーは、ドイツのハノーバー消費者電子見本市開会式で、顔認識技術を使って1948年のハノーバー産業見本市の記念切手の支払いに成功しました。 馬雲の顔認証支払い 現時点では、顔認証決済はまだ開発の初期段階にあります。顔スキャン決済は、その安全性についてユーザーから疑問の声が上がる可能性があり、顔スキャン決済の利便性は、従来のパスワード決済や指紋決済と比べてそれほど優れているわけではありません。顔スキャン決済を大規模に推進するには、既存のソフトウェアやハードウェアを改良するだけでなく、ユーザーが顔スキャン決済を受け入れられるように積極的に推進する必要があります。 音声認識は画像認識に似ています。本質的な違いは、音声データは 1 次元データであるのに対し、画像データは 2 次元データであることです。 Google の Babel Fish イヤホンの登場により、耳の中でのリアルタイム翻訳が現実のものとなり、2018 年の世界の画期的な技術の 1 つに選ばれました。しかし、このタイプのイヤホンに対する市場の評価は非常に一般的であり、主に真のリアルタイム翻訳ではないという事実に焦点を当てています。さらに、携帯電話、ヘッドフォン、翻訳ソフトウェアが必要であるという事実は、「バベルフィッシュの現実版」を期待していたユーザーを少し失望させます。 しかし、その背後には人工知能技術の商業的応用があります。同時に、こうした商業的な応用によってこそ、一般の人々が人工知能技術の魅力を真に理解するようになったのです。 人工知能は将来どのように発展するのでしょうか?人工知能はこれまで多くの進歩を遂げてきましたが、ディープラーニングが人工知能を人間の知能に近づける魔法の武器であると誰もが信じているわけではありません。その理由は、ディープラーニングがブラックボックスのようなものだからです。その内部で何が起こっているのかを知る術はなく、「経験は多いが理論は足りない」という状況になっています。 さらに、ディープラーニングはコンピューティング能力とビッグデータに大きく依存するため、ブルートフォースコンピューティングに似たものになりがちです。少量のサンプルデータで優れたニューラル ネットワークをトレーニングする方法も重要な研究方向です。 ディープラーニングの創始者として知られるヒントン氏は、ディープラーニングにおける既存の問題を完全に変えるためには、これまで提案してきた画期的なモデルをすべて覆す必要があると語った。ヒントン氏は、私たちがマシンビジョンに間違った方法でアプローチしていると考えています。このアプローチは現時点では有用であるように思われますが、それが人工知能を人間のように考えさせるための正しい道であるという意味ではありません。 ヒントン教授 2010年、ヒントン氏は「カプセルネットワーク」に関する研究成果を発表しました。カプセル ネットワークは、データに過度に依存するディープラーニング システムの欠陥を補い、新しいシナリオや新しい知識への一般化能力を向上させることを目的としています。たとえば、さまざまな角度や色の猫を認識するようにコンピューターに教えるには、さまざまな角度から撮影した何千枚もの写真が必要になる場合がありますが、子供は少量の猫認識トレーニングで、これまで見たことのないさまざまな角度や品種の猫を認識できるようになります。 現時点では、カプセル ネットワークの優位性を証明するデータや事例は多くありませんが、これは確かに人工知能分野におけるもう一つの認知的イノベーションです。 今日、私たちはデータがすべての問題を解決できると信じる時代に生きています。このデータ中心の考え方は、確かに私たちの日常生活に多くの新しい経験をもたらしました。しかし、データは万能ではありません。データは、薬を服用した患者は薬を服用していない患者よりも早く回復するということを教えてくれますが、その理由は教えてくれません。 人工知能システムでは、ディープラーニング、強化学習、敵対的ニューラルネットワークのいずれであっても、入力と出力の相関関係、つまり確率論における確率しかわかりません。現在、この写真の動物が間違いなく猫であると 100% の確信を持って言える人工知能システムは存在しません。動物が猫である可能性は 95% または 100% であるとしか言えません。 AIシステムの認識は確率的かつ不安定であり、簡単に妨害される。 人間が物事を理解するとき、通常はデータを使用して因果関係の推論と判断を行い、対応する解決策を導き出します。しかし、現在の人工知能システムでは、このような因果推論を行うことができません。さらに推論を進めていくと、現在の人工知能システムは、このような人間の知的思考からどんどん遠ざかっているように見えます。 ディープラーニングの将来に関して、ヒントン氏は人工知能革命が次に私たちをどこへ導くのかわからないとも認めた。 「この分野では、物事が必ずしも予想通りに進むとは限らないため、5年後に何が起こるかを予測するのは難しい」と彼は語った。 今後、ディープラーニングは発展し続けるか、あるいは打倒されるかのどちらかになるかもしれません。因果推論知能に関するこの種の研究は非主流ですが、将来がどうなるかは不明です。チューリング賞を受賞したパール教授は、因果関係の科学と人工知能分野におけるその応用に生涯を捧げ、人工知能の将来の発展を常に模索しています。 現時点では、AIが人間のように考えることができるかどうかについては答えが出ていません。しかし、確かなのは、これはまだ始まりに過ぎないということだ。 人工知能は人間のように考えるようになると思いますか? |
<<: 人工知能の時代に優れた教師とはどのような人物であるべきでしょうか?
>>: 人工知能は静かに到来し、世界のテクノロジー大手はAIをめぐる戦いを始めている
OpenAIを去った技術の第一人者、カルパシー氏はついにオンラインで2時間のAI講座を開始した。 —...
人類はアフリカでホモ・サピエンスとして誕生して以来、約50万年にわたる進化の過程を経てきました。人類...
[51CTO.com オリジナル記事] 韓国 IT ブリーフィング (3 月第 3 週)今回のKor...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
選択の余地はありません。2022年は近年で最も激動の年の一つになるでしょう。 テクノロジーもこの混乱...
世界が人工知能技術に依存する未来に向かって進むにつれ、人々はこれまで以上に感情を必要としています。人...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
【51CTO.com 速訳】ディープラーニングの課題過去数年間で、ディープラーニング モデルの主要構...
AIヘルスケア企業のCEOが、医療におけるAIの応用、AIソリューションの購入方法、ヘルスケア分野に...