AlphaGOとイ・セドルの人間対機械の戦いにより、ディープラーニングという言葉が再び人気を集めています。ディープラーニングは、実際には機械学習の一分野であり、データ間の相関関係を研究する分野です。たとえば、収入と年齢、性別、職業、教育などの要因との間の数学的な関係を調査するために使用できます。しかし、従来の機械学習手法では、一般的に単純な線形関係しか抽出できません。私たちは、世界が線形関係で説明できないことを知っています。たとえば、収入と年齢、性別、職業、教育レベルの関係など、このような単純な質問は線形関係では明確に表現できません。ディープラーニングの登場により、この状況は一変しました。ディープラーニングは、複雑な多重非線形モデルを使用してデータ間の関係性を表現し、大量のデータを使用して最終的にデータ間の関係性が何であるかを判断します。 ディープラーニングのインスピレーションは脳のニューラルネットワークから来ています。私たちの脳は非常に複雑なディープラーニングモデルであると言えます。脳内のニューラル ネットワークは、数千億のニューロンが接続されて構成されています。ディープラーニングでも同じ構造が採用されています。各人工ニューロンは、入力に対して単純な線形または非線形演算を実行し、その結果を次のニューロンに渡します。数十、数百のレイヤーの伝達を経て、最終的な予測結果が得られます。 ディープラーニングの手法は近年提案されたものではありません。1980年代後半には、ジェフリー・ヒントンやヤン・ルカンなどの学者がディープラーニングの手法を使用して手書き数字の認識の問題を解決していました。残念ながら、1990年代に入ってからもディープラーニングの性能は大きく向上せず、多くの単純な線形モデルよりも劣るようになり、ディープラーニングの研究は停滞してしまいました。ヒントン教授がディープラーニングに関する画期的な論文をサイエンス誌に発表し、ディープラーニングの手法を再検討して、ディープラーニングのパフォーマンスを新たなレベルに引き上げたのは、2006年のことでした。それ以来、ディープラーニングは音声認識、コンピュータービジョン、ロボット工学、自然言語処理などの分野で従来の機械学習手法を上回り、顔認証コンペティションLFWや自然画像分類コンペティションImageNetでは人間の認識能力を上回りました。今回、AlphaGOがイ・セドルに勝利したことは、ディープラーニングが人間を超えたもう一つの例だ。 では、ディープラーニングが再び台頭し、人間を超えたのはなぜでしょうか? もちろん、それはヒントン氏のような学者による何十年にもわたるたゆまぬ研究のおかげでしょう。さらに、非常に重要な客観的な要素が 2 つあります。 ***はビッグデータです。インターネットは数十億の人々と膨大な量のデータを結び付けます。ディープラーニングでは、優れたパフォーマンスを発揮するモデルを得るために、膨大な量のデータが必要です。ディープラーニングとビッグデータの関係は、ロケットと燃料の関係に似ています。ロケットは強力ですが、燃料であるビッグデータがなければ、ただの金属くずの山に過ぎません。ビッグデータが不可欠であることから、Google、Facebook、Microsoft、Baiduなど、大量のデータを所有する有名なIT大手企業によってディープラーニングが最も広く使用されていることもわかります。ディープラーニングの時代において、データを所有することは人工知能の指揮権を握ることを意味すると言えます。 2つ目は高性能コンピューティングです。ムーアの法則は、コンピューティング能力の成長率の法則を明らかにしています。過去数年間で、GPU、スーパーコンピューター、クラウドコンピューティングなどのコンピューティングプラットフォームが急速に発展し、ディープラーニングが可能になりました。たとえば、2011年にGoogle Brainは1,000台のマシンと16,000個のCPUを使用して、約10億のニューロンを持つディープラーニングモデルを処理しました。現在では、同じ計算を複数のGPUで完了できます。実際、ディープラーニングはすでに私たちのポケットに入り込んでおり、スマートフォンの GPU はすでに中程度に複雑なディープラーニング手法を実行できます。私たち全員が携帯電話で AlphaGO と対戦できるようになるのはそう遠くないと思います。数年後には、携帯電話で人間の脳と同じくらい複雑なニューラル ネットワークを実行できるようになるでしょう。 ディープラーニングの分野には、優れた中国の科学者や中国企業が数多く存在します。科学者の中では、百度のトップ科学者アンドリュー・ン氏、IDLの創始者ユー・カイ氏、Caffeの著者ジャ・ヤンチン氏、顔認証LFWを99%以上に引き上げた最初の教授タン・シャオウ氏とワン・シャオガン氏、昨年ImageNetで複数のタイトルを獲得した孫建氏と何開明氏などが知られています。企業側では、有名なBAT、360、Sogou、Didiなどがいずれもディープラーニングに取り組んでいます。同時に、DeepGlint(セキュリティ、自動運転)、Megvii Technology(顔認識)、SenseTime(顔認識)、Horizon Robotics(ADAS)など、ディープラーニングを活用する新しい企業が中国で数多く登場しています。 ディープラーニングは、人とチェスをするのと同じくらい単純なものではありません。人間の脳のシミュレーションなので、人間の脳の多くの機能を実行できます。 まず視覚の機能です。カメラは人間の目のように世界を見ることができますが、人間の脳のように世界を理解することはできません。ディープラーニングはこの欠点を補います。ディープラーニングのおかげで、Google フォト、Baidu 画像認識、Taobao Pailitao は写真内のオブジェクトのカテゴリを正確に識別し、写真を自動的に分類または検索できます。ディープラーニングのおかげで、Alipay で顔をスキャンしてクールな方法で支払うことができます。 Megvii の行動特徴分析システムは、ディープラーニングを活用して、現場のすべての人と車両の所在を検出し、疑わしい危険な事件を速やかに警報することができます。ビジュアル ビッグ データ プラットフォームは数千の車種を識別でき、顔認識システムは顔の動的および静的認識と比較を実行できます。ディープラーニングにより、UISEE の自動運転車は周囲の道路状況を十分正確に識別できます。ディープラーニングのおかげで、FaceU のようなアプリは顔や顔の特徴がどこにあるかを認識します。 視覚機能に加えて、ディープラーニングは音声認識にも広く使用されています。 Baidu の Deep Speech 2 も、いくつかのテストで人間の聴力を上回った。さらに、Google、Apple、Microsoft、中国のiFlytekも独自の音声認識製品を発売している。ディープラーニングの助けにより、コンピューターの音声認識機能はますます強力になり、主にキーボードに基づく現在の人間とコンピューターの対話モードが徐々に変化していきます。 ディープラーニングはロボット工学の分野にも大きな変化をもたらしています。先ほど述べたディープラーニングベースの視覚および音声認識機能は、ロボットが世界をよりよく認識するのに役立ちます。さらに、ディープラーニングは強化学習とも組み合わせられます。強化学習とは、環境との相互作用から得られる報酬と罰を通じて、ロボットがより良い戦略を自己学習することを指します。簡単な例を挙げると、AlphaGO は強化学習の産物です。他のプレイヤーとチェスをしたり、自分自身と勝ったり負けたりすることで、より良いチェス戦略を自律的に学習します。ディープラーニングの導入により、強化学習手法でより複雑な戦略を見つけることが可能になります。 AlphaGOがイ・セドルに完勝したことから、ディープラーニング+強化学習は、ロボットが極めて複雑な環境でも高度に最適化された意思決定戦略を自律的に学習できるようにする能力を持っていることがわかります。 上記のアプリケーションは、私たちの日常生活で目にするものにすぎません。私たちの目に見えない世界に影響を与えるディープラーニングのアプリケーションは数多くあります。インターネット検索、広告推奨、金融定量取引、機械翻訳、医療ビッグデータ分析、インテリジェント法律コンサルティング... 大量のデータから未知の情報を予測する必要があるあらゆる分野でディープラーニングが活用できると言えます。将来的には、ディープラーニングに代表される人工知能技術が、蒸気機関、電気モーター、コンピューター、インターネットなどの新たな科学技術革命を推進し、生産性をより高いレベルに引き上げる可能性があります。 もちろん、実践者として、私はディープラーニングが過大評価されるのではないかとも懸念しています。特に、AlphaGO がこの技術を一般に広く知らしめた後はなおさらです。ディープラーニングは、ちょうど歩き方を覚えたばかりの赤ちゃんのように、まだ始まったばかりです。将来、彼が偉大な人物になることは間違いありませんが、結局のところ、多くの技術はまだ未熟であり、かなりの数のアプリケーションはまだ人々を満足させることが難しく、将来的にも長い間実現が難しい可能性があります。人工知能の開発には、すべての人の熱意ではなく、長期的な投資と努力が必要です。 |
序文LZ77 アルゴリズムは、1977 年にイスラエルの Abraham Lempel によって公開...
1. 論文のテーマと研究の方向性を決定するディスカッションと詳細化: ChatGPT で論文のトピ...
スタンフォード大学人工知能研究所の公式ツイッターによると、11月20日、フェイフェイ・リー氏がスタン...
1月13日、JDD-2018 JDデジタルテクノロジーグローバルエクスプローラーコンペティションの世...
ディープラーニングマシンは、人が年をとった後の顔がどのようになるかを示すことができますが、多くの場合...
人工知能(AI)が高度化し普及するにつれて、サイバーセキュリティの脅威が増大します。ハッカーやサイバ...
[[384554]]人工知能は、人類がより早く、より効果的に病気と闘い、より健康的な生活を送るのに役...
【51CTO.com クイック翻訳】 [[393512]] AI、機械学習、ディープラーニングの発展...
[[361286]]自然言語処理技術は人工知能技術の重要な分野です。自然言語処理技術自体が成熟する...
モバイルインターネット時代の始まり以来、スマートフォンへのソフトウェアの適応は常にソフトウェア業界の...