人工知能の10年を振り返る: CNN、AlphaGo…世界をどのように変えたか

過去 10 年間に AI で達成された重要な進歩を振り返ります。

人工知能技術は過去 10 年間で飛躍的に進歩し、SF の最も奇抜なシナリオが今や私たちの生活に欠かせないものとなっています。 10 年前、人々は AI について理論的かつ実験的に語っていましたが、年月が経つにつれて、AI はより具体的かつ主流になってきました。国際標準のコース、プラットフォーム、ライブラリ、フレームワーク、ハードウェアなど、すべてがスムーズに進みます。過去 10 年間の成果が未来への基礎を築いたと言っても過言ではありません。

[[375230]]

この記事では、過去 10 年間に AI で達成された重要な進歩を振り返ります。

畳み込み

2012 年はディープラーニングの歴史において重要な年でした。その年、畳み込みニューラルネットワーク (CNN) が有名な ImageNet チャレンジで注目を集めました。アレックス・クリジェフスキー氏らが設計した畳み込みニューラルネットワーク「Alexnet」が、2位を大きく引き離すスコアで優勝した。ImageNetデータセット上での視覚認識エラー率は15.3%と、半減した。ニューラルネットワークは、74.8%の精度で猫を検出し、YouTube動画内の顔を81.7%の精度で検出することができた。

現在、携帯電話やショッピングモールでの顔認識アプリケーションはすべて 2012 年のこの研究によるものであり、認識精度の向上により研究者は高い信頼性で医療用画像モデルを展開できるようになりました。

AIと話す

ヴァスワニ氏らの2017年の論文「Attention Is All You Need」は連鎖効果をもたらし、機械が前例のない方法で言語を理解できるようにしました。 Transformer アーキテクチャのおかげで、AI はフェイクニュースやツイートを書いたり、さらには政治不安を引き起こしたりできるようになりました。 Transformerに続いて、Googleはキーワード予測やSEOランキングなどに使われるBERTモデルをリリースしました。 BERT は現在、自然言語処理の事実上の標準となっており、Microsoft や NVIDIA などの企業は、このモデルに追いつくためにさらに多くのパラメータを追加し始めています。

NVIDIA の Megatron には 80 億のパラメーターがあり、Microsoft の Turing NLG モデルには 170 億のパラメーターがあります。 OpenAI の GPT モデルが後から登場し、1750 億のパラメータを持つ GPT-3 が現在記録保持者となっている。

GPT-3 も Transformer の拡張であり、現在最大のモデルです。エンコード、エッセイの作成、ビジネスアイデアの生成など、人間が考えつかないようなあらゆることが可能になります。

人類を団結させる

AIはすでにチェスで人間に勝利しています。「Jeopardy!」、「囲碁」、「テキサスホールデム」など、さらに複雑な人間ゲームでも、アルゴリズムは阻止できていません。近年の人工知能における最も有名な出来事は、最も複雑なボードゲームである「囲碁」で、AlphaGo がトップクラスの人間プレイヤーを破ったことである。一方、この10年間でIBMのワトソンはジェパディ!の決勝戦で2人の人間を破り、ワトソンは77,147ドルを獲得し、2人はそれぞれ24,000ドルと21,600ドルを獲得した。

Facebookとカーネギーメロン大学が共同開発したテキサスホールデムAI「Pluribus」は、5人の熟練した人間のプレイヤーに勝利し、前身のLibratus（ポーカーマスター）が達成できなかった課題を達成した。この研究は2019年にサイエンス誌にも掲載された。 2020年12月、DeepMindは人工知能モデルが将棋、チェス、囲碁など複数のゲームをマスターできるようにするMuZeroを提案した。

人生を解読する

あらゆる生物の行動は、そのタンパク質にまで遡ることができます。タンパク質には秘密が隠されており、それを解明することがコロナウイルスのパンデミックを克服するのに役立つかもしれない。しかし、タンパク質の構造は非常に複雑なので、シミュレーションを継続的に実行する必要があります。 DeepMind はこの問題を解決しようと試みました。同社が開発したディープラーニングアルゴリズム「Alphafold」は、50 年もの間存在していたタンパク質分子の折り畳み問題を解決しました。コンピュータービジョンは診断に役立つことが示されており、タンパク質の折り畳みの問題を解決することで研究者が新薬を開発するのに役立つ可能性さえあります。

AI: 芸術家であり嘘つき

昨年、ベルギー首相が経済危機と気候危機への緊急の対処の必要性について語ったビデオが後にディープフェイクであったことが明らかになった。機械学習とAIがベルギー首相の声と表情を操作し、地球温暖化の影響について演説する偽のビデオを作成した。

これらの偽コンテンツの背後には、慎重に設計されたアルゴリズム、生成的敵対ネットワーク (GAN) があります。このアルゴリズムは 2014 年に提案され、広く使用され、人間の仕事の最後の障壁である創造にも侵入しました。このネットワークは、これまで存在したことのない顔を生成したり、顔を交換したり、国の大統領に意味不明な発言をさせたりすることができます。 GAN で生成された絵画は、クリスティーズのオークションで記録破りの 40 万ドルで落札されました。 GAN の裏側は、悪意のある目的で使用される可能性があることです。そのため、Adobe などの企業は偽のコンテンツを検出するための新しい技術を開発する必要があります。 GAN は今後 10 年間も引き続き多くの議論の対象となるでしょう。

秘密兵器：シリコン

ニューラルネットワークの概念は半世紀前に誕生し、現在普及しているバックプロパゲーション法も 30 年ほど前から存在しています。しかし、これらの計算を実行できるハードウェアはまだ不足しています。過去 10 年間で、10 社を超える企業が特殊な機械学習チップの開発に取り組んできました。チップ技術は長年にわたって飛躍的に進歩し、今では手のひらに収まるデバイスで何百万もの操作を実行できるようになりました。これらのチップはデータセンターで使用され、ユーザーはお気に入りの Netflix 映画を視聴したり、スマートフォンを使用したりすることができます。次に、エッジデバイス向けにカスタマイズされた AI チップは、数十億ドル規模のビジネスチャンスをもたらします。

Apple などの企業は、インテリジェントなサービスを提供するために、A14 Bionic などのカスタマイズされた機械学習チップを開発しました。 Nvidia と Intel に依存している AWS でさえ、徐々にチップ業界に参入し始めています。この傾向は、チップが小型化するにつれてさらに顕著になります。たとえば、NVIDIA Jetson AGX Xavier 開発キットを使用すると、製造、小売、スマートシティなどのためのエンドツーエンドの AI ロボットアプリケーションを簡単に作成して展開できます。 Google の Coral ツールキットは、エッジデバイスに機械学習を導入します。安全でリアルタイムな出力が現在のテーマです。

オープンソース文化は成熟しつつある

画像出典: MIT Tech Review

2015 年に、TensorFlow はオープンソース化されました。 1年後、Facebook AIはPythonベースのディープラーニングフレームワークPyTorchをオープンソース化しました。現在、TensorFlow と PyTorch が最も広く使用されているフレームワークになっています。 Google と Facebook は、継続的なバージョンアップデートを通じて、機械学習コミュニティに大きな利便性をもたらしました。カスタムライブラリ、パッケージ、フレームワーク、ツールの爆発的な成長により、より多くの人々が AI 分野に参入できるようになり、より多くの才能が AI 研究にもたらされました。

近年、オープンソースが大きな特徴となっています。 AI革命は、オープンソースツールと、arxivやCourseraなどのリソースの利用可能性の増加によって推進されています。もう一つのきっかけは、人気の競争プラットフォーム Kaggle です。 Kaggle と GitHub は、質の高い AI 開発者のグループを育成してきました。

より多くの学習、より少ないルール

1990 年代初頭にシュミットフーバー教授によって提唱されたメタ学習の概念は、ごく最近になって注目を集めるようになりました。メタ学習とは、限られた数のトレーニング例に基づいて機械学習モデルが新しいスキルを学習し、変化する環境に適応できるようにすることです。ハイパーパラメータを操作して特定のタスク向けに機械学習モデルを最適化するには、多くのユーザー入力が必要となり、面倒なプロセスになる可能性があります。しかし、メタ学習では最適化部分が自動化されるため、この負担は大幅に軽減されます。自動最適化により、MLaaS (Machine Learning as a Service) という新しい業界が誕生しました。

今後の方向性

一部の専門家は、以下の分野が重要な役割を果たす可能性があると予測しています。

再現性
差分プライバシー
幾何学的ディープラーニング
ニューロモルフィックコンピューティング
強化学習

AI は私たちが想像もしなかった多くの分野に浸透していますが、自動運転車などのより一般的なアプリケーションに適用される必要があります。しかし、課題はむしろ数学にあります。正確な決定を下すことができるアルゴリズムがあり、それを処理できるプロセッサもありますが、それらをアプリケーションにいつ展開できるかはまだ不明です。ヘルスケアであれ自動運転車であれ、AI は今後も進歩し続ける必要があり、これは透明性と再現性が確立されて初めて実現できます。

<<: 市場規模は100億元を超える可能性あり。これら4種類の医療用ロボットをご存知ですか？

>>: 早期がん検査、医療AI：2020年の医療の10の進歩は注目に値する