人工知能の主要技術:強化学習(RL)

人工知能の主要技術:強化学習(RL)

人工知能技術はますます急速に進歩しており、それぞれのサブテクノロジーが生み出す価値もますます顕著になってきています。

[[359390]]

2013 年、DeepMind はディープラーニングと強化学習をうまく組み合わせた DQN アルゴリズムを発明し、ディープラーニング強化学習の新しい時代を切り開きました。その後の数年間で、強化学習の成果は飛躍的に進歩し、非常に困難な問題の多くが深層強化学習アルゴリズムによって解決されました。

2016年、Google AlphaGoが囲碁の世界チャンピオンでプロ九段のイ・セドル氏を4対1で破り、ディープラーニングを世間に知らしめただけでなく、人工知能の「大ブーム」を引き起こし、強化学習の技術的側面に人々がさらに注目するようになりました。

強化学習を使用する良い例としては、ロボットに歩き方を学習させることが挙げられます。ロボットは最初に大きく前進し、その後転倒しました。この大きなステップと落下こそが、強化学習システムが注目する応答ポイントです。フィードバックが否定的であるため、システムは調整を続けます。複数の否定的フィードバックの比較に基づいて、最終的にはロボットが小さな歩幅で歩く必要があると判断し、ロボットが転倒せずに歩けるようになるまで小さな歩幅で歩き続けます。

強化学習を通じて、ボストン・ダイナミクスのロボットは、持ち上げたり、バック宙したり、窓枠に飛び乗ったりする動作を習得した。そしてディズニー・イマジニアリングは、人型ロボットに命知らずのスタントをさせることで、これを次のレベルに引き上げました。

業界関係者の中には、強化学習と他の人工知能技術の間には大きな違いがあり、その学習パラダイムが他の技術とは異なると指摘する人もいます。データの収集やラベル付けは必要ありません。代わりに、動物や人間が住む環境と同じように、インテリジェント エージェントと呼ばれるものを環境に配置します。インテリジェント エージェントは環境と対話し、環境内でタスクを完了したり問題を解決したりする方法を学びます。

強化学習は主にエージェント、環境、状態、アクション、報酬で構成されます。エージェントは、環境の現在の状態における報酬信号に基づいてアクションを実行し、それによって環境内のさまざまな状態に到達して報酬を受け取ります。

強化学習に加えて、機械学習も大きな注目を集めています。機械学習は AI のサブセットであり、さまざまなシナリオでの経験を通じてシステムをトレーニングする機能です。車両の自律性が増すにつれて、開発者は機械学習を使用してシステムをトレーニングし、より少ないデータで物体を認識し、環境をより適切に解釈できるようになります。

ディープラーニングを見てみましょう。ディープラーニングとは、アルゴリズムを通じて限られた例から一般的なルールを要約し、それを新しい未知のデータに適用するプロセスです。たとえば、過去の症例の収集から症状と疾患のパターンを要約することができます。このようにして、新しい患者が来たときに、要約されたルールを使用して、その患者がどのような病気にかかっているかを判断できます。

では、強化学習、機械学習、ディープラーニングの違いは何でしょうか? 簡単に言えば、人工知能は機械学習、ディープラーニング、強化学習を網羅する最も広い範囲をカバーしています。人工知能を子供の脳に例えると、機械学習は子供が認知能力を習得できるようにするプロセスであり、ディープラーニングはこのプロセスにおける非常に効率的な教育システムです。

強化学習や機械学習などの技術から構成される人工知能には、非常に期待できる明るい未来が待っています。 iResearch Consultingによると、国家レベルで見ると、中国の中核人工知能産業の規模は2022年に1573億元に達し、複合成長率は58%になると予想されており、業界は引き続き急速に成長するだろう。このような広大な市場空間は、あらゆる分野の投資家の注目を集めています。

「人間中心」の人工知能の開発は社会全体の課題であり、政府、企業界、学界、すべての関係者が責任を共有し、協力して推進する必要があることは特筆に値します。企業は技術の応用と推進の主体として、逃れることのできない社会的責任を負っています。強化学習関連技術を研究するにあたり、企業は法律、規制、社会通念を意識して遵守し、秩序ある持続可能な応用を推進する必要があります。

将来、世界の持続可能な開発はデータによって生み出される価値にますます依存するようになるでしょう。そして、人工知能はデジタル経済で最も広く使われている技術の 1 つです。おそらく数年後には、AIは精密農業、スマートホーム、遠隔医療、自動運転などの分野でさらに重要な役割を果たすようになるでしょう。

<<:  2020年末総括:国際AI技術研究と政府と企業の協力の進捗状況の概要

>>:  顔認識を法的に規制する方法

ブログ    
ブログ    

推薦する

OpenAIはChatGPTを軍事目的で使用する予定か?国防総省との協力禁止が解除、元グーグルCEO「AIは核爆弾になる」

AIの兵器化?大規模言語モデルの誕生以来、人々はその潜在的な影響について議論し続けています。しかし...

...

老黄が勝利! Nvidia H100の注文は24年待ち、マスク氏も黙っていられない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

eBayは機械学習を利用してプロモーションリストを改善

​翻訳者 | ブガッティ校正:孫淑娟オンラインマーケットプレイスの eBay では、「ウォッチリスト...

工業情報化部の李英査察官:我が国の人工知能の発展は歴史的な好機を迎えている

[[253791]]工業情報化部情報技術・ソフトウェアサービス局検査官 李英氏李英氏は、一連の措置を...

顔認識、今やアニメキャラクターも例外ではない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIがシュレーディンガー方程式を正確かつ計算効率よく解く、Nature Chemistry誌に発表

量子力学の基本方程式の一つとして、シュレーディンガー方程式は常に幅広い注目を集めてきました。昨年、D...

Googleの自然言語処理はさらに一歩進んで、複雑な質問に直接答えることを可能にしました。

Google 音声検索は 2008 年に開始され、4 年後には人物、場所、物に関する情報を含む「ナ...

新しいソフトロボット:手足を再生し、自然にカモフラージュできるヒトデ

Science Fiction Network は 1 月 5 日に報じました (Liu Yazhu...

北京大学光華管理学院 周連:人工知能は中間所得層にどのような影響を与えるのでしょうか?

オピニオンリーダー | 北京大学光華管理学院文:周 連(北京大学光華管理学院副学長)新興技術である人...

将来のモバイル通信ネットワーク、6Gと人工知能の統合

将来の 6G ネットワークのより豊富なビジネス アプリケーションと極めて厳しいパフォーマンス要件を満...

AIが再び人間に勝つ:たった1枚の自撮り写真から人の性格を判別

[[327813]]新たな研究によると、人工知能(AI)は、自撮り写真だけに基づいて人の性格を識別す...

拡散モデル画像理解力がSOTAをリフレッシュ! ByteDance Fudanチームが新たな「メタプロンプト」戦略を提案

テキストから画像への (T2I) 拡散モデルは、大規模な画像とテキストのペアで事前トレーニングされて...