この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 強化学習 (RL) の登場以来、AI は StarCraft をプレイして Atari の王者になれるようになり、専門家を魅了し、素人を驚かせてきました。 こちらは1万以上の星を獲得した強化学習リソースです。チュートリアルの推奨だけでなく、サポート演習も用意されています。ネットユーザーからは学習後の評価が高く、リアルタイムで更新もされています。 入学要件は厳しくなく、数学と機械学習に関する基礎知識のみが必要です。 明確な学習パス強化学習を始めたいなら、質の高いコースが不可欠です。 強化学習のリソースは何千もありますが、プロジェクト作成者の Denny Britz は次の 2 つを強く推奨しています。 デビッド・シルバーの強化学習コース: http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html リチャード・サットンとアンドリュー・バートの『強化学習入門(第2版)』 http://incompleteideas.net/book/RLbook2018.pdf ps 実際のテストには魔法は必要ありません デニー・ブリッツ氏は、この2冊の本には強化学習を始めるために知っておくべき研究論文がほぼ網羅されていると語りました。基礎が高さを決めるので、理論的な知識もしっかりと学ぶ必要があります。 理論はありますが、本にはアルゴリズムの実装はありません。 心配しないでください。Denny Britz は、Python、OpenAI Gym、Tensorflow を使用して標準的な強化アルゴリズムのほとんどを個人的に実装し、教材と組み合わせて誰もが使用できるように共有しています。 それはとても思いやりのあることだ。 この Wanxing リソースでは、各フォルダーは教科書の 1 つ以上の章に対応しています。各フォルダーには、演習と解答に加えて、学習目標のセット、基礎となる概念の概要、および関連リンクが含まれています。 「モデルベースの強化学習: 動的プログラミングを使用したポリシー反復と値反復」の章を例に挙げます。 この章は、David Silver の RL コース「動的プログラミング計画」の 3 番目の講義の補足です。 まず、学習目標は次のとおりです。
学習目標を設定すると、このチュートリアルで重要な概念も強調表示されます。 最後に、実践的な演習を紹介します。 大きな枠組みは設定されています。空白を埋める方法に集中するだけです。 標準的な回答は記事の最後に添付されています。 実装されたアルゴリズムのリストこのチュートリアルでは、次のアルゴリズムの実装について説明します。
学習パスは非常に明確で、非常に質の高いリソースなので、評価してみませんか? ポータル: https://github.com/dennybritz/reinforcement-learning |
<<: IoT、ビッグデータ、AIの現状はどうなっているのでしょうか?
>>: ZTEのインテリジェントビデオReIDアルゴリズムは大きな進歩を遂げ、3つの主要なデータセットで世界記録を更新しました。
[[239590]] 8月6日、自動運転車、ロボット医師、10億人を超える中国国民を対象とした社会...
[[329133]] DeepMind は今週、強化学習最適化フレームワーク Acme をリリース...
上海ノキアベル株式会社(以下、「ノキアベル」)は、ノキアグループと中国保利集団の子会社である華新郵電...
ハッシュは、一般的に「ハッシュ」と翻訳され、「ハッシュ」と直接書き起こされることもあります。ハッシュ...
[[354709]]みなさんこんにちは。今日もディープラーニングについてお話していきましょう。クラ...
ソフトウェアとアプリケーションは今日世界を支配しており、ビジネスを成功させるにはトレンドに遅れずにつ...
今日では、人々の仕事や生活のあらゆる側面がテクノロジーによって支援されています。人工知能はそのような...
「ビジネスを運営する観点から見ると、人工知能には2つの陣営があります。1つは人工知能プラットフォーム...
マイクロソフトは米国現地時間9月22日木曜日、人工知能アシスタント「コパイロット」の最新バージョンを...
グーグルは7月28日、ゴミ捨てなどのタスクを理解できるようロボットを訓練するのに役立つ新しい人工知能...
2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...
[[334032]]顔認識と 3D テクノロジーが融合したとき、最終的な勝者は誰になるでしょうか? ...
人工知能 (AI) テクノロジーは、ビジネス プロセスの合理化、運用コストの削減、面倒なタスクの自動...
Appleの春のカンファレンスまで残り4日となりました。カラフルなAR招待状が届きました。これはク...