ディープラーニングツール ディープラーニングの進歩は、ソフトウェア インフラストラクチャの進歩にも大きく依存しています。 Torch (2011)、Theano (2012)、DistBelief (2012)、PyLearn2 (2013)、Caffe (2013)、MXNet (2015)、TensorFlow (2015) などのソフトウェア ライブラリはすべて、重要な研究プロジェクトや商用製品をサポートできます。 ディープラーニングといえば、私が個人的に触れたのは2015年です。実はこの技術は長らく隠れていたのですが、2012年に爆発的に普及し、AI分野の主流となりました。今日は、最も実用的かつ最もよく遭遇する側面、つまりフレームワーク、つまりツールについてお話ししましょう。 あなたが知っているツールにはどのようなものがありますか? ? ? 今日は私が使用したツールを皆さんと共有したいと思います。お気に入りのツールを見つけて、それを使って「エリクサーを作る」ことができればと思います(意味がわからない場合は、Baiduで検索してください)笑!
大学院に入ってから、私が出会ったディープラーニングツールの数は片手で数えられるほどです。興味のある方は深く検索してみてください。インターネット上にはまだまださまざまな意見があります。次に、私自身の実践経験に基づいたディープラーニングツールについてお話します。マトラボ マトラボ 私がディープラーニングを学び始めたとき、最初に使用したツールはディープラーニング用の Matlab ツールボックスである DeepLearnToolbox でした。 ディープラーニングは機械学習の新しい分野です。ディープデータモデルの学習に重点を置いています。その主なインスピレーションは、人間の脳の表面にある深い階層構造にあります。ディープラーニング理論の優れた概要は、人工知能のディープアーキテクチャの学習です。このツールボックスは比較的シンプルです。当時は手書き数字と顔の分類(AR顔データベース)を作っていました。主に以下の内容が含まれます。 NN: フィードフォワード BP ニューラル ネットワークのライブラリ CNN: 畳み込みニューラルネットワークのライブラリ DBN: ディープビリーフネットワークのライブラリ SAE: スタック型オートエンコーダのライブラリ CAE: 畳み込みオートエンコーダのライブラリ Util : ライブラリで使用されるユーティリティ関数 データ:データ保存 テスト: ツールキットが動作していることを確認するためのテスト ケースは以下のとおりです
操作インターフェースは比較的シンプルです。 パイトーチ Pytorch ライブラリについては、実はあまり使っていません。気軽に試した程度です。個人的には触らないほうがいいと思います。面白くないですから。以下で簡単に触れるだけにします。 これは、2 種類のユーザーを対象とした Python ベースの科学計算パッケージです。 1 つは GPU を使用して numpy を置き換えることです。もう 1 つは、最大限の柔軟性と速度を提供するディープラーニング レスキュー プラットフォームです。 ディープラーニングの場合、torch.nn パッケージを使用してニューラル ネットワークを構築できます。 autograd パッケージはすでに知られています。nn パッケージは、モデルの定義と導関数の実行に autograd パッケージに依存しています。 nn.Module には、レイヤーと、出力を返す faward(input) メソッドが含まれています。 ケースは以下のとおりです
具体的な操作や詳しい手順については、興味のある方は実際に触ってみてください! カフェ Caffe の作者はカリフォルニア大学バークレー校の Yangqing Jia です。 Caffe は、コマンドライン、Python、Matlab インターフェースをサポートし、CPU/GPU 上で実行できる C++/CUDA フレームワークです。 ディープラーニングは絶えず発展しており、それに対応する実験ツールも注目を集めています。 Caffe は、人気のディープラーニング フレームワークの 1 つです。ツールにはテンプレートがあらかじめ用意されているため、ツールには既製のプログラミング フレームワークがあり、現在人気のグラフィックス コンピューティング GPU と組み合わせて使用することで、ネットワーク トレーニングを高速化できます。人気のニューラル ネットワーク フレームワーク アルゴリズムはすべて Caffe で実行でき、Caffe ではさまざまな構造があらかじめ定義されているため、独自のフレームワークをセットアップできます。研究者は、独自の設計要件に基づいて対応する追加を行い、必要なタスクを完了するための新しいディープラーニング フレームワークを設計することもできます。 Caffe フレームワークには、 Blobs 、 Layers 、 Netsという 3 つの主要な構造があります。これらは事前定義された構造であるため、フレームワークを使用するときに変更することはできません。 ブロブBlob は Caffe フレームワークの主要な構造です。これはラッパーです。Caffe フレームワークを使用する場合、データをフォーマットする必要があります。このようなデータ形式のみが Caffe フレームワークで実行および処理できます。さらに、Caffe の設計時には、多くの関数とクラスが事前に設計されており、実行中にその構造を変更することはできず、そうしないとその中の関数を呼び出すことができず、ネットワークのトレーニングが失敗します。 Blob のフォーマットは、主に数値、チャンネル、高さ、幅の 4 つの要素で構成されています。画像処理を行う場合、画像チャンネルを表します (一般的に、カラー画像は 3 チャンネル データであり、高さと幅は入力データのサイズを表します)。要素に関しては、主にトレーニング プロセスに反映されます。トレーニング中に、一度にどのくらいのデータを入力するか、つまり、一度に入力するデータの数 (通常はバッチと呼ばれます) を選択する必要があるためです。このトレーニング方法は、メモリ不足を大幅に緩和することもできます。 レイヤーレイヤーは、Caffe フレームワークのネットワークの重要な構造の 1 つです。ネットワークは、入力データと出力データを受け取り、最終的に内部計算によって出力するレイヤーの役割によって構成されます。 Caffe がネットワーク層を使用する場合、その定義は特に単純かつ明確であり、おおよそ次の 3 つの小さなステップに分かれています。 ネット先ほど紹介したレイヤーはネットのサブ要素です。ネット全体は複数のレイヤーを組み合わせて接続することで得られます。この構造では、ネットはネットワークのレイヤー、入力、出力を定義します。 たとえば、Caffe の最も基本的な隠し層ネットワークは次のように定義されます。
カフェのメリット
TF Google は 2011 年に人工ディープラーニング システムである DistBelief を立ち上げました。 DistBelief を使用すると、Google はデータセンター内の何千ものコアをスキャンし、より大規模なニューラル ネットワークを構築できます。このシステムにより、Google アプリの音声認識が 25% 向上し、Google フォトに画像検索機能が構築され、Google の画像キャプション マッチング実験が促進されます。 DistBelief にはまだ多くの欠点と制限があります。設定が難しく、Google の内部インフラストラクチャに密接に結び付けられていたため、研究コードの共有は不可能でした。 上記の問題に対応して、Google は 2015 年に Google Research Blog で新世代の人工知能学習システムである TensorFlow のリリースを発表しました。 TensorFlow は、異種分散システム向けの大規模機械学習フレームワークです。優れた移植性 (携帯電話のような小型のモバイル デバイスから大規模なクラスターまでサポート可能) を備え、さまざまなディープラーニング モデルをサポートしています。 Google によれば、TensorFlow は包括的、柔軟、移植性があり、使いやすく、さらに重要なことにオープンソースです。同時に、TensorFlow の速度は前世代の DistBelief と比べて大幅に向上しました。いくつかのベンチマークテストでは、TensorFlow のスコアは第 1 世代システムの 2 倍です。 それにもかかわらず、TensorFlow はまだ他のほとんどのオープンソース フレームワークほど効率的ではありません。しかし、TensorFlow のソースコードが徐々に公開されるにつれて、新しいハードウェア、新しいデバイス、cuDNN などの新しいアクセラレーションのサポートが増え続けており、現時点で最も有望なディープラーニング手法となっています。 ご興味があれば、PlayGround をお試しください。これは、教育目的でシンプルなニューラル ネットワークのオンライン デモンストレーションと実験を行うためのグラフィカル プラットフォームです。ニューラル ネットワークのトレーニング プロセスを非常に強力に視覚化します。ブラウザでニューラル ネットワークをトレーニングし、Tensorflow を知覚的に理解するために使用できます。 TFのデメリット
今日はここまでにしましょう。たくさん話しましたが、あまり深くは話せませんでした。機会があれば、ディープラーニングツールに関する特別なトピックを設けて、一緒に話しましょう! |
<<: 地下鉄も自動運転となり、国内最速の鉄道客車が北京で公開される。
>>: Google Brain の公開: アルゴリズムのエラー修正と AI バイアスの解決に重点を置く
前回のシリーズの記事「機械学習とディープラーニングの違いは何でしょうか?」に続き、簡単に説明した後、...
[[220537]]リアム・ヘーネル編纂者:趙怡雲、江宝尚、銭天培新年を前に、温翁氏は音声認識から...
車に乗り込み、コードをスキャンすると、運転手が操作しなくても黒い「タクシー」が動き出す。横断歩道では...
夏がまたやって来て、雷雨がまた虫を追い払います。最近では、夏の気温が上昇し続けているため、雨天が多く...
PyTorch は、次の 2 つの高レベル機能を提供する Python パッケージです。強力な GP...
Google や Facebook のアルゴリズムを理解しなければ、面接に合格することはできません。...
[[279631]]中国の従業員は職場でロボットをより信頼しているのでしょうか?調査によると、中国の...
北京地下鉄は昨年11月から、セキュリティチェックに顔認識技術を使用する試験運用を開始し、ブラックリス...
医療用人工知能製品は多様化しており、下流の需要は強い医療人工知能産業の上流は、主に医療データマイニン...
これは、Transformer や GPT などの複数のモデルの高速推論を完全にサポートする業界初の...
「Qwen-72Bモデルは11月30日に発売されます。」数日前、Xプラットフォームのネットユーザー...
[[265146]]自然言語処理の基礎を学び、2 つの便利な Python パッケージを調べます。自...