AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

[[207302]]

現代の人工知能は企業に多くの利益をもたらすと同時に、機械の認知能力も大幅に向上させました。人工知能はコンピュータサイエンスの分野における重要な技術として、かつてないスピードで急速に発展しています。研究結果が学術論文から実際の製品に変わるまでには、わずか数か月しかかかりません。しかし、開発のペースが速すぎると、この分野の新規参入者にとっては災難となる可能性があります。 AI テクノロジーに精通していることに加えて、実践者はテクノロジー プラットフォームを正しく選択する必要もあります。この記事では、各ツールキットの主な利点と欠点、および業界におけるそれぞれの支持者など、人工知能におけるディープラーニングの主要なオプションのいくつかについて説明します。

機械学習とディープラーニング

現代の人工知能技術は、機械学習とディープラーニングの 2 つのカテゴリに分けられます。現在、使用されているものの大半は前者、つまり機械学習です。これには、線形モデル、k-means クラスタリング、決定木など、データ サイエンティストが最もよく使用するアルゴリズムがいくつか含まれています。これらは現在では人工知能の一部と考えられていますが、データ サイエンティストによる長期にわたる研究の結果です。

2 つ目のタイプの AI は、過去 2 年間ではるかに多くの注目と注目を集めています。それは、ニューラル ネットワークと呼ばれる特殊な形式の機械学習で、ディープラーニングとも呼ばれます。ディープラーニングは、画像認識、音声認識、自動ゲームプレイ、自動運転車やその他の自律走行車などの人工知能、つまり「認知」技術に注目を集めています。通常、これらのアプリケーションでは、複雑なニューラル ネットワークにデータを供給してトレーニングするために大量のデータが必要です。

機械学習オプション

機械学習を処理するためのツールキットは、一般的な統計パッケージすべてに用意されています。一般的な商用製品には、SAS、SPSS、MATLAB などがあります。一般的に使用されるオープンソース ツールには、R や Python などがあります。ビッグデータ プラットフォームの Apache Spark と Hadoop にも、独自の並列機械学習ツール (Spark の MLLIB と Apache Mahout) があります。現在、Python は、scikit-learn や Anaconda などのプロジェクトにより、業界でデータ サイエンス用の最も人気のあるプログラミング言語になりつつあります。

ディープラーニングのオプション

ディープラーニングツールキットの開発は非常に急速に進んでいます。 Google、Baidu、Facebook などの学術界やデータ大手は長年にわたりディープラーニングに投資しており、いくつかの強力な選択肢を持っています。したがって、初心者は多くの選択肢に直面します。それぞれの選択には独自の利点とエコシステムがあります。

  • TensorFlow: Google の製品で、ユーザー数が最も多い。これは、以前のフレームワークに基づいて構築された「第 2 世代」のディープラーニング ライブラリです。 TensorFlow は Python 言語を使用し、ネットワークのデバッグと検査に大きな利点があるツールである TensorBoard も含まれています。 XLA コンパイル ツールはモデルの高速実行を提供し、TensorFlow Mobile は低電力モバイル デバイス向けの機械学習サポートを提供します。
  • MXNet: Amazon Web Services によって開発され、多くのユーザーがおり、多くのプログラミング言語をサポートしています。 MXNet は Apache Incubator に含まれ、Apache のトップ プロジェクトになるための道を正式に歩み始めました。
  • Deeplearning4J: Java 環境で強力であり、エンタープライズ アプリケーションにとって魅力的な、商用サポート付きのディープラーニング フレームワークです。
  • Torch: Facebook や Twitter などの企業で使用されている強力なフレームワークですが、Lua でのみ記述でき、他のプログラミング言語のサポートはあまりありません。
  • PyTorch: Torch から派生した PyTorch は、人気の Python データ サイエンス エコシステムに Torch を導入します。 2017年に立ち上げられ、FacebookやTwitterなどが支援している。 PyTorch は動的計算グラフをサポートしていますが、これは現在 TensorFlow ではサポートされていません。
  • CTNK: Python および C++ API を備えた、ディープラーニング分野における Microsoft の製品 (Java API はまだ実験段階)。
  • Caffe: コンピューター ビジョン アプリケーションに重点を置いています。コアプログラミング言語は C++ で、Python インターフェースを備えています。
  • Theano: Python で書かれた最も古いディープラーニング フレームワークの 1 つ。学術分野では広く使用されていますが、生産現場での使用には適していません。 (翻訳者注:現在は更新されていません)

これらのディープラーニング フレームワークの多くは比較的低レベルであり、開発者が使用するには便利ではありませんが、高レベルのライブラリはよりユーザーフレンドリーで、開発者に人気があります。最も重要なライブラリは Keras です。これは Python で開発されており、TensorFlow、Theano、CNTK、または Deeplearning4j で実行できるディープラーニング アプリケーションを作成するために使用できます。

Apple の機械学習への貢献も注目に値します。上記のツールキットとは異なり、Apple はモデルの実行フレームワークのみを提供します。開発者は、Caffe、Keras、scikit-learn などのツールを使用してモデルをトレーニングし、アプリが Apple の CoreML を通じて使用できるように変換する必要があります。

どこから始めましょうか?

TensorFlow Github スター数、2017 年 2 月。

どちらかを選択する明確な理由がない場合は、大多数の開発者の経験、人工知能分野における Google の評判、Python エコシステムの重要性に基づいて、Keras と TensorFlow の組み合わせがデフォルトの選択肢となります。 TensorFlow の人気は急速に高まっており、短期的には多数のデータ ツールと互換性を持つようになります。たとえば、Spark での TensorFlow と Keras を使用したディープラーニングのサポートに関する Databricks の最近の発表を見ることができます。

同時に、Amazon Web Services による MXNet への強力なサポート、MXNet 自身の成長率、Apache プロジェクトになったことなどにより、MXNet は重要な代替手段の 1 つとなっています。 Microsoft による Azure への強力なサポートにより、CNTK は同社にとって重要な成果となります。

ディープラーニングは急速に進化している分野であり、すべてのクラウドプロバイダーは機械学習を戦略的な目標として検討しています。幸いなことに、彼らは皆オープンソースを選択しました。ディープラーニングのコンピューティング リソースがクラウドと GPU に集中する傾向が強まっているため、ディープラーニングを学習したい人にとってはオープン ソース コードは朗報です。

<<:  2017 年に最も価値のある機械学習のスキルや知識は何ですか?

>>:  機械学習ソートLTR:線形モデルを簡単に始める

ブログ    
ブログ    
ブログ    

推薦する

カリフォルニア大学バークレー校のDeepMindと他の企業が共同で、仮想と現実の境界を打ち破る現実世界シミュレーターをリリースした。

現実世界のシミュレーターが登場!トレーニングされた大規模モデルが現実の物理世界に適応できないのではな...

人工知能に関しては 5 つの主要な考え方があります。あなたはどれを支持しますか?

将来の雇用状況は依然としてテクノロジー大手やCEOによって決定されますが、人工知能の将来は依然として...

「ビッグモデルは基本的に2つのファイルです!」テスラの元AIディレクターが一般向けに1時間にわたるLLMポピュラーサイエンスを披露

テスラの元AIディレクター、アンドレイ・カルパシー氏の新しいチュートリアルが話題になっている。今回、...

10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認...

...

...

AI特許出願件数は世界第1位で、世界総出願件数の約4分の3を占める。

先日蘇州で開催された中国人工知能産業2020年年次大会で発表された「2020年中国人工知能発展報告書...

AI 開発の方向性に関する大論争: ハイブリッド AI?強化学習?実践的な知識と常識をAIに統合する?

[[396127]]著者: Ben Dickson はソフトウェア エンジニアであり、テクノロジー...

...

機械学習の第一歩、ランダムフォレストのステップバイステップの入門書です

2020 年には、すでに多くの楽しい機械学習チュートリアルが見つかります。この記事では、最も人気のあ...

AIビデオ監視の普及における3つの大きな課題

近年、セキュリティビデオ監視はソフトウェアとハ​​ードウェアの両方で大きな技術的進歩を遂げており、さ...

...

...