AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

[[207302]]

現代の人工知能は企業に多くの利益をもたらすと同時に、機械の認知能力も大幅に向上させました。人工知能はコンピュータサイエンスの分野における重要な技術として、かつてないスピードで急速に発展しています。研究結果が学術論文から実際の製品に変わるまでには、わずか数か月しかかかりません。しかし、開発のペースが速すぎると、この分野の新規参入者にとっては災難となる可能性があります。 AI テクノロジーに精通していることに加えて、実践者はテクノロジー プラットフォームを正しく選択する必要もあります。この記事では、各ツールキットの主な利点と欠点、および業界におけるそれぞれの支持者など、人工知能におけるディープラーニングの主要なオプションのいくつかについて説明します。

機械学習とディープラーニング

現代の人工知能技術は、機械学習とディープラーニングの 2 つのカテゴリに分けられます。現在、使用されているものの大半は前者、つまり機械学習です。これには、線形モデル、k-means クラスタリング、決定木など、データ サイエンティストが最もよく使用するアルゴリズムがいくつか含まれています。これらは現在では人工知能の一部と考えられていますが、データ サイエンティストによる長期にわたる研究の結果です。

2 つ目のタイプの AI は、過去 2 年間ではるかに多くの注目と注目を集めています。それは、ニューラル ネットワークと呼ばれる特殊な形式の機械学習で、ディープラーニングとも呼ばれます。ディープラーニングは、画像認識、音声認識、自動ゲームプレイ、自動運転車やその他の自律走行車などの人工知能、つまり「認知」技術に注目を集めています。通常、これらのアプリケーションでは、複雑なニューラル ネットワークにデータを供給してトレーニングするために大量のデータが必要です。

機械学習オプション

機械学習を処理するためのツールキットは、一般的な統計パッケージすべてに用意されています。一般的な商用製品には、SAS、SPSS、MATLAB などがあります。一般的に使用されるオープンソース ツールには、R や Python などがあります。ビッグデータ プラットフォームの Apache Spark と Hadoop にも、独自の並列機械学習ツール (Spark の MLLIB と Apache Mahout) があります。現在、Python は、scikit-learn や Anaconda などのプロジェクトにより、業界でデータ サイエンス用の最も人気のあるプログラミング言語になりつつあります。

ディープラーニングのオプション

ディープラーニングツールキットの開発は非常に急速に進んでいます。 Google、Baidu、Facebook などの学術界やデータ大手は長年にわたりディープラーニングに投資しており、いくつかの強力な選択肢を持っています。したがって、初心者は多くの選択肢に直面します。それぞれの選択には独自の利点とエコシステムがあります。

  • TensorFlow: Google の製品で、ユーザー数が最も多い。これは、以前のフレームワークに基づいて構築された「第 2 世代」のディープラーニング ライブラリです。 TensorFlow は Python 言語を使用し、ネットワークのデバッグと検査に大きな利点があるツールである TensorBoard も含まれています。 XLA コンパイル ツールはモデルの高速実行を提供し、TensorFlow Mobile は低電力モバイル デバイス向けの機械学習サポートを提供します。
  • MXNet: Amazon Web Services によって開発され、多くのユーザーがおり、多くのプログラミング言語をサポートしています。 MXNet は Apache Incubator に含まれ、Apache のトップ プロジェクトになるための道を正式に歩み始めました。
  • Deeplearning4J: Java 環境で強力であり、エンタープライズ アプリケーションにとって魅力的な、商用サポート付きのディープラーニング フレームワークです。
  • Torch: Facebook や Twitter などの企業で使用されている強力なフレームワークですが、Lua でのみ記述でき、他のプログラミング言語のサポートはあまりありません。
  • PyTorch: Torch から派生した PyTorch は、人気の Python データ サイエンス エコシステムに Torch を導入します。 2017年に立ち上げられ、FacebookやTwitterなどが支援している。 PyTorch は動的計算グラフをサポートしていますが、これは現在 TensorFlow ではサポートされていません。
  • CTNK: Python および C++ API を備えた、ディープラーニング分野における Microsoft の製品 (Java API はまだ実験段階)。
  • Caffe: コンピューター ビジョン アプリケーションに重点を置いています。コアプログラミング言語は C++ で、Python インターフェースを備えています。
  • Theano: Python で書かれた最も古いディープラーニング フレームワークの 1 つ。学術分野では広く使用されていますが、生産現場での使用には適していません。 (翻訳者注:現在は更新されていません)

これらのディープラーニング フレームワークの多くは比較的低レベルであり、開発者が使用するには便利ではありませんが、高レベルのライブラリはよりユーザーフレンドリーで、開発者に人気があります。最も重要なライブラリは Keras です。これは Python で開発されており、TensorFlow、Theano、CNTK、または Deeplearning4j で実行できるディープラーニング アプリケーションを作成するために使用できます。

Apple の機械学習への貢献も注目に値します。上記のツールキットとは異なり、Apple はモデルの実行フレームワークのみを提供します。開発者は、Caffe、Keras、scikit-learn などのツールを使用してモデルをトレーニングし、アプリが Apple の CoreML を通じて使用できるように変換する必要があります。

どこから始めましょうか?

TensorFlow Github スター数、2017 年 2 月。

どちらかを選択する明確な理由がない場合は、大多数の開発者の経験、人工知能分野における Google の評判、Python エコシステムの重要性に基づいて、Keras と TensorFlow の組み合わせがデフォルトの選択肢となります。 TensorFlow の人気は急速に高まっており、短期的には多数のデータ ツールと互換性を持つようになります。たとえば、Spark での TensorFlow と Keras を使用したディープラーニングのサポートに関する Databricks の最近の発表を見ることができます。

同時に、Amazon Web Services による MXNet への強力なサポート、MXNet 自身の成長率、Apache プロジェクトになったことなどにより、MXNet は重要な代替手段の 1 つとなっています。 Microsoft による Azure への強力なサポートにより、CNTK は同社にとって重要な成果となります。

ディープラーニングは急速に進化している分野であり、すべてのクラウドプロバイダーは機械学習を戦略的な目標として検討しています。幸いなことに、彼らは皆オープンソースを選択しました。ディープラーニングのコンピューティング リソースがクラウドと GPU に集中する傾向が強まっているため、ディープラーニングを学習したい人にとってはオープン ソース コードは朗報です。

<<:  2017 年に最も価値のある機械学習のスキルや知識は何ですか?

>>:  機械学習ソートLTR:線形モデルを簡単に始める

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

OpenAI は GPT-4 をすべての有料 API ユーザーに公開します

OpenAIは7月7日、今年3月にGPT-4をリリースしたが、テストへの参加を申請した一部の開発者の...

機械学習に関する9つの誤解

機械学習のようにテクノロジーが大々的に宣伝されると、多くの誤解が生じます。ここでは、機械学習が提供で...

...

Nature サブジャーナル: 機械学習を使用してヒトの遺伝子制御の背後にある「文法」を明らかにする

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

声を上げてください! MakeItTalkの魔法でモナリザと会話できる

最近、マサチューセッツ大学アマースト校のヤン・チョウ博士とそのチームは、「MakeItTalk」と呼...

MySQLインデックスの背後にあるデータ構造とアルゴリズムの原理

序文プログラミングの分野では、「プログラム = データ構造 + アルゴリズム」というよく知られたルー...

実用的! Python の日付と時刻の処理と計算: 時間を節約し、正確に計算します

Python の datetime モジュールは、日付と時刻の処理と計算のための豊富な機能を提供しま...

...

人工知能の開発における主な成果は何ですか?また、どのような課題に直面していますか?

現代の人工知能は、現代の科学技術の中で最も驚くべき強力な技術の 1 つとなり、破壊的な技術でもありま...

完全自動サポートにより、ドローンは真の「無人」になります。

ドローンについては皆さんもよくご存知だと思います。近年、無人運用の需要が継続的に高まり、さまざまな最...

AI技術のアップグレード:2022年に最も人気のある人工知能技術トップ10

AI人工知能技術は、電子商取引、物流、輸送、工業など、多くの業界で応用されています。人工知能は、あ...

大量データストリームのベストプラクティス

概要: 膨大な量のデータを効率的に分析するために、科学者はまず大量の数字を細分化する必要があります。...

生成AIを使用して学生のイノベーションを促進する

今年も新学期がやってきましたが、教育者は AI テクノロジーの爆発的な進歩によって大きな倫理的プレッ...

地下鉄路線図のための高速経路探索アルゴリズム

1. 概要過去2日間、Blog Parkで地下鉄マップの実装について話していました。その前に、私もク...