推奨される 5 つのオープンソースオンライン機械学習環境

推奨される 5 つのオープンソースオンライン機械学習環境

[51CTO.com クイック翻訳] 機械学習は、機械が直接プログラムされることなく学習できるようにする研究分野です。多くの学生、教師、開発者、データ サイエンティストが機械学習を使用してさまざまなプロジェクトや製品を開発しているため、機械学習の開発は急成長しています。ただし、機械学習モデルの開発にはシステム仕様に対する高い要求が課せられ、モデルのトレーニング プロセスには 2 時間から 2 日、あるいはそれ以上かかる場合もあります。そのため、ローエンドのシステムでは機械学習モデルのトレーニングを処理できず、たとえモデルをほとんどトレーニングできなかったとしても、深刻なシステム問題が発生する可能性があります。

[[345808]]

ただし、システム仕様に関する要件がなく、クラウド インフラストラクチャを使用して最短時間でモデルをトレーニングできるオープン ソースの機械学習環境は数多くあります。以下に、効率的で一般的に使用されているオンライン機械学習環境をいくつか示します。

1. Google コラボラトリー

これは、製品やプロジェクトの開発のために Google が提供する、簡単にアクセスできるクラウド サービスです。無料の GPU をサポートし、Jupyter Notebooks 環境に基づいています。 PyTorch、TensorFlow、Keras などの広く使用されているライブラリを使用して、機械学習およびディープラーニング アプリケーションを誰でも構築できるフォーラムを提供します。これにより、システムは機械学習アクティビティのワークロード全体を処理する必要がなくなります。これは、同種のプラットフォームの中で最も成功したものの 1 つです。

  • メモリ - 12 GB ~ 26.75 GB
  • ディスク容量 - 25 GB
  • CPUコア数—2
  • サポートされている言語 - Python

2. IBMワトソン

IBM は、オープンソース ソリューションをサポートする Watson Data Platform と Data Science Experience (DSX) をリリースしました。ついに、データ サイエンスのワークロードに最適なマルチクラウド プラットフォームがリリースされました。これは、Kubernetes によるコンテナ化によって実現されます。したがって、データを保存する Docker または CloudFoundry コンテナーに配布できます。

  • メモリ – 16GB
  • ディスク容量 - 90 GB
  • CPUコア数—4
  • サポートされている言語 - Apache Spark、Python、R、Scala

3. Kaggleカーネル

これは、クラウドでのディープラーニングおよび機械学習アプリケーションに最適なプラットフォームです。 Kaggle と Colab には多くの類似点があり、どちらも Google の製品です。ブラウザで Jupyter Notebook をサポートします。 Jupyter Notebook のキーボード ショートカットの多くは、Kaggle とほぼ同じです。 Kaggle には膨大なデータセットと、データ サイエンス スキルの促進、学習、検証に特化した幅広いコミュニティがあります。 Kaggle カーネルでの GPU と TPU の使用にはいくつかの制限があります。

  • メモリ—25GB
  • ディスク容量 - 155 GB
  • CPUコア - 1
  • サポートされている言語 - PythonとR

4. コクラック

これは、コンピューティング、リサーチ、コラボレーション、ドキュメント作成のための仮想オンライン ワークスペースです。これには、さまざまな科学言語の使用、LaTeX、R/knitr、または Markdown でのテキスト作成機能の提供、Web ベースの Linux コンソール、タイムトラベル機能、チャット ルームやコース管理などの Web リソースが含まれます。ただし、ほとんどの機能は有料ユーザーのみが利用できます。

  • メモリ – 16GB
  • ディスク容量 - 20 GB
  • CPUコア数 – 3
  • サポートされている言語: Julia、Octave、Python、SageMath、R Statistics など。

5. マイクロソフト アジュール

Microsoft の Azure Notebooks は機能的には Colab に似ていますが、速度では Colab よりもはるかに優れています。 Azure Notebooks は、ライブラリと呼ばれるリンクされたノートブックのコレクションです。これらのライブラリは、各データ ファイルが 100 MB 未満であれば、データを保存することもできます。 Azure Notebooks は基本的なアプリケーションに適しています。 Azure では 12 か月間の無料サービスのみが提供されます。

  • メモリ—可変
  • ディスク容量 - 可変
  • CPU コア数 – 可変
  • サポートされている言語 - Python、R、F#

原題: オープンソースのオンライン機械学習環境トップ 5、著者: Rituraj Saha

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  MD5アルゴリズムの暗号化プロセス

>>:  さあ、アルゴリズムの複雑さをもう一度理解しましょう!

ブログ    

推薦する

DeSRAは欠陥を検出して除去し、実際のシーンの超解像におけるGANをより完璧にします

生成的敵対的ネットワーク (GAN) を使用した画像超解像 (SR) は、リアルな詳細を復元する上で...

...

SQL Serverは最短経路検索アルゴリズムを実装しています

これは去年の質問です。今日メールを整理していたら偶然見つけました。とても興味深いと思ったので書き留め...

IoTと機械学習がビジネスを加速させる5つの方法

モノのインターネットと機械学習は、今日のビジネスにおいて最も破壊的なテクノロジーの 2 つです。さら...

将来、仮想現実、人工知能、そして人体はどのように融合するのでしょうか?

仮想現実や人工知能などのテクノロジーが人体とどのように統合されるかを探ります。将来、仮想現実と現実の...

...

...

自動運転事故の安全問題をどう解決するか?

[[418475]]かつては空想の技術だった自動運転が、今や徐々に現実のものとなりつつある。 Go...

Google のアルゴリズムにどんな恥ずかしいことが起こったのでしょうか?

ここには Google が意図的に行ったジョークがあると思われます。周知のとおり、Google の柱...

2024 年にビジネスを一変させる可能性のあるテクノロジーはどれでしょうか?

2023 年は、世界中の政府、公共部門、企業、さらには一般大衆の生活を大きく変えるテクノロジーの急...

人間の審判が解雇される?冬季オリンピックのテストマッチで選手の得点をつけた人物はAIだった

2021年の欧州選手権でイングランドはデンマークを破り、初めて欧州選手権決勝に進出した。歴史に名を残...

マイクロソフトがAI開発に関する無料電子書籍をリリース、インテリジェントなチャットボットの構築方法を教える

最近、Microsoft は、Microsoft AI プラットフォームを使用してインテリジェントな...

...

AIはスペインの流行において重要な役割を果たし、新規感染者の死亡率を半減させた。

[[361228]]スペインは、感染者数が170万人を超え、欧州で新型コロナウイルスのパンデミック...