機械学習は興味深いものですが、実際に実行するのは難しく複雑です。ワークフローとパイプラインの組み立て、データ ソースの設定、オンプレミスのリソースとクラウドに展開されたリソースの切り替えなど、多くの手作業が必要になります。 Python は、ビッグデータや機械学習で広く使用されている強力なツール言語です。機械学習への道をスムーズに進めるために役立つ、推奨される 5 つの Python ライブラリを紹介します。 ピュレン PyWren を使用すると、Python ベースの科学計算ワークロードを複数の AWS Lambda 関数として実行できます。 The New Stack によるこのプロジェクトの以前の説明では、大量のメモリやストレージ容量を占有することなく、複数の小さなタスクに分割できるプロジェクトを処理するための強力な並列処理システムとして AWS Lamba を使用すると説明されていました。 このプロジェクトの欠点の 1 つは、Lambda 関数を 300 秒以上実行できないことです。しかし、完了までに数分しかかからず、データセット上で何千回も実行する必要があるジョブの場合は、PyWren が適しています。ユーザーのハードウェア上で実行できない作業を、ある程度クラウドに並列化できます。 Tfdeploy Google の TensorFlow フレームワークは、バージョン 1.0 のリリース後に全盛期を迎えました。この時点で、人々は次のように尋ねています。TensorFlow 自体を使用せずに、TensorFlow でトレーニングされたモデルを使用するにはどうすればよいのでしょうか。 Tfdeploy が答えを教えてくれます。トレーニング済みの TensorFlow モデルを「シンプルな NumPy ベースの呼び出し可能オブジェクト」としてエクスポートします。つまり、モデルは Python で使用でき、Tfdeploy と NumPy の数学および統計ライブラリだけが依存関係となります。 TensorFlow で実行できるほとんどの操作は Tfdeploy でも実行でき、標準の Python メタファー (クラスのオーバーライドなど) を使用してライブラリの動作を拡張できます。 ルイージ バッチ ジョブの作成は、大量のデータを処理する作業の一部に過ぎず、すべてのジョブを連結してワークフローやパイプラインのようなものを形成する必要もあります。 Luigi は、Spotify によって「長時間実行されるバッチ処理ジョブに関連するパイプラインの問題を解決する」ために作成されました。開発者は Luigi を使用して、Hive クエリ、Java の Hadoop タスク、Scala の Spark タスク、データベースからのテーブルのダンプなど、複数の異なる無関係なデータ処理タスクを取得し、それらをエンドツーエンドで実行するワークフローを作成できます。 タスクとその依存関係の記述全体は、XML 構成ファイルやその他のデータ形式ではなく、Python モジュールとして構築されるため、他の Python 中心のプロジェクトに統合できます。 クベリブ Kubernetes を機械学習ジョブのオーケストレーション システムとして使用する場合、Kubernetes が解決する問題よりも多くの問題を引き起こさないことを期待します。 Kubelib は、もともと Jenkins スクリプトを支援するために設計された、Kubernetes 用の Python インターフェースのセットを提供します。ただし、Jenkins がなくても使用でき、kubectl CLI または Kubernetes API によって公開されるすべてのものを処理できます。 パイトーチ PyTorch は、Torch7 チームによってオープンソース化された Python ファーストのディープラーニング フレームワークであり、強力な GPU アクセラレーション Tensor コンピューティング (numpy に類似) と、テープベースの自動アップグレード システム上でのディープ ニューラル ネットワークの構築という 2 つの高度な機能を提供します。必要に応じて、numpy、scipy、Cython などのお気に入りの Python パッケージを再利用して PyTorch を拡張できます。 PyTorch は、強力な GPU のパワーを活用するための numpy の代替として、またはこれまでにない柔軟性と速度を提供するディープラーニング研究プラットフォームとしてよく使用されます。 |
<<: 人工知能が農業市場に浸透:機械農業は従来の農家よりも優れている
>>: 機械学習の本質は数理統計学ですか?答えはそれほど単純ではないかもしれない
今年9月、OpenAIは初の開発者会議「OpenAI DevDay」を正式に発表した。その時、Ope...
[[264191]]少し前、米国で初となるドローン配送の「操縦免許」が正式に発行された。これを取得...
ロイター通信は6月19日、事情に詳しい4人の関係者の話として、グーグルの親会社アルファベットはチャッ...
顔認識技術は、Google、Facebook、Alibaba、Tencent、Baiduなどの国内外...
テクノロジーが私たちの日常生活を支配する時代において、サイバー脅威はますます巧妙かつ危険なものになっ...
ロボットは現代社会で生み出された新しい種です。科学技術の進歩により、ロボットの開発はもはや人間の能力...
規制は消費者と市場を保護するために導入されていますが、多くの場合、規制は複雑で、コストがかかり、遵守...
製造業は、生産、意思決定、運用効率などのアプリケーションに人工知能 (AI) が導入されることで、大...
定量取引は高頻度取引の一種です。毎日無数の取引ペアが生成されます。手動で行う場合、多くの市場機会が不...
電子コンピュータは 1940 年代に発明され、登場から 10 年以内に人類史上初の AI アプリケー...
少し前に、DeepMind による研究が Nature の表紙を飾り、直感を導くことで 2 つの主要...
人工知能に代表される新技術は、知識記憶を主眼とする中国の教育モデルの優位性を覆すことになるのだろうか...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
2021年に入ってから、自動運転分野の開発は着実に進展しており、今年1月には自動運転関連のさまざまな...