機械学習インフラストラクチャを Python ではなく Go で記述する理由は何ですか?

機械学習インフラストラクチャを Python ではなく Go で記述する理由は何ですか?

[[314943]]

Python が機械学習プロジェクトで人気のある言語であることは間違いありません。

R、C++、Julia などの言語にはそれぞれ独自のニッチとユースケースがあり、それによって長く使われていますが、Python は依然として最も広く使用されている言語であり、すべての主要な機械学習フレームワークで使用されています。

しかし、想像できますか? Cortex (機械学習モデルを API として展開するためのオープンソース プラットフォームの 1 つ) のコード ベースでは、コードの 87.5% が GO で書かれています。

画像ソース: Cortex GitHub

Python が誇る機械学習アルゴリズムは、実稼働の機械学習システムのコンポーネントの 1 つにすぎません。実際に大規模な本番環境で機械学習 API を実行するには、インフラストラクチャに次の要件が必要です。

  • トラフィックの変動が API に支障をきたさないように自動スケーリングします
  • API同期の展開を処理するためのAPI管理を実装する
  • ローリングアップデートにより、モデルの更新によってユーザーサービスが中断されることがなくなります。

Cortex は、上記のインフラストラクチャのすべてに加えて、ログ記録やコストの最適化などのその他の懸念事項も自動化することを目指しています。

Go は、次の理由から、上記の要件を満たすソフトウェアを構築するのに理想的な選択肢です。

1. Goエコシステムはインフラプロジェクトに適している

[[314944]]

出典: zcool

オープンソースの利点の 1 つは、尊敬するプロジェクトから継続的に学習できることです。たとえば、Cortex は Kubernetes (それ自体が Go で記述されています) エコシステム内に存在します。幸運なことに、このエコシステムには、次のような参照できる優れたオープンソース プロジェクトが数多くあります。

  • kubectl: Kubernetes CLI
  • minikube: Kubernetesをローカルで実行するためのツール
  • helm: Kubernetes パッケージ管理ツール
  • kops: 本番環境のKubernetesを管理するためのツール
  • eksctl: Amazon EKS の公式 CLI

上記のツールはすべて Kubernetes プロジェクトだけではなく、Go で書かれています。 CockroachDB や Hashicorp のインフラストラクチャ プロジェクト (Vault、Nomad、Terraform、Consul、Packer など) を見ると、すべて Go で書かれていることがわかります。

インフラストラクチャ分野での Go の人気によるもう 1 つの影響は、インフラストラクチャに関心のあるエンジニアのほとんどが Go 言語に精通していることです。したがって、GO を通じてこれらのエンジニアを引き付けるのは簡単です。実際、Cortex Labs の優秀なエンジニアの 1 人が、AngelList で Go 関連の求人を検索して私たちを見つけました。彼が私たちを見つけてくれたことはとても幸運だと思っています。

2. 機械学習のインフラストラクチャでは同時実行性が重要

ユーザーは、さまざまなモデルをさまざまな API として展開し、すべてのモデルを同じ Cortex クラスターで管理できます。 Cortex Operator は、これらのさまざまなデプロイメントを管理するためにいくつかの API も使用する必要があります。例:

  • Cortex は Kubernetes API を呼び出して、クラスターにモデルをデプロイします。
  • Cortex は、さまざまな AWS API (EC2 Auto Scaling、S3、CloudWatch など) を呼び出して、AWS 上のデプロイメントを管理します。

ユーザーはこれらの API と直接対話しません。代わりに、Cortex はこれらの API をプログラムで呼び出して、クラスターをプロビジョニングし、デプロイメントを開始し、API を監視します。

効率的かつ信頼性の高い方法で API を相互に呼び出すことは大きな課題です。 API を並行して使用するのが、最もパフォーマンスの高いアプローチですが、競合状態などを心配する必要があるため、問題も発生します。

Go はこの問題に対する簡単な解決策を提供します: Goroutines。

Goroutine は、並行してコードを実行する Go の通常の関数です。 Goroutine が舞台裏でどのように動作するかを詳しく説明するには、別の長い記事を書く必要がありますが、簡単に言うと、Goroutine は Go ランタイムによって自動的に管理される軽量スレッドです。複数の Goroutine を 1 つの OS スレッドに配置できます。Goroutine が OS スレッドをブロックすると、Go ランタイムは残りの Goroutine を新しい OS スレッドに自動的に移動します。

Goroutine は、ユーザーが Goroutine 間でメッセージを渡すことを可能にする「チャネル」と呼ばれる機能も提供し、ユーザーがリクエストをスケジュールし、競合状態を防ぐのに役立ちます。

もちろん、ユーザーは asyncio などの最新ツールを使用して Python でこれらの機能を実装することもできますが、Go はこれらの状況を念頭に置いて設計されており、GO を使用すると仕事や生活の負担を軽減できます。

3. Goでのプログラミングは楽しい

[[314945]]

出典: Pexels

Cortex の構築に Go を使用した最後の理由は、Go 言語が非常に優れているからです。

Python と比較すると、Go を使い始めるのは少し大変です。ただし、Go の包括性により、大規模なプロジェクトでも快適に使用できます。私たちは依然としてソフトウェアを厳密にテストしていますが、静的型付けとコンパイル(Go 初心者にとって大きな悩みの種)がガードレールとして機能し、(比較的)バグのないコードを書くのに役立ちます。

他の言語には特定の利点があると主張することもできますが、全体的には、Go が私たちの技術的および美的ニーズを最もよく満たしています。

4. Goを使用するとクロスプラットフォームCLIの構築が簡単になります

Cortex CLI は、ユーザーがコマンドラインから直接モデルをデプロイし、API を管理できるようにするクロスプラットフォーム ツールです。次のアニメーションは、CLI の動作を示しています。

画像ソース: Cortex GitHub

当初、CLI は Python で作成しましたが、プラットフォーム間で CLI を配布するのは非常に困難であることが判明しました。 Go はバイナリをコンパイルできるため (依存関係の管理なし)、追加のエンジニアリング作業を行わずにプラットフォーム間で CLI を配布するための便利で簡単なソリューションを提供します。

Go のコンパイルされたバイナリ コードは、インタープリタ型言語に比べて明らかにパフォーマンス上の利点があります。コンピュータのベンチマークによると、GO は Python よりもはるかに高速です。

他の多くのインフラストラクチャ CLI ツールも Go で書かれているのはおそらく偶然ではありません。

Pythonは機械学習用、Goはインフラ用

私たちはまた、特に推論の処理において Cortex で強力な存在感を発揮する Python も気に入っています。

Cortex は TensorFlow、PyTorch、scikit-learn、およびその他の Python モデルを提供します。つまり、モデルとのインターフェイス、事前推論、および事後推論の処理はすべて Python で実行されます。しかし、Python コードがパッケージ化されて Docker コンテナにデプロイされているとしても、それらのコンテナは Go で記述されたコードによってオーケストレーションされます。

出典: Pexels

機械学習エンジニアになりたい場合は、Python に精通していることが必須です。ただし、機械学習インフラストラクチャでの作業に興味がある場合は、Go を真剣に検討することで間違いなく多くのメリットが得られます。

<<:  Alipayの顔認識が「クラック」されましたが、私たちのお金はもう安全ではないのでしょうか?

>>:  AI とブロックチェーンは 2020 年にモバイル アプリ業界にどのような革命を起こすのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人類の未来における人工知能の重要性

人工知能(AI)は私たちが住む世界を急速に変えています。医療から金融まで、人工知能は産業を変革し、私...

注意メカニズムにバグがあり、ソフトマックスが犯人であり、すべてのトランスフォーマーに影響を与えている

「私は、8年間誰も発見できなかった注目度の式のバグを発見しました。GPTやLLaMAを含むすべてのT...

機械学習はどのように機能するのでしょうか? Googleはこの小さな実験で、

機械学習に関しては、それに関するプロジェクトを 1 つまたは 2 つ聞いたことがあるかもしれません。...

プラットフォームのイノベーションを加速し、「クラウド、ビッグデータ、IoT、インテリジェンス」の新たな章を切り開く

世界を席巻するデジタル変革は、あらゆる分野に大きな発展のチャンスをもたらしました。技術革新を推進する...

コアアルゴリズムの欠如により、人工知能の開発は「ボトルネック」のジレンマに直面している。

[[264142]] 「中国で人工知能の基本アルゴリズムの研究に携わっている数学者は何人いるのか?...

...

AIが認知症患者の自立した生活にどのように役立つか

[[279905]]写真はインターネットから照明や音楽を Alexa や Siri などの音声制御テ...

ガートナーは、人間と機械の境界を曖昧にする5つの新たな技術トレンドを明らかにした。

世界有数の情報技術調査・コンサルティング会社であるガートナーが発表した「2018年新興技術ハイプサイ...

頑固なマージソートアルゴリズム

この記事はWeChatの公開アカウント「Beta Learns JAVA」から転載したもので、著者は...

...

Pythonを使用して機械学習モデルを作成する方法

導入新しいモデルをトレーニングしたときに、Flask コード (Python Web フレームワーク...

AIの現実世界での最悪の使用例

人工知能(AI)の最悪のシナリオは、ハリウッドの大ヒット映画でおなじみのものだ。人間のような知性と知...

...