DidiがAoEをオープンソース化: AIの迅速な統合を可能にする端末操作環境SDK

DidiがAoEをオープンソース化: AIの迅速な統合を可能にする端末操作環境SDK

Didi は、エンドサイド AI 統合ランタイム環境 (IRE) である AoE (AI on Edge) をオープンソース化しました。 AoE は「安定性、使いやすさ、セキュリティ」を設計原則として設計されており、開発者がさまざまなフレームワークのディープラーニング アルゴリズムを端末に簡単に展開して効率的に実行できるように支援します。


Didi がこのようなランタイム フレームワークを構築したい理由は 2 つあります。

  • まず、人工知能技術の急速な発展により、過去2年間で端末上で動作する推論フレームワークが数多く登場しました。開発者に選択肢が増える一方で、端末にAIを導入するコストも増加しています。
  • 第二に、推論フレームワークを通じて AI に直接アクセスするプロセスは、動的ライブラリ アクセス、リソースの読み込み、前処理、後処理、リソースの解放、モデルのアップグレード、安定性の確保などの問題を伴うため、かなり面倒です。

紹介によると、現在端末上で実行されている主流の推論フレームワークは 8 つあります。


基本的に、どのような推論フレームワークであっても、初期化、前処理、推論実行、後処理、リソース解放という 5 つの処理ステップが含まれている必要があります。これらの推論プロセスを抽象化することが、AoE がさまざまな推論フレームワークをサポートするための基礎となります。現在、AoE は NCNN と TensorFlow Lite の 2 つの推論フレームワークをサポートしています。
具体的には、最も基本的な AoE 統合オペレーティング環境は抽象推論操作です。依存性反転の設計により、ビジネスは特定の推論フレームワークのアクセス実装を気にすることなく、AoE の上位レベルの抽象化のみに依存します。この設計の最大の利点は、開発者がフレームワークの実装を変更することなくいつでも新しい推論フレームワークを追加できるため、ビジネス開発と AoE SDK 開発が完全に分離されることです。

AoE SDK では、この抽象化は次のようになります。

  • InterpreterComponent:モデルの初期化を処理し、推論を実行し、リソースを解放します。
  • コンバーター:モデル入力の前処理とモデル出力の後処理を処理するために使用されます。

[[275547]] [[275548]] AoEのもう一つの特徴は、安定性が保証されていることです。ご存知のとおり、Android プラットフォーム開発における重要な問題は、特に多数のネイティブ操作を伴うシナリオでのモデルの適応です。モデルの適応の問題は特に重要です。特定のモデルでアプリケーションがクラッシュすると、エクスペリエンスに与えるダメージは甚大です。

統計によると、パフォーマンスの問題により、モバイル アプリの 5% が毎日アクティブ ユーザーを失っています。これらの失ったユーザーのうち、60% は沈黙してアプリの使用をやめ、30% は競合製品に切り替え、残りは単にアプリをアンインストールします。したがって、大規模なユーザーベースを持つモバイル アプリケーションの場合、アプリのメイン プロセスがいつでも利用可能であることを保証することが、最も基本的かつ重要なことです。

AI推論プロセスを考慮すると、必然的にネイティブプロセスで大量の操作が発生し、推論操作だけでなく、一部の前処理やリソース回復操作でも互換性の問題が発生しやすくなります。このため、AoE ランタイム環境 SDK では、Android プラットフォーム用の独立したプロセス メカニズムを開発し、ネイティブ操作を独立したプロセスで実行できるようにしながら、推論の安定性 (偶発的なクラッシュが後続の推論操作に影響を与えない) とメイン プロセスの安定性 (メイン プロセスがいかなるときもクラッシュしない) を確保しています。

具体的な実装プロセスは、主に、独立したプロセスの登録、例外によるプロセスの再バインド、プロセス間通信の最適化という 3 つの部分で構成されます。

現在、AoE SDK は Didi 銀行カード OCR に適用されています。AoE、推論フレームワーク、ホスト アプリの関係をより明確に理解するには、次のビジネス統合図を参照してください。

オープンソースのランタイム環境 SDK には、Android および iOS プラットフォームが含まれます。また、Linux プラットフォームのランタイム環境 SDK も鋭意開発中で、9 月末にリリースされる予定です。

<<:  28歳で普通のエンジニアからAIに転職すべきか?

>>:  李開復:「AI+」には4つの段階があると考える理由

ブログ    
ブログ    
ブログ    

推薦する

OpenAIがズームイン!史上最強の「モデルストア」が立ち上げられ、すべてのChatGPTアプリケーションを接続する

OpenAI がまたしてもビッグトリックを公開しました!簡単に言えば、サム・アルトマンは市場にあるす...

ビデオメタデータとは何ですか?

ビデオ メタデータの分析と使用は、セキュリティにおける現在の多くの刺激的な開発の基盤となっています。...

ザッカーバーグはオープンソース AGI に全力を注ぐ: Llama 3 をトレーニング、35 万台の H100 を年末までに提供開始

ザッカーバーグ氏は新たな目標「すべてをオープンソースの AGI に」を発表しました。そう、ザッカーバ...

スタンフォード大学の非接触型デバイスは、アクチュエータをスリーブに「縫い付ける」ことで、タッチ情報を遠隔で送信できる。

世界的なパンデミックは2年近く続いており、リモートワークで何日も過ごし、他の人との物理的な接触を切望...

CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

人生で、私たちは誰でもぼやけた画像に遭遇します。昔は、ぼやけた画像を復元することは不可能でした。PS...

高速ドローンは森の中を自律的に飛行し、旅の間中独自のルートを計画し、最高時速40キロメートルで飛行する。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

AIが労働力に及ぼす可能性のある3つの影響

「GenAIは、農業革命と産業革命以来、最も重要な変革となるかもしれません。」まあ、心配しないでくだ...

Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

「この写真をフォトショップで加工しましょう!」 「いいですよ、でもこの段落は検閲しないと面倒なことに...

人工知能の7つの主要技術、ついに誰かがわかりやすく説明してくれた

[[345456]]企業による AI の利用を複雑にする要因の 1 つは、このトピックに複数の異なる...

...

AI、機械学習、ディープラーニングはOEMにとって重要な市場です

人工知能 (AI) は、世界中の業界関係者のビジネスのやり方を急速に変えています。 AI がビジネス...

フォーカス | 機械学習に役立つ 7 つのクラウド コンピューティング サービス

データ分析は、多くの組織がクラウド コンピューティング プラットフォーム上で実行する主要なコンピュー...

トレーニング時間とパラメータの数は100分の1に削減され、ラベルは予測に直接使用され、GNNを超えるパフォーマンスを実現

従来のラベル伝播法とシンプルなモデルを組み合わせると、一部のデータセットでは現在の最適な GNN の...