ThunderSoft の Sun Li: AI 対応産業の課題と解決策

ThunderSoft の Sun Li: AI 対応産業の課題と解決策

[51CTO.comからのオリジナル記事] 現在、人工知能はセキュリティ、金融などのサブセクターを強化し、重要な作業プロセスに参加し、さまざまな実用的なサービスを提供しています。組み込み分野の加速的な進化に伴い、人工知能は幅広い注目を集め、より多くのシナリオで使用されるようになりました。 ThunderSoft はインテリジェント端末オペレーティングシステムをベースとし、組み込み人工知能の主要技術に重点を置いています。最近、サンダーソフト、清華大学、クアルコムは共同で「ThunderWorld 2018 組み込み人工知能カンファレンス」を開催し、組み込み人工知能分野における技術の最先端、業界動向、注目の問題について議論しました。

[[253111]]

サンダーソフト副社長、サン・リー氏

メインフォーラムでは、サンダーソフト副社長の孫立氏が「インテリジェントビジョンの『スクワット』と『スタート』」と題した講演を行い、画像システムの構築における困難と対策、3D画像技術の普及、組み込みAIアルゴリズムアプリケーションの最適化、AIによる業界の強化などについて詳しく説明しました。

画像システム構築における課題と解決策

視覚技術は多くの分野にまたがる学際的な科目であり、画像キャプチャにはカメラを使用することが前提条件となります。キャプチャプロセスは複雑で、モジュールによる画像の取得と適用、メインチップの電力消費、パフォーマンス、システムの最適化、顔認識、美容、従来のステッチ、光学処理、ノイズ低減などの一連のアルゴリズムが含まれます。

取得の課題に加えて、優れた画像システムを構築するには、画像処理アルゴリズム (露出、ホワイト バランス、フォーカス、ワイド ダイナミック HDR、ノイズ低減など)、チップ アクセラレーション、画質調整なども必要です。ハードウェアの断片化により、複雑な画質調整プロセス (実験室と実際のシナリオの両方) が必要になり、消費電力、パフォーマンス、堅牢性も考慮する必要があります。

孫李氏は、画質調整が画像処理において最も重要な部分であると語った。最高の画質を実現するには、画像パイプライン全体、3A (フォーカス、露出、ホワイトバランス)、その他多くの詳細をデバッグする必要があります。

[[253112]]

IQ – 3段階の画質調整

画像品質のデバッグは 3 つの段階に分かれています。

1. ***ソフトウェア機能のチェック、IQ に影響する重大なバグがないことの確認、元の画像 (EXIF、AE パラメーター、キャリブレーション データ) の検証など、基本的なソフトウェアとドライバーが適切に準備されていることを確認します。

2. 関連する専門機器を設定し、LSC、AWB、AE、ガンマ、コントラスト強調、CCM、DPC、ノイズフィルタリング、エッジ強調、その他のパラメータ検出および処理などのラボパラメータ調整を実行します。

3. 実際のシーンでパラメータを調整し、人物、ペット、風景、ポートレート、屋外、低照度、オフィス、自宅、フラッシュ、逆光、映画などの参照機器と比較して撮影し、調整します。

ハードウェアアクセラレーションを有効に活用して、電力消費とパフォーマンスの問題を解決します

ハードウェア アクセラレーションは、画像コンピューティングを向上させる上で重要な要素です。GPU や CPU などの組み込みハードウェアを使用するには、多面的な機能が必要です。組み込みハードウェアはアルゴリズムの高速化に非常に役立ちますが、電力消費の問題もあります。車内の複数のカメラをつなぎ合わせるなどのシナリオでは、GPU を選択することをお勧めします。近年、車載ADASチップの高画質化の要求は、外付けISPから内蔵ISP、ベイヤーセンサーへと変化し、現在は外付けISPを使用するのが主流となっている。今後、自動車分野もフィーチャーフォンからスマートフォンへの携帯電話と同様の進化を遂げていくだろう。主な推進力としては、熱問題などの BOM コスト削減や、サラウンド ビュー アプリケーションの接合問題などが挙げられます。 ASIL 互換性、長期投資、厳格な路上テストなどの要件は、自動車特有の高い障壁です。

3D画像技術普及の課題と解決策

3D画像技術の活用は、画像ビジョンのもう一つのトレンドです。普及の過程では、以下の大きな課題を克服する必要があります。

  • 規模の問題により、BOM コストは一般の人々が購入できるレベルまではまだ削減されていません。
  • さまざまな光学設計、断片化(ToF、構造化光、双眼鏡、アクティブ双眼鏡など)。
  • 組み込み SoC (PC 支援から組み込み ARM ベースまで) の深度マップの計算能力。
  • 複数の使用セットの完全なモデリング問題。
  • RGBD、3D ベースの人工知能における学術的進歩。

孫立氏は、サンダーソフトはワイドダイナミックレンジ/HDR、ノイズ低減、AI技術の導入などにより、従来の画質問題を解決することに注力しており、長年にわたる継続的な投資と研究開発により、映像技術分野で豊富な経験を蓄積してきたと述べた。

組み込みAIアルゴリズムアプリケーションを最適化するための難しさと解決策

AIは現在、組み込み/エッジAIは未来であり、組み込み/エッジインテリジェントビジョンデバイスの数も急速に増加しています。このような背景から、ThunderSoft は Qualcomm Snapdragon 845 プラットフォームをベースにした人工知能エンジン、TurboX AI Kit を発売しました。 TurboX AI Kit には、高性能な組み込みデバイス/エッジ AI 開発プラットフォーム、豊富な組み込み AI 開発、分析、最適化、デバッグ ツール、デバイス AI の実装と普及の加速、エコシステムの構築支援という 3 つの主な機能があります。

現在、組み込み AI アルゴリズムの適用を制限している主な問題には、限られたコンピューティング リソース、多様なアプリケーション シナリオと要件、未熟なエコシステム、断片化された端末処理プラットフォーム、パフォーマンス (精度と速度) のバランス/トレードオフ、電力消費とコストなどがあります。これらの問題に対処するには、ハードウェアとソフトウェアの深い統合や体系的な設計などの側面を掘り下げる必要があります。

AIを活用した産業の課題と解決策

AI が研究室から出て産業に力を与えるようになると、あらゆる面で課題に直面することになります。顧客の観点から見ると、彼らが期待するのは、純粋なアルゴリズムではなく、総合的なソリューション(データの取得、プライバシーの問題、トレーニング、生産管理システム、プライベート クラウドの展開、フロントエンドとバックエンドなど)です。

お客様がAI技術の予算を測る際、ハイエンド技術としてのAIではなく、生産性向上(ユーザーエクスペリエンスの向上、売上コンバージョン率など)、業務効率の最適化、業績に応じて維持できる予算の余裕度を基準としており、これは現状の高額なAI投資コスト(人員、サーバーなど)とは矛盾しています。

業界の顧客のワークフローと部門機能が高度な生産性を中心に展開および最適化されていない場合、顧客は、自己トレーニング、アップグレード、および一度で展開できる人工知能プラットフォームの構築に一度の投資を行うことを期待しています。現在必要なカスタマイズされたアルゴリズムと比較して、将来的には、解決する必要がある現場の問題を中心に、アルゴリズムに少人数の人員が対応するプロセスを確立する必要があります。

では、AI を活用した業界が直面するこれらの困難にどう対処すればよいのでしょうか? AI にはアルゴリズムだけでなく、プラットフォームとエンジンが必要です。たとえば、下の図は、ThunderSoft のインテリジェントな視覚的欠陥検出ソリューションのレンダリングです。

[[253113]]

ThunderSoftのインテリジェントな視覚的欠陥検出ソリューションのレンダリング

具体的な操作方法は、まず従来のCV技術によって複雑な背景を除去し、欠陥が画像に現れるようにしてから、実際の分類を実行します。

今後、AIを応用する企業が増え、AIの人気は高まり続けるでしょう。市場が徐々に拡大するにつれて、AIの応用範囲は特定の分野から人々の日常生活へと徐々に広がっていくでしょう。インテリジェント化のトレンドが続くにつれて、インテリジェントビジョンの応用はさらに拡大、深化して、徐々により多くの新興分野に移行します。インテリジェントロボット、自動運転、顔認識、セキュリティ、医療などの分野での応用はますます増えていきます。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  2018 年の AI テクノロジーのブレークスルーの完全なコレクションをご紹介します。

>>:  人工知能はターミネーターとなるのか?ぜひ見に来てください!

ブログ    
ブログ    
ブログ    

推薦する

10億の顔データが完全に削除されました! Facebookが顔認識ツールを廃止

[[434362]] 11月3日、Facebookは写真のタグ付けに顔認識機能を使うのをやめると発表...

...

今日の企業で人気の AI ユースケース 12 選

世界中の企業が、プロセスの合理化、コストの最適化、人的エラーの防止、顧客の支援、IT システムの管理...

...

Google の医療モデルが Nature に掲載、Med-PaLM が重要な秘密を明らかに! AI医師は人間と同等の能力を発揮する

5月のI/Oカンファレンスでは、Med-PaLM 2が大幅にアップグレードされ、エキスパートレベルに...

マスク氏は5年以内に人間の言語を無意味にするだろうと言っているが、今回は狂気ではないかもしれない

イーロン・マスク氏は、わずか5年で人間の言語を無意味にすることができる技術に取り組んでいると述べてい...

...

...

...

音声認識データベースが人工知能の中核となる

音声認識データベースと音声合成データベースは、人工知能の重要な技術です。機械が人間のように聞き、話し...

...

広州には AI があり、Huawei Ascend Academy は本格的に始動しています。

[[335135]] 2020年7月18日午後、広州ロイヤルパレスホテルでHuawei DevRu...

JS データ構造とアルゴリズム_ソートおよび検索アルゴリズム

序文これは「JavaScript のデータ構造とアルゴリズムを学ぶ」の最後のブログです。これは、面接...

AI ロボットは製造業にどのような変化をもたらすのでしょうか?

AIロボットとは?人工知能 (AI) ロボットは、現実世界の環境で動作する人工知能エンティティです...

...