専門家の視点丨Hua Xiansheng:人工知能:それは風か、雲か、それとも雨か?

専門家の視点丨Hua Xiansheng:人工知能:それは風か、雲か、それとも雨か?

[[395002]]

01 人工知能の3つのピーク

人工知能の発展は3つのピークを経験しました。最初のピークは、人工知能技術が初めて登場した 1950 年代に発生し、2 番目の急増は、エキスパート システムに代表される 1980 年代に発生しました。世界は現在、人工知能の発展における第3のピークを迎えています。

これまでの 2 つのピークは、社会に予想されたような大きな変化をもたらしませんでした。今回のピークも同じ過ちを繰り返すのでしょうか、それとも違うのでしょうか。実際、今回の発展のピークには、これまでとは異なる以下の 4 つの特徴があります。

1. ディープラーニング: 人工知能の強力な補助ツールとして、ディープラーニングの登場により、多くの未解決の問題に対する解決策が提供されます。

2. 強力なコンピューティング: クラウド コンピューティングとチップのコンピューティング能力の向上により、コンピューターのデータ処理能力が大幅に向上しました。

3. 膨大なデータ: あらゆる分野で蓄積された膨大なデータは、人工知能の応用に価値を生み出す条件を提供します。

4. 成功事例:検索エンジン、電子商取引の推奨、顔認識決済などの成功した応用事例は、人工知能技術の開発の参考になります。

02 人工知能産業の急速な成長

人工知能業界は2012年頃から急速な発展期を迎えています。 2017年までに世界中で8,000社以上のAIスタートアップが誕生し、活動中のAIスタートアップの数は過去に比べて14倍に増加しました。 2017年、中国のAI企業167社が総額50億ドル以上の投資を受けた。現在、ほとんどの企業が独自の AI 研究所を設立し、人工知能技術を活用して事業開発を支援しようとしています。

03 AIのジレンマ

AI技術は現在、本格的に発展しているものの、収益の難しさ、データの大きな差異、コア価値の実現の難しさ、ユーザーの過度の期待など、技術の実際の応用にはまだ多くの問題があります

1. 収益の問題

AI テクノロジーをどのように活用して収益を生み出すかが、AI 企業が直面している主な課題です。 2018 年の統計によると、AI 企業の 90% 以上が収益面で損失を出しています。同社が請け負うAIプロジェクトの開発に要するカスタマイズコストや人件費は非常に高く、プロジェクト資金の還流も容易ではないため、AIプロジェクトへの投資額は高く、収益は低いという欠陥がある。同時に、企業間の技術格差が縮まり続けているため、汎用AI製品の開発による収益は徐々に減少しています。

2. 研究室と現実世界

人工知能技術を実装する上での2番目の困難は、実験データと実際のデータの間に大きな差があることです。公開データセットと実際の企業データの間には大きな違いがあるため、実際の企業シナリオでは結果が満足のいくものでないことがよくあります。これにより、企業は関連技術の適用による効果を正しく評価することができなくなり、信頼が大幅に低下します。たとえば、顔認識技術の応用では、開発者のコ​​ードは有名な顔認識データセット LFW で非常に高い精度を達成できることがよくあります。ただし、実際のシナリオでコードを使用すると、使用シナリオによって大きな違いがあるため、良い結果が得られないことがよくあります。

もう 1 つの例は、Person Re-ID です。ここでは、公開テスト データセットと実際のアプリケーションの違いがさらに大きくなります。公開データセットのデータと比較すると、実際のシーンの人々は異なる服を着ており、異なる交通手段に乗っており、異なる行動をとっています。これらの変更により、アルゴリズムの認識が非常に困難になり、アルゴリズムの精度が大幅に低下しました。

3. 成熟した技術とユーザーのニーズ

成熟した技術と実際のユーザーのニーズの間に大きなギャップがあることが、AI 技術の応用における 3 番目のジレンマです。企業ユーザーは AI テクノロジーに大きな期待を抱いており、ビジネス上のほとんどの問題を AI を通じて解決したいと望んでいます。実際、AI テクノロジーはビジネスにおける特定の種類の問題に対してのみ適切なソリューションを提供でき、すべてのビジネス ニーズを満たすことはできません。

04 AI技術とアプリケーションの成功の鍵となる要素

AI 技術の適用が成功するかどうかの鍵となる要素は、多くの場合、企業に相応のコア価値をもたらすことができるかどうかにあります。 AI技術の価値は、次の3つのレベルに分けられます。

1. 仕上げ段階: 企業が仕上げ段階に多くの人的資源と物的資源を投入すると、理想的な成果が得られず、資源の無駄が生じることがよくあります。

2. タイムリーな支援の提供: この分野では、企業が開発したテクノロジーは業界にかけがえのない価値をもたらし、特定のビジネス上の問題に対する適切なソリューションを提供することができます。

3. 無から生まれるもの:あるAI技術の出現により、関連するニーズやビジネスが生まれる。たとえば、携帯電話の大画面が良い例です。通信用として使われる携帯電話は、技術の発展により、大画面で動画を視聴したり、ウェブサイトを閲覧したり、ビデオ通信をしたりといったニーズを実現してきました。大画面は携帯電話の「本来の目的」ではありませんでしたが、今では携帯電話に欠かせない機能となっています。

05 大規模AI応用シナリオ

アリババの人工知能技術の研究開発は、大規模な人工知能の応用シナリオに支えられており、実際の応用シナリオで発生する問題を解決することで、対応するAI技術の開発を促進しています。下の図は、アリババにおける人工知能技術の応用シナリオの一部を示しています。この記事では、これらの AI 技術の応用例をいくつか紹介します。

1. 視覚検索の応用シナリオ

現在、視覚検索技術は、一般検索、商品検索、都市検索、原材料検索など多くの分野で広く使用されています。

電子商取引における視覚検索を例にとると、プロセスは、カテゴリ認識、主題検出、特徴抽出、検索、並べ替え、結果の提示の 6 つの部分に分けられます。アルゴリズムはまず画像内の製品カテゴリを識別し、製品をそのカテゴリに正しく分類します。カテゴリ識別後、被写体検出法によって、観察対象となる製品が画像内にマークされます。アルゴリズムは、製品画像のピクセルを計算可能な特徴に変換します。製品画像検索エンジンは、取得した特徴データをインデックス内のデータと比較して取得し、返された結果を類似度で並べ替えます。最後に、並べ替えられた製品リストがユーザーに表示されます。

Taobao アプリの Pailitao 機能は、視覚検索技術を使用してユーザーの画像を認識し、商品を検索します。これにより、ユーザーが手動で商品を検索する時間が短縮され、ショッピング体験が大幅に向上します。

2. ビジュアル製造アプリケーションシナリオ

ビジョン製造技術では、アルゴリズムを適用して、画像、3D グラフィックス、ビデオなどの視覚データを製造できます。この技術は、視覚分析、検索技術、視覚制作エンジンを組み合わせることで、ユーザーのアイデアを目に見える視覚データに変換します。以下は、さまざまなシナリオにおけるビジュアル製造技術の応用例です。

Alibabaはビジュアル製造技術を使用して、Taobaoの商品ページを数秒で動画に変換する機能を実現しています。システムは商品ページの画像とテキストの解析を自動で行い、解析したデータに基づいて動画を自動生成します。静的な製品ページを動的なビデオ形式に変換することで、製品のクリックスルー率とコンバージョン率が向上し、関連ビデオの制作コストが節約されます。

ビジュアル製造技術は、低品質のビデオの修復にも使用できます。従来の手動の方法では、1.5 時間の古い映画を復元するのに 40 日かかりますが、AI インテリジェント復元ではわずか 3 時間で済みます。 AlibabaとYoukuが共同で立ち上げた「Classic HD」セクションでは、ビデオの修復と強化を通じて、1,000本以上の古典的な古い映画を非常に短時間で自動的に修復し、映画に新たな活力を与えます。下の写真は、この方法で修復されたテレビシリーズ「ソルジャーズ・アサルト」の効果を示しています。この映画は映画館のハイビジョンスクリーンで上映され、観客から多くの賞賛を受けました。

ビデオ制作技術により、ビデオ内で企業の埋め込み広告を挿入するのに適した場所を見つけることができます。ビデオ埋め込みテクノロジーは、アルゴリズムを使用してビデオ内のシーンを分析し、適切な水平面、垂直面、または曲面に企業広告を配置し、広告をシーンにシームレスにレンダリングします。この方法は、埋め込み広告の自然さを確保しながら、企業が自社を宣伝するのに役立ちます。視聴者の時間を奪うことも、動画コンテンツを妨げたり、視聴者に不快感を与えることもありません。下の図は、ビデオ埋め込み技術をビデオに適用した効果を示しています。

Luban インテリジェント プラットフォームは、ビジュアル製造技術のもう 1 つの応用例です。 Alibaba が設計・開発した Luban インテリジェント プラットフォームは、ユーザー向けの印刷広告を自動的にデザインできます。使用時に、Luban プラットフォームはユーザーのコピー、画像、希望する広告スタイルを統合し、ユーザーのニーズを満たす広告画像やポスターを自動的に生成します。 Luban プラットフォームは、学部卒業生レベルのバナーを 1 秒あたり 8,000 個生成できます。 2017年のダブル11イベント期間中、アリババグループはLubanプラットフォームを使用して合計4億1000万のバナーを生成し、ダブル11イベントの宣伝効果を高め、会社の宣伝コストを大幅に節約しました。

Luban プラットフォームの開発により、企業にとっての成功経験が蓄積されました。ルバンのシナリオ、つまり短期間で大量の広告画像を制作する必要性は、人力で実現するのが困難であったため、以前は存在しませんでした。しかし、自動設計技術によってこのシナリオが可能になり、大規模なプロモーションのシナリオではこの技術が必須のものとなりました。企業は、AI テクノロジーの応用はクールなテクノロジーではなく、厳格なニーズに重点を置く必要があることを認識しています。新しい AI テクノロジーはビジネス イノベーションを促進し、ビジネス イノベーションはテクノロジー イノベーションにフィードバックされます。

3. 視覚診断

視覚診断技術は AI 技術のもう一つの重要な応用であり、人の診断、つまり医療用画像技術と、製品や機械の診断、つまり産業用視覚技術、特に品質検査技術の 2 つのカテゴリに分けられます。以下は、アリババグループが視覚診断に実装したテクノロジーとアプリケーションです。

■ 医療画像技術

アリババの医療チームは、人間の聴覚、視覚、知覚、テキストに関するデータを収集して、インテリジェントな健康管理プラットフォームを構築します。このプラットフォームは、人間のデータを統合・分析し、糖尿病、高脂血症、心血管疾患などの高リスク疾患の患者に早期警告サービスを提供し、ユーザーに日常的な健康データ分析を提供します。ユーザーが自分の身体の状態をリアルタイムで把握し、身体の状態情報を通じていつでも身体を調整できるようにすることで、ユーザーの健康的な行動の維持を促進し、身体の健康を確保する効果を実現します。

CTA 画像解析技術は、ディープラーニング手法と 3 次元画像検出を通じて、心臓の冠動脈の非常に細かいセグメンテーションと命名を実行し、冠動脈内の狭い領域と小さな病変プラークを識別できます。精密な画像とディープラーニング技術により、患者の体内のあらゆる微細な病変を検出することができます。

整形外科における AI 技術の応用により、脊椎構造を抽出し、脊椎内の円錐と椎間板の高精度なセグメンテーションと測定を実行できるようになります。同時に、このアルゴリズムは医師の補助的な診断と治療を支援し、退行性疾患を細かいレベルで区別し、医師の診断効率を大幅に向上させます。

股関節および膝関節の手術測定におけるインテリジェント整形外科技術の応用例。このアルゴリズムは、関節内の特徴点の位置、角度、長さを自動的にマークできるため、医師は手術を行うための信頼できる参照情報を得ることができます。

アリババが構築した医療・健康検索プラットフォームを通じて、医師はプラットフォーム上で現在と類似した症例情報や医療画像を見つけることができ、過去の治療記録や治療経験を参考にして患者をより適切に診断し、より合理的な治療計画を立てることができる。

Alibaba は医療と健康に関する知識に関連するデータをナレッジグラフに構築し、Tmall Genie がアクセスできるデータベースに保存します。ユーザーはTmall Genieに話しかけることでデータベースから情報を取得でき、Tmall Genieはナレッジグラフに基づいてユーザーに健康を改善するためのソリューションを提供します。 Tmall Genie は、ユーザーの健康状態を自動的に分析して管理することもできます。

伝統的な医療文化では、病気が発生する前に予防すること、つまり体が病気になる前に健康に介入することを重視します。アリババが構築する未来の健康管理は、認知、判断、意思決定、学習の4つの部分を通じて、ユーザーが健康上の問題が発生する前に予防するのに役立ち、AI医療技術を組み合わせて人々の身体的健康を守ります。

アリババのAI医療チームは2月16日、新型コロナウイルス感染症のCT画像解析システムを成功裏に立ち上げた。このシステムは、患者の新型コロナウイルス感染症の罹患確率や肺の病変の割合などのデータを20秒以内に分析・出力し、予測精度は最大96%に達します。現在、160以上の指定病院に導入され、29万回以上(最新データ)の呼び出しが行われており、新型コロナウイルス感染症の迅速な診断に確実な支援を提供しています。

アリババがCOVID-19向けに設計した全ゲノム配列解析技術は、10分以内に全ゲノムの比較を完了することができます。このアルゴリズムは全ゲノム配列の最大95%をカバーしており、診断の精度は基本的に100%に近くなります。その結果、新型コロナウイルスの全ゲノム配列の解析は2、3日から14時間に短縮された。

■ 産業用ビジョンテクノロジー

産業視覚診断技術は、太陽光パネル、繊維産業、大型機械などの産業製造プロセスにおける製品品質検査や故障診断に広く使用されており、人手を節約し、製品の歩留まりと設備の精度と安定性を向上させることを目的としています。以下は、さまざまな業界で業界診断テクノロジーがどのように使用されているかの例です。

太陽光パネルの欠陥を手作業で検査すると時間がかかり、すべてを検査できないという問題に対応するため、アリババはすべてのパネルを検出できる太陽光パネル検査システムを設計・実装し、AI技術を活用した分析により、関連企業の検査効率を36倍に向上させた。

産業用目視検査技術は、送電線検査や食品品質検査など、複数の業界のシナリオでも広く使用されており、良好な成果を上げています。

アリババが開発したスマート養豚場は、AI技術を利用して各豚の体調をリアルタイムで把握します。 AI技術は、養豚場の豚の頭数を遠隔で数え、行動や食事の分析を通じて豚の状態を把握し、必要に応じて健康警告を発することができる。

4. シティブレイン

アリババグループが設計・実装したシティブレインは、都市に蓄積された大量のデータを接続し、収集したデータを人工知能で分析し、都市に応じた最適化ソリューションを提案することを目的としています。シティブレインは、AI技術とコンピューティングパワーを組み合わせて都市のデータを分析し、都市のガバナンスとサービスをデジタル化してインテリジェント化し、効率的で低コストで便利な都市管理を実現します。都市ガバナンスモデル、サービスモデル、産業発展のさまざまな側面で画期的な成果を達成します。

下の図は都市脳の構造を模式的に示したものです。シティブレインはまず、ビデオ、GPS、マイクロ波などのさまざまな種類のデータを収集し、ビデオデータを分析して理解し、データの予備的な理解を形成します。生成された認知情報について、シティブレインはAI アルゴリズムを通じてデータを分析および処理し、最適化の決定を提案します。最適化計画には、信号機の最適化、公共交通機関の最適化、事故イベントアラームなどが含まれますが、これらに限定されません。都市内の要素を検索エンジンに入力すると、システムが自動的に検索とデータマイニングを実行します。このとき、システムは不審車両の検索、交通パターンの発見、渋滞の原因の発見など、複数のタスクを同時に実行できます。このシステムは、管理最適化ソリューションを提供すると同時に、データ予測機能も提供します。現在の交通状況、天候、イベントなどの要因に基づいて、交通量、交通事故発生確率などのデータを予測し、予測データに基づいて適切な介入を行うことができます。

現在、アリババのシティブレインシステムは、30以上の都市や都市部で60以上のプロジェクトに導入されています。同社が開発したシティブレイン人工知能オープンイノベーションプラットフォームは、10数社以上の研究機関やサードパーティメーカーの研究開発と導入をサポートしています。シティブレインシステムの6つの製品群は、交通、安全、都市管理など多くの重要な分野で広く利用されています。

City Brain人工知能オープンイノベーションプラットフォームには、包括的な機能、柔軟な使用、高いリアルタイム性能、効率的な運用、高いオープン性という5つの大きな利点があり、開発および研究チームに安全で信頼性の高いAIプラットフォームレイヤーサポートを提供できます。プラットフォームが提供する大規模なビデオ分析および処理加速技術により、サーバーが 100 チャネル以上のビデオを同時に処理できるようになり、ビデオ データの処理効率が大幅に向上します。

シティブレインの全天候型異常事故検知機能は、ほぼリアルタイムで検知された市内の出来事や事故をデータ画面に自動的に並べ、発生した事故のデータ情報を継続的に更新します。出来事や事故の種類に応じて、システムが自動的に処理するか、交通警察が適時に処理します。

Alibaba City Brainが提供する交通状況と信号機の最適化により、杭州の交通効率は以前に比べて15.3%向上しました。このシステムは毎日2万件の事件・事故情報を96%の精度で報告できます。

パトカー、救急車、消防車などの特殊車両については、シティブレインは信号に介入したり、道路交通を最適化するなどしてこれらの車両を護衛し、特殊車両がより早く目的地に到着できるようにします。

シティブレインは、車両検査、危険度の高い運転行動の特定、交通および歩行者の流れの予測、自治体管理、インテリジェントな安全性検出など、複数の機能も提供します。これらの機能は都市の発展を保証します。

City Brainが提供する3D再構築機能と4D推論機能は、都市の状況をリアルタイムの3Dサンドテーブルの形でユーザーに提示し、AI技術を通じて3Dサンドテーブル上でさまざまな時期の都市の動作を復元することができます。

シティブレインの設計と実装の過程で、アリババのAIチームはAI技術を通じてかけがえのない価値を創造し、応用シナリオの理解と製品機能の改良に専念し、製品の中核競争力を確立し、最終的にプラットフォームを構築してエコシステムを確立し、プロジェクトから製品、そしてプラットフォームへの進化を実現し、都市のガバナンスと管理に強力な技術サポートを提供しました。

結論

今日の人工知能の方法論には限界がありますが、さまざまな業界では未解決の問題がまだ多く残っており、人工知能にはまだまだ発展の余地があります。伝統的な産業とデジタル産業の両方にとって、AI テクノロジーを採用することはより良い発展につながります。人工知能の実践者にとって、業界に対する深い理解は非常に重要です。人工知能を商業化するためには、顧客にとって十分な価値を生み出す技術を活用する必要があり、そうでなければ大規模に導入することはできません。誰にとっても、人工知能は人々の生活のあらゆる側面に浸透し始めており、AI技術の発展によってもたらされる変化を受け入れることは避けられません。

人工知能技術が風となるか雲となるかは、私たちがこの技術をどう捉え、開発し、使用するかによって決まります。正しい道を選ばなければ、AIは風のように非現実的で、雲のように幽玄なものになってしまうかもしれない。しかし、AI技術を徹底的に研究し、先進的なコア技術を使って製品を作り、かけがえのない価値を創造できれば、AI技術は万物を養い、成功を助けてくれる春の雨となるだろう。

<<:  知らないのに知っているふりをしないでください!機械学習とディープラーニングを理解しましたか?

>>:  2021 年の人工知能の最新動向を示す 15 のグラフ

ブログ    
ブログ    
ブログ    

推薦する

...

2025年までにロボットが8000万人の労働者に取って代わるのでしょうか?職を失った人はどうすればいいのでしょうか?

同紙によると、世界経済フォーラムがロボット革命に関する報告書を発表し、世界的な警戒を呼び起こした。同...

AI、機械学習、ディープラーニングの解放

【51CTO.com クイック翻訳】 [[393512]] AI、機械学習、ディープラーニングの発展...

2018 年に最も人気のあるディープラーニング フレームワークはどれでしょうか?この科学的なランキングからわかることは

ディープラーニングは、機械学習の分野で最も注目されているテクノロジーです。ディープラーニング フレー...

自動運転分野でファーウェイの「異常運転行動」関連特許が認可:認識精度向上が可能

昨日12月8日、華為技術有限公司は「異常運転行動を識別する方法」の特許権を取得し、公開番号はCN11...

産業用ロボットの開発状況と技術動向を明らかにする

近年、人件費の継続的な上昇に伴い、産業分野では「機械が人に取って代わる」という現象が一般的になり、産...

.NET8 究極のパフォーマンス最適化 プリミティブ - DateTime

序文前回の記事では列挙型の最適化について説明しました。今回は時刻形式である DateTime の最適...

マイマイ:AI関連の仕事は年初比50%増加

[[428165]]マイマイ人材ビッグデータによると、2021年以降、人工知能業界の人材需要と供給は...

...

...

AIOps の実装を公開! 3 人の WOT エキスパートが AIOps を実現する方法をご覧ください

[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミットが...

...

人工知能は個人情報詐欺の蔓延に対する優れた解決策である

オンライン詐欺は長い間、継続的な問題となっています。今日ではテクノロジーはより洗練されているかもしれ...

クラウドとSaaSのセキュリティには包括的なアプローチが必要

米国国土安全保障省および米国国税庁の元最高情報責任者であり、現在は Learning Tree In...

人工知能は飛躍の準備ができており、セキュリティは機会と課題に直面している

近年、人工知能はその地位の向上に伴い、国からますます注目を集めています。 2015年7月には「国務院...