人工知能搭載の携帯電話は私たちの生活をどのように変えるのでしょうか? 携帯電話メーカーが何をしてきたか見てみましょう。

人工知能搭載の携帯電話は私たちの生活をどのように変えるのでしょうか? 携帯電話メーカーが何をしてきたか見てみましょう。

チャットができる「インテリジェント音声アシスタント」から、さまざまな家電を操作できるスマートスピーカー、顔認証決済から無人運転車、機械翻訳からスマート教育まで、人工知能は生産と生活のあらゆる分野に浸透しています。

[[229222]]

今年の5月17日の世界電気通信デーも「人類の利益のために人工知能(AI)の適切な使用を促進する」というテーマを掲げており、人工知能の可能性を活用して人々の生活をより良くすることに再び焦点が当てられています。人工知能の革新に直面して、携帯電話業界も静かに人工知能の波を起こしています。多くの携帯電話がAI機能と要素を取り入れ始めていますが、アプリケーションシナリオが異なるため、携帯電話メーカーの焦点は異なります。

ファーウェイ:ハードウェアAI機能の構築

アルゴリズム、コンピューティング能力、データは、AI技術の3つの柱と考えられています。現在の機械学習アルゴリズムのビッグデータに対する需要は、間接的にコンピューティング能力に対する要件を提示しているため、AI技術はハードウェアのチップに対するより高い要件を提示する上で主導的役割を果たしています。 HuaweiのAI分野への取り組みもAIチップから始まりました。 2017年9月、ファーウェイは世界初のモバイルAIチップ「Kirin 970」をリリースした。最大の注目点は、AI関連の計算用にカスタマイズされたプロセッサであるニューラルネットワークプロセッシングユニットNPUの追加だ。同じ AI アプリケーション タスクを処理する場合、Kirin 970 は通常の CPU よりも 25 倍、CPU + GPU の組み合わせよりも 6.25 倍高速になります。エネルギー効率の点では、NPU は CPU の 50 倍、GPU の 6.25 倍です。

[[229223]]

NPU を使用すると、携帯電話は音声および意味認識の作業の一部をローカル電話に転送し、音声および意味認識のパフォーマンスを向上させ、携帯電話での音声対話アプリケーション (スマート アシスタントなど) のエクスペリエンスを向上させることができます。

写真撮影の面では、NPU により、携帯電話が撮影シーンをより正確かつ迅速に識別できるようになり、携帯電話は最も適切な画像処理アルゴリズムを選択できるようになり、デュアルカメラの背景がぼやけている場合でも、携帯電話はエッジのぼかしをより正確に処理できるようになります。 AR の場合、NPU によりレンダリング速度が大幅に向上し、消費電力が削減されます。

現在、Huaweiの主力スマートフォンであるMate 10とP20の両方に、Kirin 970人工知能チップが搭載されています。于成東氏は、人工知能は今後の携帯電話業界の発展の一般的な傾向であり、ファーウェイは今後もその能力をさらに発展させ強化していくと述べた。これはまだ始まりに過ぎません。将来的には、アルゴリズムの能力はさらに強化されます。ファーウェイは、人々が考えられてもできないこと、さらには人々が思いつかないようなことをさらに多く実現します。

サムスン:Bixbyは話すことも見ることもできる

サムスンは昨年、自社開発の人工知能プラットフォーム「Bixby」をGalaxy S8に搭載し、「Bixby Voice」サービスの提供を開始した。実際、サムスン以前にも多くの携帯電話メーカーが独自の音声アシスタントを発売していましたが、サムスンのBixbyは私たちの理想的な人工知能体験に近いものです。

[[229224]]

Bixby人工知能アシスタントには、「ビジョン」、「音声」、「ホーム」、「リマインダー」の4つの主要モジュールがあり、携帯電話をよりスマートにし、ユーザーをよりよく理解することができます。インテリジェント音声の面では、Bixby は音声認識能力が高く、コミュニケーション文章がより自然で、人と人の間に本当の会話の感覚をもたらすだけでなく、WeChat、Weibo、iQiyi など約 20 の主要な主流サードパーティ アプリケーションをサポートし、前述の音声機能もサポートしているため、ソーシャル インタラクション、旅行、インターネット サーフィン、ショッピング、エンターテイメント、オフィスのあらゆるシナリオをカバーします。

視覚機能の面では、Bixby はテキスト認識と翻訳、QR コード認識、ショッピング情報の検索、赤ワインの年数の照会、カメラフレーミングによる位置認識を実現できるだけでなく、テキストの抽出と編集、類似画像の検索などの機能もサポートしています。生活の中で気に入った商品を見つけたら、Bixby でスキャンするだけで、その商品の販売ページやその他の情報をオンラインで見つけることができます。紙の文書を入手してその内容を友人や同僚と共有したいときは、Bixby でスキャンするだけでテキスト コンテンツを抽出し、編集して共有することができます。

ディープラーニング機能により、Bixby はよりスマートになります。Bixby には強力な適応学習機能があります。一定期間の音声通信の後、Bixby は通信プロセスに満足しているかどうかを尋ねます。満足していない場合、Bixby は問題のある認識内容と対応する機能を修正するよう求めます。継続的な学習により、Bixby はより正確かつ効率的にあなたと通信できるだけでなく、次に何をしたいかを事前に予測することもできます。

OPPO: ユーザーに合わせてカスタマイズしたAI技術アプリケーション

人工知能に関して、OPPO の哲学は「技術を製品に適用してユーザーの悩みを解決したり、ニーズを満たしたりすることで、その価値が実証される」というものです。技術面では、OPPO は人工知能技術を携帯電話のシステム、ハードウェア、サービス機能と深く統合し、携帯電話がユーザーの問題をより積極的かつインテリジェントに解決できるようにしています。ユーザーのニーズの観点から、OPPO は、ユーザーが携帯電話に、より機能的なニーズだけでなく、よりパーソナライズされた感情的な要求も満たすことを望んでいることを理解しています。

[[229225]]

ユーザーにとって最も重要なカメラ機能に関しては、OPPOは2016年にAI技術を搭載した初の製品「OPPO R9s」を発売した。AI技術を巧みに活用することで、携帯電話は1台のカメラだけで被写界深度効果を正確に実現できる。最新世代のOPPO R15は、AIテクノロジーを通じてさまざまな美容機能をさらに拡張します。例えば、OPPO R15の写真撮影技術は、被写体を自然に美しく見せます。その時の特定のシーンを自動的に識別し、世界中のユーザーのさまざまな顔の形に基づいて最も適切な美容ソリューションをインテリジェントにマッチングすることで、従来の携帯電話の写真撮影技術の欠点を補います。

OPPOは今年4月に正式にOPPO研究所を設立し、その中でAI人工知能技術はOPPO研究所の主な方向性の一つとなっています。 OPPO研究所所長の劉昌氏は次のように述べた。「多くの人工知能製品の開発において、OPPOは常にユーザーのニーズと最先端技術の双輪駆動という製品設計コンセプトに従い、AIにさらなる人間味を注入してきました。

vivo: Jovi Assistant は自律学習機能を重視している

SiriやCortanaなどのよく知られている人工知能アシスタントエンジンと比較すると、vivo Joviの最大の違いは、音声対話をサポートせず、代わりに「インテリジェントシーンアプリケーション」に重点を置いていることです。携帯電話の使用時間が長くなるにつれて、Joviはユーザーの習慣、パターン、活動範囲などの情報を見て、聞いて、要約して考えた上で、ユーザーに高品質のソリューションを積極的に提供することができます。また、ユーザーが生活のちょっとした詳細を忘れてしまったときに、チケット、航空券、ルートナビゲーションなどの情報をユーザーに積極的に思い出させることもできます。もちろん、Jovi は Siri のようにユーザーのさまざまな質問に答えることもできるため、ユーザーはテクノロジーの温かさと利便性を感じることができます。

[[229226]]

vivo は、Jovi の継続的な進化をサポートするために、細心の注意を払ったピラミッド構造を構築しました。一般的に言えば、vivoは、統合されたスマートホームインターフェース、センサーデータ、革新的なアルゴリズムを分析してユーザーの現在の状況を認識し、音、画像、ビデオなど数十の次元から入力された情報に基づいて分析、計算、決定を下すことを望んでいます。最終的には、vivo独自の機能と業界の垂直サービスとを統合して、ユーザーの生活にパーソナライズされたスマートサービスを提供します。

特に生活の中で、Jovi 人工知能アシスタントは、AI スマートシーン、AI スマート運転、駐車と車の検索、AI ゲーム エンジン、AI スマート デスクトップ、AI スマート スクリーン認識など、多くの豊富な機能を提供できます。さまざまなシナリオに応じて、Jovi はユーザーにさまざまなサービス ソリューションを提供します。たとえば、ユーザーが携帯電話を使用していて、画面オン時間の 5 時間のうち 3 時間はゲームに費やされ、2 時間は WeChat でのチャットに費やされていることを Jovi が認識すると、Jovi はアルゴリズムを使用して、パフォーマンスと互換性の面でゲームやソーシャル ソフトウェアのより優れたサービスを提供できます。さらに、Joviはクイックアプリケーションを通じて垂直サービス機能を備えたサードパーティを導入することで、ユーザーに列車チケットの予約、航空券の管理、ホテルの予約、速達リマインダー、都市交通など、すぐに利用できる便利なサービスを提供します。

vivoの最高技術責任者であるShi Yujian氏は、「人工知能技術を通じてユーザーの本来の使用習慣と認知を打ち破ることが、vivo人工知能の使命です」と語った。

<<:  AI開発者の皆さん、こちらをお読みください: 主流のモバイルディープラーニングフレームワークの包括的なレビュー

>>:  はい、純粋なSQLクエリステートメントでニューラルネットワークを実装できます。

ブログ    

推薦する

データセンターにおけるAIの役割の拡大

世界がデータの津波と格闘する中、データセンターは急速に進化しています。スマート接続デバイスの数の急速...

...

...

0コードの微調整大型モデルが人気で、わずか5ステップで、コストは150元と低い

0 コードの大規模モデルを20 ドル未満で微調整できますか?プロセスも非常に簡単で、必要なステップは...

ちょっとした機械学習でウェブサイトを高速化

私の人生の 73% は、Web パフォーマンスについて考えています。低スペックの電話で 60 FPS...

確率的隠れ層モデルに基づくショッピングペアリングプッシュ:アリババが新しいユーザー嗜好予測モデルを提案

論文:混合モデルアプローチによる電子商取引プッシュ通知での補完製品の推奨論文リンク: https:/...

パンデミックの間、AI はどのようにして工場の安全な運営を維持するのに役立つのでしょうか?

[[377897]]新型コロナウイルスの感染拡大が世界中で続く中、多くの企業が業務をリモートワーク...

マイクロソフトとグーグルのAIジレンマ:お金を稼ぐにはもっとお金を使う必要がある

7月26日のニュースによると、将来、人工知能はマイクロソフトやアルファベットなどのテクノロジー大手に...

AIを正しい方向に導く

過去 1 年間、私は何百人ものクライアントにインタビューし、AI によって可能性に対する認識がどのよ...

OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

ChatGPT によってウェブサイトのデータが盗まれるのを防ぎたいですか?ついに解決策が見つかりまし...