人工知能の3つの主要分野とその産業応用

人工知能の3つの主要分野とその産業応用

人工知能は、人間の知能の拡張と拡大をシミュレートするための理論、方法、技術、アプリケーション システムを研究および開発する新興技術分野です。 人工知能研究の目標は、人間が知性を持って実行する必要がある複雑なタスクを機械が実行できるようにすることです。 つまり、私たちは、機械が私たちに代わって、反復的な機械的な作業だけでなく、人間の知能の関与を必要とする複雑なタスクも解決してくれることを期待しています。

この記事では、人工知能技術の 3 つの主な方向性、つまり音声認識、コンピューター ビジョン、自然言語処理について説明します。

[[328302]]

音声認識

音声認識により、日常生活で使用できる iPhone の Siri など、コンピューターが音声を認識できるようになります。Google 音声入力では、文章を話すとテキストに変換されます。Google マップに話しかけて行きたい場所を言うと、自動的にナビゲーションが生成されます。 これらは音声認識のアプリケーションの一部です。 音声認識は、次の 3 つの側面に分けられます。

  • オンラインおよびオフラインの音声合成を含む音声合成。
  • 音声認識(音声ディクテーションなどを含む)
  • 意味理解とは、ニューラル ネットワークを使用して音声の意味を抽出することであり、音声評価や、一般的に使用されている機械翻訳の一部の機能が含まれます。

コンピュータビジョン

コンピュータービジョンにより、コンピューターは視覚化できるようになります。 私たちは、コンピューターが人間の目の機能の一部を代替できることを期待しています。 例えば、OCRと呼ばれる非常に便利な文書分析技術があります。 コンピューターに文書をスキャンさせて読み取らせることができます。 たとえば、請求書を入手して、コンピューターがそれを即座にスキャンし、請求書から金額、税率、その他の必要な情報を抽出できるようにすることができます。 インテリジェント医療診断の分野ではコンピュータービジョンに関する研究がいくつかあります。 まだ市場には出回っていませんが、将来的には幅広い応用シナリオが生まれると考えています。 一方、軍事分野では、ミサイルの軌道の観測と測定を人間に代わってドローンが行っている。

コンピューター ビジョンの一般的な方向性は次のとおりです。

  • オブジェクトの認識と検出。 コンピューターは、私たちが写真で通常見るものをすぐに検出できます。 たとえば、観光地の写真を撮れば、そこに写っている植物、人、動物、乗り物をすぐに識別できますが、コンピューターでも同じことができます。
  • オブジェクトの動きの追跡。 特定のフレームでオブジェクトの画像をキャプチャしました。 後続のビデオでは、オブジェクトの変化と状態を継続的に追跡できます。 これは簡単なことではありません。 物体は常に太陽光や光の影響を受けるため、正確に識別することは困難です。

もう 1 つは、コンピューターが画像を見たり話したりできる機能です。 たとえば、画像が与えられると、コンピューターは画像に何が含まれているかを識別し、事前に作成されたコンテンツを伝えることができます。 現在、多くのショールームがこの技術を活用しています。 説明語や誘導語をあらかじめ作成しておくことができます。 来場者は、携帯電話などのデバイスを使用して展示物または展示エリア内の特定の指定された場所をスキャンするだけで、関連するガイダンスの言葉を聞くことができます。

自然言語処理

これからは、コンピューターは私たちが話すことを聞き、私たちが見るものを見ることができるようになります。 しかし、私たちはもっと欲しいのです。 私たちは自然言語を使用してコンピューターと対話することを好みます。これが自然言語処理の目的です。 現在、自然言語処理は機械翻訳、情報検索、会話システムなどで使用されています。

コンピュータ翻訳:主に機械同時翻訳が含まれます。

  • 情報検索: たとえば、探しているものをコンピューターに伝えると、関連するコンテンツを検索してくれます。
  • インテリジェントな顧客サービス: 音声を通じてコン​​ピューターと対話し、質問に答えてもらいます。

自然言語処理はそれほど単純ではありません。 これは比較的難しいです。 私たちは以下の問題に対処する必要があります。 1 つ目は言語の曖昧さです。これは、文が 2 つ以上の意味や方法で理解される場合があることを意味します。 たとえば、「私は銀行に行きました。」銀行はお金を保管する場所である場合もあれば、川のほとりである場合もあります。

[[328303]]

さらに、言語の堅牢性にも対処する必要があります。 私たちは日常会話の中でタイプミスをしたり、本来の意味よりも言葉を少なく言ったり、多く言ったりすることが多く、それが言語の堅牢性に影響を与えます。 また、同じ人物を指す他のニックネームが存在する場合もあります。

もう一つは知識への依存です。 通常、知識依存の問題を解決するには知識グラフを使用します。 「大梨」(中国語で「大梨」)は果物であり、北京の非常に有名なローストダックレストランの名前でもあるとします。 「7日間のツアー」のように、時間やホテル名を表すこともできます。 これらはすべて何らかの背景知識に依存しており、この問題を解決するには知識ベースまたは知識グラフを使用する必要があります。

もう一つは文脈です。 会話の文脈に基づいて、何を言うべきかを正確に判断できます。 たとえば、「私はダヤリを食べたい」という場合、「ダヤリ」は果物の一種を表している可能性があります。 「Dayali へ行こう」とすると、「Daali」はレストランを表します。 会話が異なれば、表現も異なり、意味も異なります。

まとめ

AI の産業応用に移る前に、前のセクションで学んだことを要約しましょう。 音声認識を学びました。 コンピューターは私たちの声を聞いて、私たちの言葉をテキストに翻訳するなど、それに応じて何かを行うことができます。 その後、私たちはコンピューターに視覚を与えるコンピュータービジョンに取り組みました。 コンピュータは、画像を見るだけで特定のオブジェクトを認識でき、連続した画像内のオブジェクトの変化を追跡することもできます。 これらはコンピューターによって解決される人気のトピックの一部です。 そして最後に、私たちは自然言語処理について学びました。これは、コンピューターが私たちの言うことを聞くだけでなく、私が言うことを理解し、フィードバックを返すことができるというものです。

人工知能の産業応用

市民の安全

まず、民間安全保障の分野についてお話しします。 スマートホームの普及に伴い、人工知能は徐々に公共安全の分野で役割を果たすようになりました。 たとえば、家庭用防犯カメラはビデオから学習し、日常の映像を通じてそれが自宅のものであることを認識できます。 我が家がビデオ監視範囲に入っても、警報は鳴りません。 ただし、部外者が不法に侵入した場合は、テキストメッセージを送ったり、大きな警報音を鳴らしたりして、すぐに警告を発します。 これらはスマート セキュリティ カメラのいくつかの簡単なアプリケーションです。

[[328304]]

交通機関

交通分野では、人工知能を使用して交通ビデオを分析し、そのデータを基に意思決定を行うことができます。 現在道路が混雑しているかどうか、どのような状況なのかを分析し、人工知能を使って自動的に判断することができます。 例えば、AIを活用して交通信号のタイミングを調整し交通を誘導したり、大規模な交通調整や配車を実施し都市全体の運用効率を向上させることも可能です。

[[328305]]

公安

公共安全の分野では、AI は画像認識や顔認識を利用した応用が特に顕著です。 例えば、大量の映像情報から容疑者の手がかりを見つけたり、特定の特徴を与えると、AIが映像の特徴に一致する人物や物品から情報を抽出したりと、高速かつ正確に処理します。

自動運転

人工知能は自動運転の分野でも多くの用途があります。 自動運転には、実際には環境の認識を含む多くの技術が必要です。 私たちは一連のデバイス(関連カメラ、レーザー距離計、マイクロセンサー、車両レーダーなど)を通じて周囲の環境を認識し、その情報を人工知能を通じて統合して周囲の環境の状態を判断します。 環境認識の結果に基づいて行動決定に必要なすべての情報を収集した後、人工知能を使用して、ブレーキをかけるかアクセルを踏むかなど、車が次に何をすべきかを決定する必要があります。 最後はモーションコントロールモジュールです。 AIが決定を下したら、その決定をモーションコントロールモジュールに渡して、実際にブレーキをかけたり、実際にアクセルペダルを踏んだりするなど、車を制御する必要があります。

インテリジェントロボット

インテリジェントロボットは、サービス業界、教育業界、医療業界で大きな応用の可能性を秘めています。 たとえば、現在多くの銀行では、銀行に商談に来た人や列に並んでいる人を案内したり、単に商談を紹介したりできる自動質疑応答ロボットを導入しており、これによって銀行の効率が向上し、顧客の利便性のために、ほとんどの人が商談のために銀行に来ます。


通信業界における人工知能の応用

[[328306]]

ネットワーク分野では、ネットワークセルフサービスロボット、インテリジェントVoLTE音声品質測定、スマートホームブロードバンドの設置など、人工知能技術の大規模な応用を実現しました。セキュリティ分野では、詐欺防止システムにより中国ではすでに詐欺電話を​​ブロックすることが可能で、傍受率は月間1,400万回を超えています。管理面では、契約書や請求書の監査ポイントも実装されています。インテリジェントなマシンが手動のレビューに取って代わり、毎年数億ドルを節約します。カスタマーサービスの分野では、インテリジェントなカスタマーサービス質問応答ロボットが現在、毎月 2 億 1,000 万件以上の質問に回答できます。垂直産業では、通信会社はスマート教育、スマートヘルスケア、スマート交通、スマート産業、スマート農業など、さまざまな業界で AI アプリケーションを積極的に導入しています。

まとめ

最後に、このセクションで学んだことをまとめました。このパートでは、民間安全保障の分野における AI セキュリティ カメラについて調査し、理解しました。交通分野の人工知能は、ビデオ認識を通じて機械学習を通じて交通に関する決定の基礎を提供することができ、自動的に決定を下すことさえできます。公共安全の分野では、画像認識は公共安全事件や容疑者の所在を迅速に検出するための基盤を提供することができます。

自動運転車は、人工知能技術を使用して車が周囲の環境を認識できるようにするだけでなく、車が次のステップを決定し、車を操作して自律運転の目的を達成できるようにします。インテリジェントロボットも私たちの生活の中で一般的です。彼らは通常、私たちを助けるためにカスタマーサービスの役割を果たします。最後に、モバイル企業が利用するAIネットワークプラットフォームやAIカスタマーサービスロボットを中心に、通信業界におけるAIの応用と発展について簡単に紹介しました。

<<:  数学を使わずに円の面積を計算する方法

>>:  2020 年の AI トレンド トップ 10

ブログ    
ブログ    

推薦する

人工知能が普及しつつある今、将来はロボットの時代になるのでしょうか?

今は特に人工知能が普及していますが、将来はロボットの時代になることは絶対にありません。なぜなら、機械...

...

アンドロイドが電気羊に乗れるようになりました!世界初の四足ロボット羊:妹は座ると少し震える

「アンドロイドは電気羊の夢を見るか?」このジョークは半世紀以上にわたって、SFの世界からテクノロジー...

...

それは大したことだ! Google によれば、人類は 2029 年に不死を達成するそうです。病気も老化も痛みも完全に消え去ります! ?

この世で最も公平なものは、誕生、老い、病気、そして死だと思います。人生においてどれほど偉大な業績を成...

李開復氏はAIバブルが年末までに崩壊すると予測、ルクン氏:それは本当だ

[[218838]] Innovation Works の創設者である Kai-Fu Lee 氏は、...

ハルビン工業大学は、象の鼻と同じくらい柔軟な人工筋肉を備えた柔軟なロボットを開発しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

「データオープン化」の道で、百度アポロはウェイモをリード

6月17日、世界最大のコンピュータービジョンカンファレンスであるCVPRの自動運転セミナーにおいて、...

人工知能が人々を失業させるのは悪いことではありません。それどころか、それは良い役割を果たします。

近年の科学技術の急速な発展に伴い、人工知能の概念が徐々に明確になってきています。特にOTT業界の重要...

仕事とAIの未来

[[340645]] [51CTO.com クイック翻訳] 人工知能が雇用に与える影響は、現在、さま...

2023 年に最も影響力のある 10 のオープンソース大規模言語モデル

2023 年は、大規模言語モデル (LLM) の台頭により、オープンソース分野にとって極めて重要な年...

ネットワークにおける機械学習の実用的応用

各 Web アプリケーションには独自の機能とパフォーマンス パラメーターのセットがあり、これらは動的...

...

1 つの記事で 4 つの基本的なニューラル ネットワーク アーキテクチャを理解する

[[260546]]ニューラル ネットワークを使い始めたばかりのときは、ニューラル ネットワーク ア...