人工知能の応用範囲は想像を超えています

人工知能の応用範囲は想像を超えています

こんにちは!皆さん、こんにちは。私は大学の科学研究者で、主に人工知能の分野で研究を行っています。今後も、第一に、人工知能に関する知識の紹介と普及、第二に、人工知能の事例分析、第三に、人工知能に関する最新の研究進捗報告というコンテンツをお届けしていきます。さて、まずは人工知能とは何か、そしてどこで活用できるのかをご紹介しましょう。

[[377726]]

人工知能

1. 人工知能とは何ですか?

まず、人工知能とは何かを理解する必要があります。人工知能や機械学習は、赤ちゃんが物事を学ぶ方法に似ています。赤ちゃんにリンゴとナシを与えて、ナシとは何か、リンゴとは何かを教えます (下の図を参照)。赤ちゃんは目でリンゴとナシの違いを見分けます。明らかに、この2つには色が大きく異なり、形も異なることがあります。そして、色や形は機械学習では特徴と呼ばれるものです。

[[377727]]

リンゴとナシの見分け方

人間は視覚的な特徴を使って物体を識別しますが、機械も同様です。違いは、人間は目を通して物体を認識するのに対し、機械はカメラで取得した画像を通じて特徴を分析して抽出することです。

視覚認識

2. 機能とは何ですか?

では、機能とは何でしょうか?例えば、下の図に示すように、特徴はピクセルであったり、ピクセルで構成されたオブジェクトのエッジ情報であったりします。これらは低レベルの特徴です。エッジ フィーチャは、人間の耳、鼻、目、口などの中間フィーチャを形成することもできます。さらに中間特徴を組み合わせることで、物体の表現モデルを得ることができます。例えば、人の頭は、耳、鼻、目、口などの中間構成要素特徴で構成されています。もちろん、特徴は人工的に設計することも可能であり、ディープラーニングが提案される前は特徴エンジニアリングと呼ばれていました。

特徴抽出

3. どうやって勉強するの?

機能が何であるかがわかったので、学習にそれをどのように使用すればよいでしょうか?ここでは、ディープラーニング畳み込みニューラルネットワークを例に、猫と犬の分類を目標として、機械学習アルゴリズムの動作プロセスを簡単に紹介します。機械学習は、猫と犬のサンプルを入力として受け取り、畳み込みニューラル ネットワークを通じて猫と犬のいくつかの特徴を抽出します。この特徴はアルゴリズムによって自動的に抽出されます。上の図のように、特徴もオブジェクトのピクセル、コンポーネント、モデルなどで構成されています。次に、ディープラーニング モデルは上記の特徴を組み合わせ、最終的に分類レイヤーを通じて画像を分類し、それが猫であるか犬であるかの確率を決定します。

畳み込みニューラルネットワーク

4. 人工知能はどこで活用できるのでしょうか?

最後に、おそらく誰もが気になるのは、人工知能や機械学習はどこで活用できるのか、ということでしょう。機械学習の実装は難しいという噂をよく耳にしたことがあるかもしれません。以下は機械学習のいくつかの応用シナリオです。

1. 自動運転。自動運転には、道路認識、道路標識認識、シーン理解、歩行者検知、車両認識、測位、ナビゲーションなど、多くの高度な技術が関わっており、これらはすべて機械学習技術と切り離せません。

道路セマンティックセグメンテーション

道路シーンの理解

2. ビデオ監視と検索。機械学習は監視の分野にも応用できます。たとえば、機械学習は人間の行動や属性特性を抽出し、周囲の環境に異常がないかどうかを監視できます。あるいは、警察は都市の監視システムを呼び出して、特定の特性を満たす人々を探すことができます。これは、監督機関による犯罪者の迅速なスクリーニング、調査、追跡に重要な役割を果たします。

歩行者の属性認識

3. 産業分野。産業分野では、例えば、3C 製品の印刷品質を識別し、製品のラベルが正しく印刷されているかどうかを判断できます。i3 コンピューターのラベルを i5 に貼り付けないでください。

ラベル文字認識

また、ボルトが締まっているか、製品に欠陥がないかを判断するなど、組み立てや製品の品質検査にも使われています。欠陥のある製品が市場に出回れば、顧客に悪い印象を与えてしまう可能性があります。新エネルギー電池など一部の分野でも、製品に欠陥があれば爆発などの危険を引き起こす可能性があります。

視覚的な欠陥検出

4. 音声認識と翻訳。携帯電話やコンピューターの音声アシスタントに話しかけると、ソフトウェアを開いたり、画像を検索したり、Web ページやその他のサービスを開いたりすることができます。もちろん、スマートスピーカー、スマート会話ロボット、Tmall Genieなど、成熟したアプリケーションもあります。音声認識は確かに私たちの生活に多くの利便性をもたらしました。

[[377732]]

音声認識アプリケーション

5. 検索エンジン。 Web ページにいくつかのキーワードを入力すると、Web ページがコンテンツの検索に役立ちます。さらに、Taobao、Douyin、Toutiao を使用したことがある人なら、機械学習技術を使用して、ソフトウェアが検索履歴に基づいてコンテンツを推奨することもできることを知っているはずです。

6. 株価予測。株式市場では、株価変動の履歴を一日中監視することが、近い将来、AI ソフトウェアに置き換えられるかもしれません。例えば、海外の関係機関は株価予測ソフトの研究を進めている。これはAIソフトを使って、現在の経済、軍事、国際関係など現在および過去の社会情報をインターネットで自動的に検索し、株価の上昇や下落を自動的に予測するものだ。これは、私たち人間が収集する情報よりも包括的かつ高速である可能性がある。

株価予測

7. その他上記のアプリケーションに加えて、機械学習には、映画の特殊効果制作、ゲーム開発、天気予報、医療診断、金融リスク評価など、他の多くのアプリケーションもあります。

[[377733]]

[[377734]]

CT診断

[[377735]]

天気予報

[[377736]]

リスク評価を入力する

<<:  スマートシティが公衆衛生危機の影響を緩和する方法

>>:  「AI as a Service」は、業界における人工知能の応用シナリオです。

ブログ    

推薦する

自然言語処理がヒラリーとトランプの「話し方」を分析

[[173621]]編集者注:現地時間10月9日、米国大統領選挙の2人の候補者による第2回公開討論会...

彼らはAIを使って時の塵を拭い去り、半世紀前のアジア競技大会で中国が初めて金メダルを獲得した時の記憶を再現した。

杭州アジア競技大会初の金メダルが誕生した。女子軽量級ダブルスカルボート決勝では、中国の鄒佳琦選手と邱...

大規模モデルによって NLP エンジニアは時代遅れになったのでしょうか?

1. 新しく職場に入る1. 職場に入るときに直面する問題初めて職場に入るとき、新卒から社会人へと移...

機械学習モデルが公平かどうかを簡単に確認する方法

[[361220]] [51CTO.com クイック翻訳] 私たちはますます分断が進む世界に住んでい...

...

2017 年のトップデータサイエンスと機械学習手法

[51CTO.com クイック翻訳] 統計によると、回答者が現在選択している最も一般的に使用されてい...

AISpeechの趙恒毅氏:国内のスマート音声産業は幅広い発展の見通しがある

[51CTO.comからのオリジナル記事] 人工知能の急速な発展に伴い、音声インタラクションは人工知...

...

この記事では、ロボットが視覚を通じてターゲット追跡を実現する方法を説明します。

概要: 視覚追跡技術は、コンピュータービジョン(人工知能の一分野)の分野における重要なトピックであり...

ディープラーニングを始めるために理解すべき25の概念

[[245072]] 1. ニューロン- 脳の基本要素を形成するニューロンと同様に、ニューロンはニュ...

Facebook がアルゴリズム コード ライブラリ PySlowFast をオープンソース化、最先端のビデオ理解モデルを簡単に再現

Facebook AI Research は近年、ビデオ理解研究において多くの素晴らしい成果を上げて...

パドルパドル中国ツアーは、中小企業のソフトウェアおよびハードウェア製品の革新の需要に応えるために深センに上陸しました

AI応用の時代において、人工知能技術は研究室から産業化へと移行しています。人工知能が徐々に製品応用市...

PULSE: 暗黙の空間に基づく画像超解像アルゴリズム

CVPR 2020 に採択された論文「PULSE: 生成モデルの潜在空間探索による自己教師あり写真ア...

...

プロジェクト Digging 21 - 軽量 LLM エージェントの構築方法

8 月 12 日、Juli プロジェクト シリーズの第 21 回「大規模言語モデルのトレーニングとア...