1956年にコンピューターの専門家ジョン・マッカーシーが「人工知能」という言葉を作り出して以来、わずか数十年の間に驚くべき進歩が遂げられ、紙の設計図から応用段階へと急速に移行しました。 2019 年に人工知能を支配するテクノロジーはどれでしょうか?今日はそれを振り返ってみましょう。 自然言語処理 完全な自然言語処理システムは、音声認識、意味認識、音声合成の 3 つの部分で構成されます。過去 20 年間で、自然言語処理技術は大きな進歩を遂げ、研究室から市場へと移行し始めました。今後10年間で、音声認識、意味認識、音声合成技術が、産業、家電、通信、自動車エレクトロニクス、医療、ホームサービス、民生用電子機器などのさまざまな分野に導入されると予想されています。 私の国は音声認識技術において明らかな優位性を持っており、iFlytekやBaiduに代表される優れたAI企業を生み出してきました。過去2年間、iFLYTEKはTo Bトラックでの広範な展開に加えて、iFLYTEK翻訳機、iFLYTEKボイスレコーダー、iFLYTEKスマートオフィスブック、iFLYTEKスーパーブレイン学習機、iFLYTEKスマートマウス、Alphaシリーズスマートロボットなど、Cエンドをターゲットとした一連の人工知能製品も発売し、日常生活、オフィス、学習のあらゆる側面をカバーしています。 2019年の618とダブル11ショッピングフェスティバルでは、iFLYTEK Translatorは優れた性能、最大98%の音声認識精度、便利な操作性により、競合他社を上回り、それぞれTmallとJD.comでの累計売上高と売上高でトップの座を獲得しました。これは、同社が自然言語処理とアプリケーションにおいて良い着地点を見つけたことを意味します。 コンピュータビジョン 実際に解決すべき問題に応じて、コンピューター ビジョン テクノロジは、顔認識、画像検出、画像検索、ターゲット追跡、スタイル転送など、いくつかの主要なセクションに分けられます。中でも、顔認識や画像分類などのコンピュータービジョン技術は、すでに人間の視覚よりも正確で高速です。病院では、早期食道がんの検出率は一般的に10%未満です。テンセント・ミーイングは、上部消化管内視鏡画像をスキャンすることで食道がんを検査することができ、4秒未満で最大90%の検出率を実現します。 SenseTime は、同社のコンピューター ビジョン技術を使用することで、ビデオ コンテンツのレビューにかかる人手を 99% 削減できると主張しています。 コンピューター ビジョンは、認識、検出、クラスタリングなどの問題を解決する点ですでに人間を上回っていますが、その開発には依然として課題が残っています。 まず、人工知能モデルのトレーニングに利用できる大規模なデータセットが不足しています。第二に、技術から製品、大規模なアプリケーションに至るまでのエンジニアリング経験が不足しています。コンピューター ビジョン テクノロジの適用は、もはや単一のソフトウェア アプリケーションではありません。新しいインフラストラクチャ、新しいデータ分析プロセス、カメラなどのスマート ハードウェアのインストールが必要になります。各リンクは認識効果に影響を与える可能性があります。この技術を研究室から産業応用に拡大するプロセス自体が大きな課題です。 ナレッジグラフ ナレッジグラフは、2012 年に Google によって最初に提案された新しい概念です。学術的な観点から、ナレッジ グラフを次のように定義できます。「ナレッジ グラフは、本質的にはセマンティック ネットワークの知識ベースです。」しかし、これは少し抽象的なので、別の観点から、実際の応用の観点から、ナレッジ グラフを単純にマルチリレーショナル グラフとして理解することができます。これまでのインテリジェント分析が各個人に焦点を当てていたのに対し、ナレッジ グラフはこれらの個人間の「関係」に焦点を当てています。ナレッジグラフは、「グラフ」という形式を使用して、エンティティ間の関係を最も効果的かつ直感的に表現します。これは、現実世界に最も近く、人間の思考パターンに適合したデータ編成構造です。 従来のインテリジェント分析と比較して、ナレッジグラフはグラフベースのデータ構造です。つまり、ナレッジグラフは大量の情報から多次元の特徴情報を抽出し、これらの特徴情報資料に基づいて、インテリジェントな推論を通じてデータから視覚イメージまでの深い処理を実現し、ユーザーに直感的かつ簡単に提示し、ユーザーと対話できるようにします。 現在、ナレッジグラフは主に検索、推奨、質疑応答などのインターネット指向のビジネスシナリオで使用されており、商用検索エンジン企業を筆頭とするインターネット企業が多額の投資を行っている人工知能技術の1つとなっています。同時に、金融、医療、電子商取引、公共安全の分野でも広く検討され始めています。 機械学習 機械学習とは、明示的なプログラム指示に従わずにデータのみを通じてパフォーマンスを向上させるコンピュータシステムの能力を指します。機械学習の本質は、データ内のパターンを自動的に発見することであり、発見されたパターンを使用して予測を行うことができます。たとえば、機械学習システムに、取引時間、販売店、場所、価格、取引が正当かどうかなどのクレジットカード取引情報のデータベースを与えると、システムはクレジットカード詐欺を予測するために使用できるパターンを学習します。処理されるトランザクションデータが増えるほど、予測の精度が高まります。 機械学習の応用範囲は非常に広く、大量のデータを生成するほぼすべてのアクティビティのパフォーマンスを向上させる可能性があります。これらの活動には、不正行為の検出に加えて、売上予測、在庫管理、石油・ガス探査、公衆衛生などが含まれます。機械学習は、視覚モデルを継続的にトレーニングして改善することで、大量の画像内のオブジェクトを認識する能力を向上させることができるコンピューター ビジョンなどの他の認知技術でも重要な役割を果たします。 ロボット マシンビジョンや自動計画などの認知技術を、極めて小型ながら高性能なセンサー、アクチュエーター、巧みに設計されたハードウェアに統合することで、人間と一緒に作業し、さまざまな未知の環境でさまざまなタスクを柔軟に処理できる新世代のロボットが誕生しました。たとえば、工場の現場で人間と作業を分担できるドローンや「コボット」などです。 バーチャルアシスタント 仮想アシスタントは、人間と対話できるコンピュータエージェントまたはプログラムです。Apple 製品の Siri、Microsoft Cortana、Google Assistant、Amazon Alexa などのチャットボットが最も有名です。仮想アシスタントは、顧客サービスやサポートによく使用され、スマートホームの管理者として機能することもできます。 2019年に、ある研究機関が上記の製品を一緒にテストしたところ、精度ではGoogleアシスタントが93%、Siriが83%、Alexaが80%で勝利しました。 Google アシスタントは、商業カテゴリのクエリに回答する際に最も優れたパフォーマンスを発揮し、製品やサービスの情報、特定のアイテムの購入場所に関する質問の 92% に正しく回答しました。これに対し、Siri は 68%、Alexa は 71% でした。 ディープラーニングプラットフォーム 複数の抽象化レイヤーを備えた人工ニューラル ネットワークを使用する特殊なタイプの機械学習。現在、非常に大規模なデータ セットをサポートするパターン認識および分類アプリケーションで主に使用されています。代表的なメーカーとしては、Deep Instinct、Ersatz Labs、Fluid AI、MathWorks、Peltarion、Saffron Technology、Sentient Technologies などが挙げられます。百度、iFLYTEK、テンセントなどの国内企業も、独自の技術的特徴を備えたディープラーニング・プラットフォームを立ち上げている。 意思決定管理 エンジンはルールとロジックを AI システムに埋め込み、初期セットアップ/トレーニングおよび継続的なメンテナンスとチューニングに使用されます。これは、自動化された意思決定を支援または実行するために、幅広いエンタープライズ アプリケーションで使用される成熟したテクノロジです。代表的なベンダーとしては、Advanced Systems Concepts、Informatica、Maana、Pegasystems、UiPat などがあります。 生体認証 画像やタッチの認識、音声、ボディランゲージなど、人間と機械のより自然なやり取りをサポートできます。現在は主に市場調査に使われています。代表的なメーカーとしては、3VR、Affectiva、Agnitio、FaceFirst、Sensory、Synqera、Tahzoo などがあります。 ロボティックプロセスオートメーション スクリプトやその他の方法を使用して人間の操作を自動化し、効率的なビジネス プロセスをサポートします。現在、タスクまたはプロセスが人間にとって実行するにはコストがかかりすぎるか非効率的な場合に使用されます。代表的なベンダーには、Advanced Systems Concepts、Automation Anywhere、Blue Prism、UiPath、WorkFusion などがあります。 |
<<: 2020 年のソフトウェア開発における 6 つの画期的なトレンドは何ですか?
>>: プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある
[[419580]]データから実用的なリアルタイムの洞察を生成するには、企業は人工知能や機械学習の導...
企業で人工知能が応用され、開発されるにつれて、ビジネスリーダーは市場競争力を向上させるためにクラウド...
最近、Vincent Diffusion アーティファクトをオープンソース化した Stability...
[[282511]]製造業の新たな課題製造業はインテリジェント製造に向けてアップグレードし、変革する...
1. 背景知識 - テキスト画像生成の現状まずは背景知識をご紹介します。テキスト画像生成モデルにつ...
ChatGPTなどの大規模言語モデルがAI変革の新たな波を引き起こすにつれ、AIチップの不足はます...
[51CTO.com クイック翻訳] インターネットの活発な発展とインターネットユーザーの継続的な増...
より高品質の製品をより多く、より低コストで生産することは、製造業の永遠の目標です。スマート製造革命に...
6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...
これは、これまで見た中で最もわかりやすいニューラル ネットワーク パラメータの説明です。数式も最小限...
【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...
Google は最新のブログ投稿で、テキスト分類タスクで BERT レベルのパフォーマンスを達成でき...