人工知能における非構造化データの役割

人工知能における非構造化データの役割

人工知能 (AI) システムは人間に似た方法でやり取りするため、一部の人は不安に思うかもしれませんが、AI は人間に取って代わるものではありません。実際には、それはロボットを人間から切り離すことに関するものです。 AI の価値の大部分は、手動のプロセスを自動化し、大量のデータを迅速に分析して、人間が理性と判断を必要とするより高度なタスクを自由に実行できるようにすることです。しかし、この段階に到達するには、AI システムがユーザーと通信し、自然な形式 (非構造化データとも呼ばれる) のデータ、つまり音声、画像、テキストなど、きちんとした方法でパッケージ化できない自由に流れるデータすべてを分析できる必要があります。

[[277773]]

非構造化データは人工知能システムの開発に不可欠です。 AI システムがユーザーとより良くコミュニケーションをとるほど、自律的に学習できるようになり、より効果的になります。これは、AI システムがユーザーに構造化された形式での対話のみを要求する場合、そのコンポーネントが大幅に制限されるため重要です。 AI が成功するには、乱雑な情報を理解する必要があります。

この文脈では、非構造化データがどのように作用するかについて、より深い理解が必要です。

非構造化データの課題

人間界では、会話をするときに礼儀作法に則って話さないと、私たちの心の中には、慣習に従うかどうかに関わらず、あらゆるものが何らかの形で現れる可能性があります。人々は俗語、皮肉、ジョークを使うかもしれません。人間にとって、日常会話や伝えたい情報を整然とした列や行に整理することは自然なことではありません。言語自体は構造化されていません。

アマゾン・ドット・コム社のAlexaとやり取りしたことがある人なら誰でも、Echoシステムは一般的に自由形式のコマンドの理解にかなり長けているが、定義されたプロトコルがないため、時々問題が起きたり、少なくともAlexaの質問への回答が型にはまらないときにおかしな応答が返ってくることがあることを知っている。 Amazon は、この人間のような音声が命令に応答できるようにするアルゴリズムの開発と継続的な改善に膨大なリソースと数百万ドルを投資してきましたが、Echo が自由に流れる言語を解読することに長けているのと同じくらい、Alexa にもまだ欠陥があります。

Alexa の例は、非構造化データの複雑さの 1 つを浮き彫りにしています。 AI システムがテキストのデジタル版を処理して作成する能力も、特に企業がニュアンスやコンテキストの重要性を考慮する場合には、高い要件となります。家族旅行で撮った写真や印象派の美術史の教科書に載っている画像の中で何が起こっているのかを「理解」しようとする機械を想像してみてください。

非構造化データの処理に伴う複雑さは、企業における AI 導入の最大の障害と言えるでしょう。しかし、それらは克服できないものではありません。

専門知識の重要性

非構造化データは本質的にノイズが多いです。そのため、パターンを突き止め、解明し、検出し、それらのパターンを認識するモデルを開発するには、多大な専門知識が必要です。データ サイエンティストは AI システムの改善を積極的に推進しており、最大の成功例は人間の本能と経験が必要であることを示しています。これは、チームが AI の非常に狭い範囲のアプリケーションに重点を置く場合によく発生します。

労働者災害補償請求プロセスを例に挙げると、請求について深い理解を持つデータ サイエンティストのチームは、発見した主要な指標に基づいて予測モデルを作成できます。診断、投薬情報、請求記録などの非構造化データが含まれます。そうすることで、AI システムは早期の指標を評価し、請求が拒否される可能性が高いと判断します。その後、ユーザーに警告を提供できます。請求担当者は、請求者の弁護士が関与するのを防ぐために、特定の請求にどのように介入してより注意を払うべきかを判断できます (請求が拒否されると弁護士が関与することになり、非常に費用がかかり、解決に長い時間がかかることがよくあります)。

この場合、AI システムがどのようにユーザーを支援できたか、また非構造化データを組み込むことで、構造化データのみに頼る場合と比べて精度が大幅に向上したかが簡単にわかります。非構造化データには、構造化データに必ずしも含まれない情報や洞察の金鉱(併存疾患に関する情報など)が存在します。情報が追加されるたびに、AI システムはより賢くなり、結果も向上します。これにより効率が向上し、請求コストが削減されます。

これは、非構造化データをエンタープライズ AI システムに組み込むことによる利点のほんの一例です。コードを解読するには時間と労力がかかりますが、その見返りとして、数日や数週間ではなく数分または数時間で前例のない洞察が得られます。

非構造化データが鍵

将来的には、あらゆる AI システムがユーザーと自然な方法で対話する必要があることは明らかです。すべての組織はこれに細心の注意を払う必要があります。実際、非構造化データ分析がロードマップの一部になっていない場合、企業の提供内容には大きなギャップが生じます。

非構造化データの課題にもかかわらず、Amazon、Google、Apple などは AI アプリケーションに多くの機会を提供しています。これらの進歩を活用して、ビジネスに大きな影響を与えるエンタープライズ アプリケーションに適用することができます。

時間をかけて専門知識と健全なデータ サイエンスを適用することで、大きな進歩を達成できます。将来的には、非構造化データを通じてデータ分析の精度が向上するだけでなく、情報の考え方、伝達方法、活用方法も根本的に新しくなるでしょう。

<<:  AI軍拡競争により、将来のAIハードウェアアーキテクチャの開発に3つの主要な方向性が生まれました。

>>:  5G、自動運転、人工知能はどの段階にあるのでしょうか?一枚の写真でわかる

ブログ    

推薦する

...

...

データサイエンスにおける強力な思考

統計学の入門コースを受講したことがあるなら、データ ポイントは理論を刺激したりテストしたりするために...

人工知能技術が伝染病の予防と制御に役立つ

[[318426]]現在、人工知能技術は急速に発展しており、特に医療保健の分野では、生活の各分野で広...

機械学習を妨害する10のサイバー攻撃

サーセイ・ラニスターの策略やサー・ジョラー・モーモントの父親のような保護をもってしても、攻撃者が H...

ロボットシェフはトマト入りスクランブルエッグ9品を試食した後、味覚マップを描いた。

5月7日のZhidongxiによると、英国ケンブリッジ大学の研究者らは最近、シェフの調理過程を模倣...

機械に記憶を与える: DeepMind の主要研究は柔軟な重み統合アルゴリズムを提案

世界で最も注目されている人工知能研究機関のひとつである Google DeepMind は、常に私た...

企業は今後の組織開発においてハイパーオートメーションを採用するでしょうか?

[[386200]] [51CTO.com クイック翻訳] 事実によれば、ロボティックプロセスオー...

トランスフォーマー6周年:その年にNeurIPS Oralを受賞しなかった8人の著者が、いくつかのAIユニコーンを創設した

ChatGPTからAI描画技術まで、人工知能分野における最近の進歩はTransformerのおかげか...

自動運転で冬季オリンピックはよりスマートに

[[438829]]発進時に左ウィンカーを出し、歩行者がいる場合はスピードを落として迂回し、障害物が...

...

...

人工知能に関するよくある質問10選への回答

[[380789]]人工知能は今世紀の主要な話題の一つです。 AI の能力と無限の可能性は、多くの興...

...

北京が初の政策実験区を設置:自動運転は今年中に試験運用へ

車に乗り込み、コードをスキャンすると、運転手が操作しなくても黒い「タクシー」が動き出す。横断歩道では...