信頼できるAIの基礎は、適切なタイミングで適切なデータを得ることです

信頼できるAIの基礎は、適切なタイミングで適切なデータを得ることです

私たちは人工知能の存在に慣れ始めており、生成型人工知能(GenAI)の普及により、人工知能が世界に与える影響が拡大していることもわかります。人工知能は長年にわたり、企業が「あなたの好みを推測」するのを支援するために使用されており、ますます多くの企業が分析を高速化し、より適切で迅速かつスマートな意思決定を行うことを目指しています。しかし、AIが知らないうちに誤った判断を下していたらどうなるでしょうか?

AIが興味のない本や嫌いな野菜を勧めてきたとしても、大した問題ではありません。しかし、投資家に対する財務ガイダンスや注目製品の新機能に関しては、誤った分析は、企業の業績や評判に影響を与える不適切な決定につながり、ユーザーと企業の両方をリスクや損害にさらす可能性があります。

ここで疑問が浮かび上がります。重要な決定を下すのに AI を本当に信頼できるのでしょうか? 特に、より洗練されたディープラーニング (DL) と GenAI モデルがトレーニングされ、日常使用向けに展開されるにつれて、その疑問は高まります。

その答えは、機械学習ライフサイクルにおけるデータとデータ品質の重要な役割を理解することにあります。

データ品質の影響

信頼できる AI に関しては、意思決定に使用されるデータの品質が大きな意味を持ちます。不完全、不正確、または偏りのある欠陥のあるデータは、AI 予測の精度を歪める可能性があります。 AI システムで信頼できないデータに依存すると、悲惨な結果を招く可能性があります。

あなたが財務上のアドバイスを求めている投資家であり、投資の意思決定を支援する AI プラットフォームを利用しているところを想像してください。このタイプの AI は、過去の財務データに基づいて市場動向を分析し、潜在的な機会を特定し、推奨事項を提供します。しかし、AI が使用しているデータが不完全であったり偏っていたりする場合 (おそらくシステムに完全に統合されていなかったため)、AI が提供するガイダンスに欠陥が生じ、誤った投資経路に誘導される可能性があります。

たとえば、AI は限られた数のソースからの財務データにしかアクセスできず、特定の部門や地域に関する重要な情報は無視されます。その結果、AI の分析では市場の大きな変化や新たなトレンドを見逃し、収益性の高い投資機会を活用できなくなる可能性があります。

さらに、偏ったデータは AI の意思決定プロセスに悪影響を及ぼします。バイアスはデータ収集方法に潜り込んだり、データ自体に内在したりすることがあり、その結果、洞察や推奨事項が歪んでしまうことがあります。たとえば、AI システムで使用される財務データが主に特定の人口統計を表していたり​​、さまざまな経済的要因を考慮していない場合、結果として得られる投資推奨は、より広範な市場の現実を反映していない可能性があります。

不完全または偏ったデータに基づく予測だけに頼ると、誤った投資判断につながり、財務上の成功に悪影響を及ぼし、ビジネスの成長を妨げる可能性があります。 AI モデルのトレーニングと展開時に AI システムが下す決定の信頼性は、利用可能なデータの信頼性と同程度にしかならないことを認識すると、データ品質の重要性が明らかになります。 「Garbage in, garbage out」は時代を超えた名言です。

建物の構造的完全性には強固な基礎が不可欠であるように、信頼性の高い高品質のデータは信頼できる AI 運用の基盤を形成します。損傷した建築材料や脆弱な基礎が構造物の安定性と安全性を損なう可能性があるのと同様に、不完全なデータは AI の決定の正確性と信頼性を損なう可能性があります。

これらのリスクを軽減するために、組織はデータ収集プロセスを優先し、完全性、正確性、偏りのなさを確保する必要があります。さまざまなセクター、人口統計、地理的地域にまたがる多様で包括的なデータセットを収集するよう努める必要があります。複数のソースを相互参照したり、データ クレンジング アルゴリズムを採用したりするなどのデータ検証手法を使用すると、エラーを特定して修正し、より正確な現実の表現を実現できます。

堅牢なモデルの重要性

データの品質にとって重要なのは、データを使用して予測的な洞察を生成するために使用されるモデルです。 AI 主導の意思決定の信頼性は、これらのモデルの堅牢性、正確性、透明性、およびモデルを構築するための適切なデータとデータセットの使用に大きく依存します。

医療業界で AI が使用され、医師が病気を診断するのを支援することを想像してみましょう。 AI モデルは複雑なニューラル ネットワークを使用して患者の症状を分析し、診断の推奨を提供します。ニューラルネットワークは病気の特定において高い精度を示すかもしれないが、どのようにして結論に達したかを説明する透明性が欠けている。

この予測を患者の診断に役立てる医師であれば、すぐに診断を下すことはできますが、その結論に至った要因を理解することはできません。透明性がなければ、AI を盲目的に信頼することは、重大な症状を見逃したり、重要な医学的考慮事項を考慮に入れなかったりする可能性があるため、非常に危険になります。こうした課題は、信頼と透明性が不可欠な、規制の厳しい業界ではよく見られます。

一方、医療 AI ツールが決定木アルゴリズム モデルを使用する場合。意思決定ツリーは、意思決定プロセスを段階的に詳細に説明しているため、解釈しやすいことで知られています。この場合、AI システムが診断を推奨すると、意思決定の経路を簡単に追跡でき、どのような症状や要因がその結論に至ったかを理解できます。この透明性により、医師は AI の推奨事項についてより情報に基づいた判断を下すことができます。

別の例として、目の前に 2 つの複雑なパズルがあると想像してください。1 つには明確な指示と透明な手順がありますが、もう 1 つにはガイドや説明がありません。最初のパズルでは、論理的な進行を簡単に理解できるため、効率的に解くことができます。しかし、2 番目のパズルでは、混乱や不安を感じ、自分の決定を信頼したり、正しい解決策を見つけたと確信したりすることが難しくなります。推測、仮定、試行錯誤が意思決定プロセスの一部になります。堅牢で透明性の高いモデルにより、ユーザーは AI の意思決定プロセスをより深く理解できるようになり、推奨事項に対する信頼が高まります。

セマンティックレイヤーの役割

セマンティック レイヤーは、AI の意思決定の信頼性を高めるために共通のデータ レイヤーを作成する上で重要な役割を果たします。これは、上記の例で見たように、AI の価値と信頼性を大きく損なう可能性がある、一貫性のないデータ定義とコンテキストの欠如という課題に対処します。セマンティック レイヤーは、単一の真実のソースを確立することで、データが通過する変換のすべてのステップを可視化する共通のデータ ソースからすべての AI アプリケーションが動作することを保証します。

組織内の異なるチームや個人が異なる測定単位を使用したり、データの解釈が異なったりすると、コラボレーションが妨げられ、矛盾した結論につながる可能性があります。セマンティック レイヤーは、共通の理解を提供することでこの問題を克服するのに役立ちます。データ内の関係、概念、コンテキストをキャプチャし、一貫した解釈と分析を可能にします。組織全体でデータに対する共通の理解を持つことで、同じ信頼できる情報源に基づく結論をより信頼性の高いものにすることができます。

セマンティック レイヤーは、データが正確に理解され、解釈され、一貫して使用されることを保証し、AI システムの洞察に対する信頼を促進します。

人工知能への信頼の構築

本当の問題は、「AI システムが信頼できる決定を下すことをどうやって保証するか」です。

AI への信頼を高めるには、組織は堅牢性、正確性、透明性を実証するモデルの開発と活用を優先する必要があります。これには、モデルの内部の仕組みを理解して説明できるようにするために、説明可能な AI などの技術を使用する必要があります。さらに、組織はモデル評価方法を採用し、感度分析やパフォーマンス メトリックなどの手法を使用してモデルの信頼性と妥当性を評価することができます。セマンティック データ レイヤーを作成すると、共通のソースが存在するため、AI の意思決定の信頼性、透明性、情報が向上します。こうした取り組みがなければ、AI が信頼できる意思決定パートナーとして認められることは決してないでしょう。

慎重な調査に加えて、適切な質問をすることが AI との信頼関係を築く上で重要です。 AI に適切な質問をすることで、私たちに代わって重要な決定を下す際の信頼性を判断できます。

考慮すべき重要な質問をいくつか挙げます。

  • AI のトレーニングとガイドに使用されているデータはどのようなものですか? そのデータは完全で、正確で、偏りのないものですか?
  • データ分析に使用されるモデルはどのように構築されていますか? それらは正確で、堅牢で、透明性がありますか?
  • AI の決定は、フィードバック ループの一環として人間の専門家が下した決定とどのように比較されますか?

データが完全で正確かつ偏りのないものであることを確認し、正確で堅牢かつ透明性の高いモデルを利用することによってのみ、AI が正しい決定を下すと真に信頼できるようになります。信頼できる AI は進歩の触媒となり得ますが、それは AI の発展を助けるために必要な行動を私たちが取った場合に限られます。生成 AI はこの課題をさらに拡大するだけなので、強固なデータ基盤がこれまで以上に重要になります。

<<: 

>>:  AIドローンレースが人間のチャンピオンに勝利、ネイチャー誌が表紙:AlphaGoの成果を現実世界にもたらす

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

AI および機械学習プロジェクトはどの程度安全ですか?

[[355693]]人工知能と機械学習はメリットをもたらす一方で、新たな脆弱性ももたらします。この...

ジェネレーティブ AI がクラウド セキュリティにもたらす変化

クラウド セキュリティと人工知能には長年にわたる関係があります。ほぼ 10 年にわたり、AI はパタ...

人工知能はどのようにして新しい世界を創造するのでしょうか?

AI は時間の経過とともにさらに賢くなり、パワーを増していきます。私たちの多くにとって、人工知能 ...

人工知能アプリケーションのための6つの主要技術、ついに誰かがわかりやすく説明

[[338620]]画像はPexelsよりこの記事はWeChatの公開アカウント「Big Data ...

人工知能は未来の都市にどのような力を与えるのでしょうか?

スマート シティが将来のアイデアだけでなく現実のものとなるにつれ、人工知能 (AI) が台頭してきて...

データ構造とアルゴリズムについて知っておくべき 50 のコード実装

今日、私は GitHub で非常に優れたプロジェクトを見つけました。現在、4700 以上のスターが付...

Google の自動運転車は「先​​天的な欠陥」があるが、その商品化は「中止」の運命を免れるだろうか?

[[248486]]グーグルの自動運転車開発会社ウェイモはすでに試験的な移動サービスの一部を有料化...

最新の! 2018年中国プログラマーの給与と生活に関する調査レポート

中国インターネット情報センター(CNNIC)が発表した第41回中国インターネット発展統計報告によると...

日本の量子コンピューティング戦略:2030年までに量子技術ユーザー1000万人を目指す

量子時代が到来し、世界は安全・安心な暮らしとより良い社会の実現への期待が高まっています。 最近、日本...

2020年職場のAIスキルランキング:TensorFlowが人気上昇、Pythonが最も人気、マーケティング部門も学習中

2020年まで残り1ヶ月となりました。最近、オンライン教育ウェブサイトのUdemyは、受講生のコース...

人気の「GPT-4 MIT学部数学フルスコア」論文が不正、データセット自体に問題あり

過去 2 日間で、GPT-4 が MIT EECS と数学の学部試験に満点で合格したという論文が T...

...

Microsoft のエンジニアが PyTorch を使用してグラフ アテンション ネットワークを実装し、驚くべき視覚効果を実現

最近、グラフアテンションネットワークの視覚化に関するプロジェクトが多くの研究者の関心を集めており、開...