AI バイアス: なぜ起こるのか、そして企業はどのように修正できるのか

AI バイアス: なぜ起こるのか、そして企業はどのように修正できるのか

ビジネスや社会で AI の利用が広まるにつれ、企業は機械モデルに現れる人間の偏見に注意を払う必要があります。企業は人間の知性を活用して、アルゴリズムのトレーニングに必要なさまざまなデータと入力を取得できます。

[[343633]]

データセット内の偏りを回避する方法があります。

人工知能 (AI) アルゴリズムをトレーニングする場合、データの入力に依存します。これは特にビジネス環境に当てはまります。ビジネス環境では、AI の目的が顧客とのやり取り、自動化システムの管理、人間の意思決定の模倣である可能性があります。結果が目的と一致することは非常に重要です。しかし、AI が指示やリクエストに応答する方法に歪みをもたらす可能性のある偏りに企業が対処できることが重要です。

新製品の設計と開発の段階は、企業がテストを実行し、欠陥を特定して排除できるため、非常に重要です。何らかの理由で設計上の欠陥が見落とされたり、製品が故障したりした場合でも、すぐに解決できます。故障したデバイスはリコールされ、ソフトウェアの問題を修正するためのアップデートやパッチが発行されます。これは典型的なソフトウェアリリースでは問題ありませんが、人工知能アルゴリズムの取り扱いはそれほど簡単ではありません。

AI アルゴリズムは、機械学習 (ML) に基づいて非常に特殊なタスクを実行するように設計された、非常に複雑なシステムです。 AI が運用を開始した後に生み出される偏見を解消しようとすると、コストと時間がかかる可能性があります。また、「学習」するテクノロジーにとっては直感に反する行為でもあります。設計および開発段階で逸脱を検出して排除するプロセスを導入する方が効果的です。

偏見はビジネスに悪影響を及ぼす

人工知能の基本的な目的と機能は、その基礎となるアルゴリズムに組み込まれています。 AI が固有の偏見を持つようになると、アルゴリズムに悪影響を与えることになります。これは、AI が提供することが期待される精度と効率に重大な影響を及ぼし、AI が商業ニーズを満たす能力を制限する可能性があり、いずれもビジネスにとって悪影響となります。

開発者の善意にもかかわらず、偏見は常に AI アルゴリズムに侵入する方法を見つけます。他の学習プロセスと同様に、生徒は教師の影響を受けます。認定機関が提供する教育の範囲は、その機関が提供するコースによって異なります。当然のことながら、カリキュラムが多様になればなるほど、生徒の考え方はよりオープンになります。同様に、より大規模で多様なデータセットは、より正確で効率的な AI アルゴリズムを生成するのに役立ち、よりスマートな意思決定が可能になります。

トレーニングデータとテスト結果

成功する AI アルゴリズムはすべて、トレーニング データに基づいて構築されます。ただし、ビジネス要件を満たすためのデータの調達は、特にそれらの要件に大衆市場のニーズを満たすことが含まれる場合、ロジスティクスとオーバーヘッドの面で大きな課題をもたらす可能性があります。

開発者、ソフトウェア エンジニア、品質保証スペシャリストで構成される社内チームは、通常、同じ年齢、性別、経歴の人で構成されます。バイアスは、データの収集とデータのラベル付けの際によく発生します。したがって、AI アルゴリズムを構築するときは、アルゴリズムのトレーニングに使用するデータの提供を 1 人の人物またはグループに依存しないことが最善です。アルゴリズムを適切にトレーニングするには、さまざまな種類のデータと入力が必要です。

AI アルゴリズムに、最終的にサービスを提供する顧客に近い人々や体験を提供するモデルを使用する方が効率的です。企業はこのモデルを使用して、実際の状況に対応し、偏見が発生する場所を検出し、その潜在的な影響を軽減するためのアルゴリズムをトレーニングできます。

コミュニティ構築アルゴリズム

トレーニング データの取得と実装が成功するかどうかは、データ自体の量、品質、多様性によって決まります。企業がこのデータを取得して処理する唯一の方法は、多様な参加者を活用することです。企業は、性別、民族、母国語、場所、スキル、地理、その他の適用可能なフィルターなど、特定の人口統計情報を提供するコミュニティから選択できる必要があります。

実際、効果的なアルゴリズムを開発するには大量のデータが必要です。ほとんどの企業には、大規模なデータを取得する能力がありません。新しいソフトウェアやサービスを提供するには、専用のリソースからのサポートが必要です。メディアおよび放送サービス向けのインテリジェント音声アシスタントをトレーニングする最近のプロジェクトでは、100,000 を超えるさまざまな音声が必要でした。これらの発話は最終的に、アルゴリズムをトレーニングするために遠隔で集められた 972 人の人間によって提供されました。驚くべき偉業は、音声は研究室である程度までシミュレートできるものの、AI がさまざまな実際の声やアクセントにさらされる必要があることです。

スピーチトレーニングはカリキュラムのほんの一面にすぎません。クラウドソーシング ソリューションは、企業が手書き文書を読み取るための AI アルゴリズムをトレーニングするのにも役立ちます。最近の別のプロジェクトでは、何千もの手書きサンプルが必要でした。もう一度言いますが、アルゴリズムには可能な限り幅広い固有のサンプルが必要なので、量が重要な要素となります。 1,000 人を超える参加者がリモートで集まり、手書きの文書を配布し、さまざまなコンテンツに対する需要に応えました。

公正な結果

AI の最終結果の精度を低下させる可能性のある意図しないバイアスを除去することが重要です。完璧になることは決してありませんが、AI は継続的に学習し、最良のマシン モデルは大規模で多様なデータ セットに基づくものになります。最善の戦略は、量、品質、多様性を提供するプールからトレーニング データを取得することです。トレーニング データに多様性がない場合、アルゴリズムは幅広い可能性を認識できず、アルゴリズムは効果がありません。リモート コミュニティにより、企業はこのデータにアクセスし、社内の開発およびテスト機能を補完できます。クラウドソーシングによるテストは、音声、テキスト、画像、生体認証を学習および認識する AI アルゴリズムのトレーニングに使用でき、さまざまな顧客セグメントのニーズを満たす強力な出力を企業に提供します。

<<:  インテリジェントビル通信システムの構成と要件

>>:  AIと機械学習が克服すべき3つのハードル

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

シリコンバレーの大企業も「名門校の学位」を重視するのでしょうか? Redditの男の魂を問う質問が白熱した議論を巻き起こす

シリコンバレーの大企業からのオファーは多くのプログラマーにとって依然として非常に魅力的であり、今年は...

多くの人がまだブロックチェーンについて漠然とした理解しか持っていない中、これらのブロックチェーンの応用シナリオはすでに実装されている。

1.ブロックチェーン + IP著作権最近、フェニックスオンライン書店は「フェニックスエッグ」と呼ば...

この記事は人工知能を始める上で強力な助けとなるでしょう

[[269504]]人工知能はまるでまだ遠い未来の話であるかのように語られていますが、実際にはすでに...

GPT-4V でさえ解明できない未来推論の解決策があります!華中科技大学と上海理工大学出身

マルチモーダル大規模言語モデルは、強力な画像理解および推論機能を発揮します。しかし、現在の観察に基づ...

人工知能が教育に力を与え、「ゼロポイント革命」が到来

[[266892]]中国共産党第19回全国代表大会の最新報告は、教育の近代化と教育の情報化の流れに対...

時系列を大規模モデルと組み合わせることはできますか?アマゾンの最新研究:大規模モデルで時系列予測を説明できる

最近、Amazon は時系列予測にビッグモデルを使用する方法に関する論文を発表しました。これは時系列...

...

人工知能はブロックチェーン業界にどのような影響を与えるのでしょうか?

人工知能は人間が認識するのが難しい決定を下すでしょう。意思決定を行うには、アルゴリズムが大量のデータ...

...

オタクなおじさんが独学でAIを学んでマスターレベルを作成し、Twitterで人気になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能はどのような革新と影響をもたらすのでしょうか?

現在、我が国の政策の推進と各方面の支援により、人工知能の発展は急速に進んでいます。人々が最も関心を持...

人工知能は目覚めたのか?アマゾンのAIは人間の命令を聞かず不気味な笑い声を上げる

人類が人工知能の開発に熱心に取り組み始めて以来、著名な科学者ホーキング博士をはじめ、疑問や反対の声が...

...

世界で最も難しい「砂の彫刻」ゲームがAIによって解読された

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...