ビジネスや社会で AI の利用が広まるにつれ、企業は機械モデルに現れる人間の偏見に注意を払う必要があります。企業は人間の知性を活用して、アルゴリズムのトレーニングに必要なさまざまなデータと入力を取得できます。
データセット内の偏りを回避する方法があります。 人工知能 (AI) アルゴリズムをトレーニングする場合、データの入力に依存します。これは特にビジネス環境に当てはまります。ビジネス環境では、AI の目的が顧客とのやり取り、自動化システムの管理、人間の意思決定の模倣である可能性があります。結果が目的と一致することは非常に重要です。しかし、AI が指示やリクエストに応答する方法に歪みをもたらす可能性のある偏りに企業が対処できることが重要です。 新製品の設計と開発の段階は、企業がテストを実行し、欠陥を特定して排除できるため、非常に重要です。何らかの理由で設計上の欠陥が見落とされたり、製品が故障したりした場合でも、すぐに解決できます。故障したデバイスはリコールされ、ソフトウェアの問題を修正するためのアップデートやパッチが発行されます。これは典型的なソフトウェアリリースでは問題ありませんが、人工知能アルゴリズムの取り扱いはそれほど簡単ではありません。 AI アルゴリズムは、機械学習 (ML) に基づいて非常に特殊なタスクを実行するように設計された、非常に複雑なシステムです。 AI が運用を開始した後に生み出される偏見を解消しようとすると、コストと時間がかかる可能性があります。また、「学習」するテクノロジーにとっては直感に反する行為でもあります。設計および開発段階で逸脱を検出して排除するプロセスを導入する方が効果的です。 偏見はビジネスに悪影響を及ぼす 人工知能の基本的な目的と機能は、その基礎となるアルゴリズムに組み込まれています。 AI が固有の偏見を持つようになると、アルゴリズムに悪影響を与えることになります。これは、AI が提供することが期待される精度と効率に重大な影響を及ぼし、AI が商業ニーズを満たす能力を制限する可能性があり、いずれもビジネスにとって悪影響となります。 開発者の善意にもかかわらず、偏見は常に AI アルゴリズムに侵入する方法を見つけます。他の学習プロセスと同様に、生徒は教師の影響を受けます。認定機関が提供する教育の範囲は、その機関が提供するコースによって異なります。当然のことながら、カリキュラムが多様になればなるほど、生徒の考え方はよりオープンになります。同様に、より大規模で多様なデータセットは、より正確で効率的な AI アルゴリズムを生成するのに役立ち、よりスマートな意思決定が可能になります。 トレーニングデータとテスト結果 成功する AI アルゴリズムはすべて、トレーニング データに基づいて構築されます。ただし、ビジネス要件を満たすためのデータの調達は、特にそれらの要件に大衆市場のニーズを満たすことが含まれる場合、ロジスティクスとオーバーヘッドの面で大きな課題をもたらす可能性があります。 開発者、ソフトウェア エンジニア、品質保証スペシャリストで構成される社内チームは、通常、同じ年齢、性別、経歴の人で構成されます。バイアスは、データの収集とデータのラベル付けの際によく発生します。したがって、AI アルゴリズムを構築するときは、アルゴリズムのトレーニングに使用するデータの提供を 1 人の人物またはグループに依存しないことが最善です。アルゴリズムを適切にトレーニングするには、さまざまな種類のデータと入力が必要です。 AI アルゴリズムに、最終的にサービスを提供する顧客に近い人々や体験を提供するモデルを使用する方が効率的です。企業はこのモデルを使用して、実際の状況に対応し、偏見が発生する場所を検出し、その潜在的な影響を軽減するためのアルゴリズムをトレーニングできます。 コミュニティ構築アルゴリズム トレーニング データの取得と実装が成功するかどうかは、データ自体の量、品質、多様性によって決まります。企業がこのデータを取得して処理する唯一の方法は、多様な参加者を活用することです。企業は、性別、民族、母国語、場所、スキル、地理、その他の適用可能なフィルターなど、特定の人口統計情報を提供するコミュニティから選択できる必要があります。 実際、効果的なアルゴリズムを開発するには大量のデータが必要です。ほとんどの企業には、大規模なデータを取得する能力がありません。新しいソフトウェアやサービスを提供するには、専用のリソースからのサポートが必要です。メディアおよび放送サービス向けのインテリジェント音声アシスタントをトレーニングする最近のプロジェクトでは、100,000 を超えるさまざまな音声が必要でした。これらの発話は最終的に、アルゴリズムをトレーニングするために遠隔で集められた 972 人の人間によって提供されました。驚くべき偉業は、音声は研究室である程度までシミュレートできるものの、AI がさまざまな実際の声やアクセントにさらされる必要があることです。 スピーチトレーニングはカリキュラムのほんの一面にすぎません。クラウドソーシング ソリューションは、企業が手書き文書を読み取るための AI アルゴリズムをトレーニングするのにも役立ちます。最近の別のプロジェクトでは、何千もの手書きサンプルが必要でした。もう一度言いますが、アルゴリズムには可能な限り幅広い固有のサンプルが必要なので、量が重要な要素となります。 1,000 人を超える参加者がリモートで集まり、手書きの文書を配布し、さまざまなコンテンツに対する需要に応えました。 公正な結果 AI の最終結果の精度を低下させる可能性のある意図しないバイアスを除去することが重要です。完璧になることは決してありませんが、AI は継続的に学習し、最良のマシン モデルは大規模で多様なデータ セットに基づくものになります。最善の戦略は、量、品質、多様性を提供するプールからトレーニング データを取得することです。トレーニング データに多様性がない場合、アルゴリズムは幅広い可能性を認識できず、アルゴリズムは効果がありません。リモート コミュニティにより、企業はこのデータにアクセスし、社内の開発およびテスト機能を補完できます。クラウドソーシングによるテストは、音声、テキスト、画像、生体認証を学習および認識する AI アルゴリズムのトレーニングに使用でき、さまざまな顧客セグメントのニーズを満たす強力な出力を企業に提供します。 |
OpenAI深夜アップデート! 5 つの大きなモデルが一気に投げられました。新しい GPT-4 Tu...
[[350334]]データ伝送中にエラーが発生することは避けられません。データを受信した後、受信側は...
[[286589]]概要いわゆる LRU (Least Recently Used) アルゴリズムの...
IT Homeは11月16日、韓国銀行が最近、人工知能(AI)が労働市場に与える影響に関する調査報告...
1. 情報フローシナリオの課題と並べ替えモデルの独自の利点多くの学生は再ランキングに馴染みがないかも...
教育部基礎教育司は1月11日、「教育部弁公庁による小中学校向け人工知能教育拠点の推薦に関する通知」(...
こんにちは、皆さん。私は Luga です。今日は、人工知能 (AI) エコシステムに関連するテクノロ...
[[436989]]コンピュータービジョン界は最近非常に活発です。まず、He Kaiming 氏らは...
1. インテリジェントビル通信システムの構成インテリジェントビル通信システムは、主に以下の部分で構成...
AI関連の学位取得者は高給を得るのが難しいとメディアが以前報じていたのとは全く対照的に、多くの応募...
[51CTO.comより] 両会期中の政府活動報告に人工知能が盛り込まれた。万鋼科学技術部長は、中...