著者:サンジャナ・タクル 徐潔成編纂 人工知能技術は世界中で前例のないスピードで発展しています。短期間で大量の AI アプリケーションが構築されました。開発者が進歩に追いつくのに忙しい一方で、テスターも時代のペースに追いつく必要があります。 幸いなことに、人工知能の急速な進歩により、テスト、自動化、品質保証 (QA) への新しいアプローチが登場し、AI アプリケーション テストに新たな扉が開かれています。テスターは現在および将来、AI および ML アプリケーションをどのようにテストすべきでしょうか?知っておくべき主なものをいくつか紹介します。 1. データ品質テストデータ テスト フェーズでは、ベンチマークを使用してデータの状態を評価する必要があります。各企業の目標は異なるかもしれませんが、通常、高品質のデータが AI アプリケーションの中核要件となります。
データ品質のテストとは、企業情報を既知の事実と比較することで、誤ってラベル付けされたデータ、古いデータ、または無関係なデータを識別することを意味します。このレベルのテストでは、データセットのデータ プロファイルを作成するだけという簡単な作業で済みます。このプロセスは合成データ生成と呼ばれます。このデータセットの定義検証を使用することで、企業はデータが有効かどうかを分類し、その品質を測定できます。 2. バイアステスト人気が高まっているもう一つの重要なテストはバイアス テストです。 AI システムの偏りは、収集されるデータに大きく依存します。 たとえば、2016年のレポートでは、Amazon が男性の IT 応募者を優遇していることが判明しました。この電子商取引大手は、仕事に最適な候補者を見つけるためにAIボットを訓練する際、主に男性である既存の従業員の履歴書をデータベースとして使用した。この情報に基づいて、AI は男性候補者だけが最高の IT 従業員になれるだろうと推測しましたが、実際はそうではありませんでした。 同じ間違いを繰り返さないようにするには、アルゴリズムをオンラインに公開する前に、偏りがないかテストする必要があります。 2016 年当時、バイアス テストは、一連の入力に対する適切な応答を確立するために要件を分析するだけの単純な作業でした。さて、それはそれほど明確ではありません。もっと多様性と選択肢が必要です。データセットを使用して 1 つのシナリオを生成するのではなく、考えられるすべてのバリエーションを考慮して複数のテスト ケースを作成します。結果は常に完璧であるとは限りませんが、偏見を排除し、より包括的な AI アプリケーションを開発するための、より優れた、より公平で、より包括的なアプローチを提供します。 3. AIモデルの評価とテストAI モデルの評価とテストは、分析と評価の結果を予測するのに役立ち、次の 3 つのステップで構成されます。AI テストの最初のフェーズでは、収集されたデータがトレーニング セット、検証セット、テスト セットに分割されます。トレーニング セットにはデータセットの最大 75% が含まれ、モデルの重みとバイアスが割り当てられます。検証セットは、トレーニング中のデータの 15% ~ 20% で構成され、初期精度を評価し、モデルがどのように適応、学習し、ハイパーパラメータを微調整するかを確認します。 この段階では、モデルは検証データのみを考慮しますが、モデルの重みとバイアスを学習するためにはまだ使用されていません。テスト セットはデータセット全体の 10% ~ 15% を占めます。これは、偏りのない制御されたセットとして最終評価に使用されました。 テストプロセスの第 2 段階は、ハイパーパラメータを調整することです。このフェーズでは、開発者はトレーニング アルゴリズムの動作を制御し、最初のフェーズの結果に基づいてパラメータを調整できます。 AI とディープラーニングのコンテキストでは、考えられるハイパーパラメータには、学習率、カーネル幅、隠れユニットの数、正規化手法などが含まれます。 最後に、バッチ正規化の実行には、トレーニングの準備中にデータを同じ比率で変換するための正規化と標準化という 2 つの手法が含まれます。 AI モデルが適切にトレーニングされ、微調整され、標準化されたら、混同行列、AUC ROC、F1 スコア、その他の精度/正確さのメトリックを通じてそのパフォーマンスを測定する必要があります。この厳格なプロセスを実行することは、アルゴリズムがどれだけ効果的かつ正確に実行されているかを理解するために重要です。 4. セキュリティテストAI アプリケーションのセキュリティをテストするには、従来のセキュリティ テスト方法と AI システム固有の考慮事項を組み合わせる必要があります。まず、次の点を考慮してください。
5. パフォーマンスとスケーラビリティのテストAI アプリケーションのパフォーマンス テストを実行するには、アプリケーションのアーキテクチャ、コンポーネント、データ フローを包括的に理解することが不可欠です。容量テスト、耐久性テスト、ストレス テストは、AI アプリケーションのパフォーマンスとスケーラビリティを評価するために実行する必要がある最も重要な種類のパフォーマンス テストです。 大量のテスト データはより多くのコンピューティング リソースを消費するため、大規模なテスト データセットと小規模なテスト データセットの両方を含むさまざまなテスト データを使用することでこれを実現できます。さらに、ハードウェア リソースの並列監視は、AI アプリケーションの予想されるユーザー要求をサポートするための適切な構成の設定に役立ちます。 6. チャットボットのテストAI アプリケーションの中でチャットボットの人気が高まるにつれ、これらのボットがユーザーに提供する情報が正確であることを確認することが重要になります。ビジネスでチャットボット機能を使用する場合は、チャットボットの機能コンポーネントと非機能コンポーネントの両方をテストする必要があります。
7. ロボットテストロボットのテストでは、現実世界のシナリオをシミュレートし、そのシナリオにおけるシステムまたはアルゴリズムの動作を評価する必要があります。シミュレーションベースの動作テストには、アルゴリズムのデバッグ、オブジェクトの検出、応答テスト、定義された目標の検証が含まれます。 徹底したテストを確実に行うには、低忠実度の 2D シミュレーションと高忠実度の 3D シミュレーションの両方を採用する必要があります。前者はモジュールレベルの動作テストに使用され、後者はシステムレベルの動作テストに使用されます。これにより、シミュレーションのさまざまなレベルの複雑さと精度を調べることができます。このプロセスでは、ハードウェアの可用性シナリオとハードウェアの非可用性シナリオもテストします。これらのシナリオは、さまざまなハードウェア条件下でのシステムまたはアルゴリズムの動作とパフォーマンスを評価し、さまざまな環境での堅牢性と適応性を保証します。 8. テストを優先するAI/ML アプリケーションのテストは従来のソフトウェア テストとは大きく異なり、いくつかの技術的な課題があります。しかし、AI/ML アプリケーションがますます多く登場するにつれて、AI/ML アプリケーションのテスト方法と実践も急速に発展し、徐々に改善されています。 上記は、これまでの AI/ML アプリケーションに対する効果的かつ合理的なテスト方法とアイデアの一部です。企業が AI ソリューションを使用または提供している場合は、正確性、セキュリティ、包括性を確保するために包括的なテスト アプローチを優先する必要があります。 オリジナルリンク: https://dzone.com/articles/10-top-trends-in-ai-based-application-testing-you |
<<: 人工知能は衛星地図の鮮明度を向上させ、世界の再生可能エネルギープロジェクトや森林被覆率を示す
>>: ガートナー、2023年の中国のデータ分析と人工知能技術の成熟度曲線を発表
人工知能は国際競争の新たな焦点となりつつあり、同時に人類社会に新たな発展の機会をもたらしています。機...
連日続いている「室温超伝導」事件に、新たな続報が続いている。サンプルの半懸濁に成功した華科チームは本...
クラウド セキュリティのスタートアップ企業 Wiz の研究者は、SAS トークンの設定ミスが原因で、...
[[282875]] 数十年前、日本は避けることの難しい一連の長期的経済課題に直面していました。 1...
春節の直前に、同義千文モデル(Qwen)バージョン1.5がリリースされました。今朝、新バージョンのニ...
[51CTO.com クイック翻訳] 今日のインターネット時代において、ネットワーク セキュリティは...
導入大規模言語モデルは革命的な技術であることが証明されています。大規模言語モデルの力をベースにした多...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
今日の情報化時代において、個人の身元を正確に識別し、情報セキュリティを保護する方法は、あらゆる分野の...
ファイザーの最高デジタル・技術責任者リディア・フォンセカ氏は、機械学習技術は医薬品の発見、臨床試験、...
序文負荷分散とは何ですか?複数のサーバーを対称的に構成したサーバーセットを指します。各サーバーは同等...