データセキュリティの向上と人工知能の信頼性の向上

データセキュリティの向上と人工知能の信頼性の向上

JD Discovery Research InstituteのTao Dacheng所長はかつて、道路標識に小さな広告を掲載するという実験を行った。その結果、無人運転システムは誤った判断を下した。「説明可能性の欠如により、人工知能のより広範な応用とエンパワーメントも制限される」

[[411888]]

これは「両面」人工知能の一側面です。一方では、機械学習などの人工知能技術の使用により、データの識別と保護、データセキュリティの追跡などの機能を実現できるため、データセキュリティを保護する能力が向上します。しかし、他方では、人工知能は、過剰なデータ収集、さらにはアルゴリズムによる差別や「データ汚染」など、新たなセキュリティ問題ももたらします。

新技術のセキュリティ問題が再び話題になっています。人工知能の信頼性を高めるにはどうすればよいのでしょうか。最近上海で開催された世界人工知能会議では、多くの専門家や学者がこの問題に注目し、データとネットワークのセキュリティにおける人工知能の重要な側面は無視できないと指摘しました。

新たなセキュリティ問題は無視できない

わが国は人工知能分野で世界をリードする国の一つとなったものの、人工知能の発展と安全性においては依然として厳しい課題に直面しています。

中国人民政治協商会議全国委員会社会法務委員会副委員長の陳志民氏は、デジタル情報の過度な収集や違法な使用は国民の権利やプライバシーを侵害する恐れがあり、アルゴリズムによる選好は社会的偏見や差別を悪化させ、公平性と正義を脅かす恐れがあると指摘した。

情報が違法に盗まれたり販売されたりすると、より重大な犯罪につながる可能性があります。彼は一連のデータを引用した。「我が国では現在、通信詐欺事件の発生率が高く、場所によっては全刑事事件の半分以上を占め、従来の窃盗事件を上回っています。」

「機械学習によるディープラーニングでは人間の道徳観を理解するのは難しい。例えば、自動運転車による緊急回避などのインテリジェントな判断は、特定の人々の命を脅かす可能性がある」と同氏は述べた。

計算能力、アルゴリズム、データは人工知能の 3 つの要素です。人工知能は新たなデータ セキュリティの問題も引き起こしています。国家産業情報セキュリティ開発研究センターの副所長である何小龍氏は、人工知能のアルゴリズムはデータに大きく依存しており、「データ汚染」などの新たなデータセキュリティの課題をもたらす可能性があると指摘した。

いわゆるデータ ポイズニングとは、トレーニング データに偽装されたデータや悪意のあるサンプルを追加することで、データの整合性が損なわれ、アルゴリズム モデルの結果にエラーが発生することを指します。 「例えば、マイクロソフトのチャットボットTayは、差別的かつ不快な発言をしたためにシャットダウンされました。主な理由は、会話データセットに不適切なデータが悪意を持って追加されたことです」とHe Xiaolong氏は述べた。

2 つ目はサンプルの偏りの問題です。基本データセットの多様性と代表性が欠如しているため、人工知能アルゴリズムは特定の社会的価値観の傾向や偏見を隠し、不公平な結果を出力します。

オープンソースフレームワークがますます増え、新たなリスクも生じている。「例えば、主流のオープンソースアーキテクチャのセキュリティテストを実施していたプロジェクトでは、短期間で24件のセキュリティ問題が発見されました。そのうち2件は深刻で危険な脆弱性、8件は高リスクの脆弱性でした」とHe Xiaolong氏は述べた。

「実際、人工知能の応用には、自身の計算能力やアルゴリズムがもたらす脆弱性、応用における人工知能の堅牢性(異常で危険な状況でもシステムが生き残る能力)、説明可能性、公平性など、多くのリスクが伴います。これらの新技術が元の業務と組み合わされると、元の業務やシステムに巨大なシステミックリスクをもたらす可能性があります」と上海市サイバースペース管理局のチーフエンジニア、ヤン・ハイジュン氏は述べた。

人工知能の責任をどう定義するか

「人間が思考や制御、さらには意思決定までもアルゴリズムにアウトソーシングする場合、人工知能がまずすべきことは、それが信頼できるものであることを証明することだ」。中国情報通信研究院クラウドコンピューティング・ビッグデータ研究所所長の何宝紅氏は、信頼できる人工知能は世界的なコンセンサスとなっていると語った。

では、どのような人工知能が信頼できるのでしょうか。これについては、組織によって理解が異なります。IEEE(米国電気電子技術者協会)によると、「透明性」は、テクノロジーを正しく使用し、人間を中心に据え、責任を明確にし、人類に利益をもたらすための鍵です。一方、欧州連合は、堅牢性、セキュリティ、人間による監視と介入、明確な責任などを提案しています。 2017年末、何継鋒院士は香山科学会議で中国で初めて「信頼できる人工知能」の概念を提唱した。

現在、世界各国で信頼できる人工知能に大きな注目が集まっています。タオ・ダチェン氏は、信頼性は4つの主要なパフォーマンスを組み合わせ、4つの側面から測定されると紹介した。1つ目は安定性、つまり人工知能システムが悪意のある攻撃や環境ノイズに抵抗し、正しい決定を下す能力である。2つ目は説明可能性、つまり人工知能システムは意思決定の過程で、人々が理解できる方法でこれらのことを行う方法を説明する必要がある。3つ目はプライバシー保護、つまり人工知能システムは個人のプライバシー情報やグループのプライバシー情報を外部に開示しない。4つ目は公平性、つまりシステムは公平かつ公正であり、マスユーザーであろうとニッチユーザーであろうと、男性であろうと女性であろうと、すべてのユーザーを正しく扱う必要がある。

自動運転事故のような複雑なイベントの場合も、このロジックを使用して継続的に分析できます。システムに問題が発生した場合、その理由、誰が責任を負うのか、どのように責任を負うのかなどを知る必要があります。これらすべてには、信頼できる人工知能を測定するための明確な指標が必要です。

上海交通大学ジョン・ホップクロフト・コンピュータサイエンスセンターの張全石准教授は、自動運転車が人をはねた場合、責任を決定する前にシステムの本当の原因を知る必要があると述べた。おそらく原因の20%は他の2人を避けるためであり、残りの10%は時間検出アルゴリズムモジュールのエラーに関係している可能性がある。内部メカニズムの理由が明確に定義されれば、裁判官は判決を下すことができる。

アントグループの副社長でチーフAIサイエンティストのQi Yuan氏は、人工知能の公平性は多くの側面に反映されていると述べた。例えば、非常に重要な社会問題は包括性、つまりテクノロジーの包括性と平等なサービスに関するものだ。彼は例を挙げた。認証コードはもともとセキュリティ向上を目的としたものだが、それ自体が視覚障害者の利用を妨げているため、アリペイはエアジェスチャーを開発した。人工知能技術を使って古着を分類・リサイクルすることで、どの種類の古着がより多くリサイクルされているかを特定し、ユーザーに植林のエネルギーを与えることができる。アント・グループはまた、2030年までに排出量実質ゼロを達成すると約束した。

信頼できるAI技術の研究強化

世界各国は人工知能のセキュリティ上の課題に対処するために積極的に対策を講じています。我が国では、トップレベルの設計の観点から、データ処理活動を規制し、データのセキュリティを確保するための法的根拠を提供する、新たに公布された「データセキュリティ法」が9月1日に正式に施行されます。

さらに、関係部門は人工知能の重要な分野に対する詳細な管理規則と管理枠組みを提示し、対象を絞ったデータ管理要件も提示した。

今年3月、中国人民銀行は「人工知能アルゴリズムの金融応用評価仕様」を発行し、2021年4月には工業情報化部の「インテリジェントコネクテッドカーメーカーと製品のアクセス管理ガイドライン(試行)」が、各分野における人工知能のセキュリティ保護に関する関連要件を提示した。

現在、信頼できる AI 技術は、詐欺防止、マネーロンダリング防止、ギャンブル防止、企業共同リスク管理、データプライバシー保護など、複数のリスク管理シナリオに実装されています。

何小龍氏は、信頼できる人工知能のための最先端のアルゴリズムの研究を推進し、さまざまなシナリオでの人工知能の応用に関する関連する業界規範と技術標準を策定することを提案した。

データセキュリティに関しては、WeBank、Shenzhen Clustar、Insight Technology など、数多くのプライバシー コンピューティング サービス企業が登場しています。 Niewei Technologyの会長兼CTOであるWang Shuang氏は、「プライバシーコンピューティングなどの技術は、信頼できるAIを強化し、データ価値の信頼できる流れを促進します」と述べています。

信頼できる AI は静的ではありません。タオ・ダチェン氏は、携帯電話の登場と同様に、最初は誰もが非常に便利だと思っていたが、後に携帯電話が私たちの時間をあまりにも多く奪っていることに気づいたと述べた。同様に、信頼できるテクノロジーは時間と場所によって異なります。

<<:  パーソナライズされた推奨事項は、馴染みのあるものに偏っていますか?アルゴリズムは公平性を侵害できない

>>:  私の国はAI医療機器の標準化を加速しています

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

GoogleはGoogleアシスタントを生成AIでアップデートする予定

8月1日、海外メディアは、Axiosの報道によると、GoogleはGoogleアシスタントを生成AI...

...

機械学習がサイバー脅威に対する最善の武器である理由

攻撃対象領域が拡大し続け、攻撃手法がより高度化するにつれ、セキュリティ業界は現在、深刻な「セキュリテ...

...

鄒聖龍が初めて人工知能について公に語り、荀雷の将来の計画が明らかにされた

「ビジネスを運営する観点から見ると、人工知能には2つの陣営があります。1つは人工知能プラットフォーム...

...

ヒット曲予測の成功率は97%?このリストは「偽造品と戦う」ためにあります

トレンドや動向を予測することは、あらゆる業界が熱心に取り組んでいることです。これにより、実務者は業界...

AIは単なる機械学習ですか?機械学習とは何かを3000語でわかりやすく説明します

コンピューター科学者は、人工知能の中核技術である機械学習とディープラーニングにおいて大きな進歩を遂げ...

RLHFの2%ハッシュレートを使用してLLMからの有害な出力を阻止するために、ByteはLLM忘却学習を提案した。

大規模言語モデル (LLM) の開発により、実務者はより多くの課題に直面しています。 LLM からの...

あなたを飛び立たせる5つの迅速なフレームワークモデル

今日のデジタル化が進む世界では、人工知能は私たちの日常生活に欠かせないものとなっています。特に、プロ...

マッキンゼー:2045年までに仕事の50%がAIに取って代わられる

▲ 画像出典:マッキンゼーこのレポートで、マッキンゼーは、AIが人間の仕事に取って代わる時期が早まっ...

ドキュメント内の単語が増えるほど、モデルは興奮します。 KOSMOS-2.5: テキストが密集した画像を読み取るためのマルチモーダル大規模言語モデル

注目すべき傾向は、印象的な言語出力を生成できる、数百億/数千億のパラメータを備えた、より大規模で複雑...

IDC: 欧州の人工知能への支出は2022年に220億ドルに達する

インターナショナル・データ・コーポレーション(IDC)の新しい世界人工知能支出ガイドでは、ヨーロッパ...

...

...