2020年、アルゴリズムの話題が主流になる年

2020年、アルゴリズムの話題が主流になる年

[[397576]]

システムに閉じ込められた配達員から人々が飽きることのないソーシャルメディアまで、2020年には、アルゴリズムに関する議論がようやく主流の議論に入りました。

これはほんの始まりに過ぎません。データが生活のあらゆる場所に根付くにつれ、10 秒の短いビデオの選択から刑事事件の裁判まで、アルゴリズムの適用範囲はますます広がっています。しかし、アルゴリズムは具体的にどのように形成されるのか、それは私たちの行動にどのような影響を与えるのか、そしてそれに応じて社会生活にどのような変化をもたらすのか...これらのブラックボックスのような問題に直面して、多くの人々はまだそれを理解しておらず、疑問さえ持っていないかもしれません

一般的に言えば、アルゴリズムの形成には、トレーニング データの収集と、アルゴリズムの設計、トレーニング、および適用という 2 つの部分が主に含まれます。本論文では、これら2つの部分に関する2020年の主な出来事をまとめ、関連分野の専門家と実務家3名にインタビューし、アルゴリズムが私たちの生活に与える影響について彼らがどのように認識しているかを聞きました。

アルゴリズムはデータなしでは機能しないが、データがあるところには漏洩がある

アルゴリズムの形成はトレーニング データと切り離せません。前の図に示すように、アルゴリズムを実装してモデルを構築する前に、大量のデータを収集する必要があります。

これらのデータは、承認されたアプリによって収集された ID データ、アプリの使用によって生成された行動データ、さらには宅配便やホテル滞在中に記録されたデータなど、私たちの生活のあらゆる側面から得られます。

我々は透明なプライバシーの時代に入った」と上海交通大学データ法研究センターの執行ディレクター、何元氏はザ・ペーパーとのインタビューで語った。 「インターネットはあなた自身よりもあなたのことをよく知っています…これらの企業は、私たちが望むと望まざるとにかかわらず、すでに私たちのデータを持っています。」


これは、ユーザーが無力であることを意味するものではありません。たとえば、不明なソースからのアプリの使用を避けたり、個人情報を取得するアプリを簡単に許可しないようにしたりすることができます。

しかし、その前に、明確にする必要がある 2 つの質問があります。

まず、個人情報と個人のプライバシーは同じ概念ではありません。プライバシーとは、誰もが譲ることのできない個人情報です。もしこの情報の取引が許可されれば、私たちはもはや完全な人間ではなくなるでしょう。

一方、個人情報は、本人確認に重点を置いています。これらの情報を組み合わせることで、個人を特定することができます。

第二に、権利と義務は平等です。ユーザーがモバイル アプリケーションを無料で使用する場合、一部の個人情報を提供し、ターゲット広告を受け入れることになります。広告主はモバイル アプリケーションに料金を支払います。これが現在の無料インターネット モデルです。

「法律は個人情報の権利を完全に保護しているわけではない」と何元氏は説明した。

しかし、関連システムが徐々に改善されれば、一般データ保護規則(GDPR)などの法令に基づく集団訴訟や公益訴訟、高額の罰金など、国民が個人情報の安全を守る手段は増えるだろう。ただし「大企業にとって、より恐れているのは賠償ではなく、ブランドの失墜だ」という。

テクノロジーは中立的ですよね?

アルゴリズムは私たちの生活に大きな利便性をもたらす一方で、大きな論争も引き起こしてきました。そのため、人々はこの古典的な問題について再び議論し始めました。「テクノロジーは中立か?」

「私は常に、テクノロジー自体は中立的であると信じています。テクノロジーが作られたとき、それは単に技術的な問題を解決するためでした」と、上級インターネットソフトウェアエンジニアのジャスティン氏はザ・ペーパー紙のインタビューで語った。「将来がどうなるかということについては、テクノロジーが開発中に考慮するものではありません。」

しかし、さまざまな意見があります。

いわゆる『中立的』なものは、特に人工製品の場合、実際には何らかの機能的方向性があらかじめ決められている」と復旦大学哲学学院の徐英金教授は例を挙げて述べた。「例えば、銃剣は野菜を切るのに絶対に適していない。その機能的方向性は野菜を切ることではないからだ。」

中立的であるかどうかは別として、アルゴリズムに関連する物議を醸す出来事は、特にCOVID-19パンデミックの文脈において、私たちの目にますます多くなってきました。

例えば、イギリス政府は、流行病の影響で大学入試が実施できない問題を解決するために、アルゴリズムを使って学生の成績を評価することを決定しましたが、アルゴリズムによって評価された学生の成績については多くの論争がありました。そのうち、イングランドの受験者の約40%は、少なくとも1段階スコアが下がった。 2020年8月25日、英国の試験規制当局のディレクターであるサリー・コリアー氏が辞任を発表した。

また、2020年3月には、一部のネットユーザーから、健康コードが不可解に赤くなっていると指摘された。あるネットユーザーは知书にこう書き込んだ。「旅程全体は正常で、感染者や感染疑い者との接触はなく、流行地域にも行っていなかった。しかし、健康コードがどういうわけか赤に変わったため、その日は泊まる場所がなく、路上で一夜を過ごした」

これらのアルゴリズムは私たちの日常生活に密接に関係しているが、その背後にある動作ロジックを理解している人はほとんどいない。「これが強力な技術的および知識的障壁を生み出し、このようなシステムを国民が監視するのに役立たない...それはある種の力の不均衡感を生み出している」と徐英金氏は説明した。


しかし、これらの論争の原因をアルゴリズムだけに限定すべきではない。前述したように、アルゴリズムの形成は、人々の過去の行動である大量のトレーニングデータと切り離せません。

2020年2月のVOXの記事には、「コンピューターは大量のデータにさらされると、データ内の繰り返しパターンを検出し、これらのパターンに基づいて独自の判断、評価、予測のロジックを形成する」と書かれている。つまり、アルゴリズムの使用は社会における差別や偏見を増幅させるだろう。

例えば、メルボルン大学が2020年12月に発表した研究では、人工知能採用ソフトウェアにおける性差別は、採用担当者自身の潜在意識による差別に起因している可能性があることが示されました。研究者らは40人の採用担当者に同一の履歴書を配布したが、性別が明記されているものもあれば、性別が削除されているものもあった。結果は、男性と女性の応募者が同じ能力と経験を持っていたにもかかわらず、採用担当者は男性に高いスコアを与えたことを示した。履歴書に性別が記載されていない場合でも、採用担当者は男性を好みます。

VOXの記事は、さまざまなアルゴリズムの背後にあるブラックボックスを説明することが、こうした偏見論争を解消するための第一歩であると主張している。一部の学者は、アルゴリズムのユーザーは少なくともトレーニング データ、検証データ、テスト データの人口統計学的特性を公開する必要があると考えています。

徐英金氏は、アルゴリズムをトレーニングする際、研究者はデータを単に繰り返すのではなく、常に新しい知識を吸収し、関連する理解と予測を手動で修正する必要があると示唆した。 「なぜなら、将来起こることは過去に起こったことと似ているだろうと私たちに言う哲学的な理由はないからです。」

そして「人」の役割は非常に重要です。たとえば、ジャスティン氏は、推奨アルゴリズムの弱点の 1 つは「機械の目標は通常は非常に明確ですが、私たちが学習したいことは定量化できないことが多い」ことだと考えています。そのため、現在では多くのコンテンツ プラットフォームで、機械による推奨以外の戦略が取り入れられています。

いずれにせよ、アルゴリズムを修正するまでの道のりは長いものとなるでしょう。結局のところ、アルゴリズム開発の最大の原動力は企業の利益であることが多く、人間の弱点は一夜にして変えることはできません。

しかし、アルゴリズムの問​​題がようやく主流の議題に入ったという事実は、私たちの社会にとって大きな一歩です。

<<:  3つのステップで声紋システムを構築する方法

>>:  企業はどのように人工知能を導入し、そこから価値を得ることができるのでしょうか?

推薦する

南洋理工大学の最新の視覚言語モデルの概要:事前トレーニング、転移学習、知識蒸留

コンピュータ ビジョン (CV) 研究における長年の課題として、視覚認識 (画像分類、オブジェクト検...

アリババDAMOアカデミーがAIの人間の言語理解の向上を支援する論文でSemEval最優秀賞を受賞

世界最大のセマンティック評価コンテスト「SemEval-2022」は7月19日、今年唯一の「最優秀シ...

超音波チップが脳コンピューターインターフェースに革命をもたらす:非侵襲的インプラントに一歩近づく

2023年、脳コンピューターインターフェース(BCI)技術は依然として急速な発展の年を迎えました。脳...

Baidu Shen Dou: AIネイティブアプリケーションを作成するには2つのステップが重要

2024年1月10日、Honor MagicOS 8.0発表会と開発者会議において、Honor Te...

Diffie-Hellman 鍵交換は、一般的な暗号化アルゴリズムです。

公開されたばかりの Logjam 脆弱性 (FREAK 脆弱性のバリエーション) に関する情報はブラ...

...

人工知能のコスト問題をどう解決するか?顔認識によって情報セキュリティはどのように確保されるのでしょうか?

[[422539]] 9月7日午後、第19回「海南省科学技術会議」に新たに追加されたホットトピック...

...

海雲傑迅は人工知能教育分野で総合的なサービスを提供するAI Goを立ち上げようとしている

[51CTO.com オリジナル記事] 今、業界で人気のテクノロジーは何ですか?それは間違いなく人工...

...

データ サイエンティスト向けの自動化された機械学習ライブラリ 20 選

[[358537]] 「機械学習の究極の目標の 1 つは、特徴エンジニアリング プロセスをますます自...

Microsoft OfficeがCopilot: Princessに接続されている場合は、

AIの助けがあれば、将来のオフィスではそれほど多くのコーヒーは必要なくなるかもしれません。サイエン...

GPT-4 はもう怠け者ではありません! OpenAI、5つの大型モデルを最大80%割引で販売

OpenAI深夜アップデート! 5 つの大きなモデルが一気に投げられました。新しい GPT-4 Tu...

マイクロソフト、クラウド移行のための企業向けビジネス管理ツールを提供するAIMプログラムを開始

Microsoft は最近、顧客がローカル ERP および CRM アプリケーションをクラウドに移行...