2020年、アルゴリズムの話題が主流になる年

[[397576]]

システムに閉じ込められた配達員から人々が飽きることのないソーシャルメディアまで、2020年には、アルゴリズムに関する議論がようやく主流の議論に入りました。

これはほんの始まりに過ぎません。データが生活のあらゆる場所に根付くにつれ、10 秒の短いビデオの選択から刑事事件の裁判まで、アルゴリズムの適用範囲はますます広がっています。しかし、アルゴリズムは具体的にどのように形成されるのか、それは私たちの行動にどのような影響を与えるのか、そしてそれに応じて社会生活にどのような変化をもたらすのか...これらのブラックボックスのような問題に直面して、多くの人々はまだそれを理解しておらず、疑問さえ持っていないかもしれません。

一般的に言えば、アルゴリズムの形成には、トレーニングデータの収集と、アルゴリズムの設計、トレーニング、および適用という 2 つの部分が主に含まれます。本論文では、これら2つの部分に関する2020年の主な出来事をまとめ、関連分野の専門家と実務家3名にインタビューし、アルゴリズムが私たちの生活に与える影響について彼らがどのように認識しているかを聞きました。

アルゴリズムはデータなしでは機能しないが、データがあるところには漏洩がある

アルゴリズムの形成はトレーニングデータと切り離せません。前の図に示すように、アルゴリズムを実装してモデルを構築する前に、大量のデータを収集する必要があります。

これらのデータは、承認されたアプリによって収集された ID データ、アプリの使用によって生成された行動データ、さらには宅配便やホテル滞在中に記録されたデータなど、私たちの生活のあらゆる側面から得られます。

「我々は透明なプライバシーの時代に入った」と上海交通大学データ法研究センターの執行ディレクター、何元氏はザ・ペーパーとのインタビューで語った。「インターネットはあなた自身よりもあなたのことをよく知っています…これらの企業は、私たちが望むと望まざるとにかかわらず、すでに私たちのデータを持っています。」

これは、ユーザーが無力であることを意味するものではありません。たとえば、不明なソースからのアプリの使用を避けたり、個人情報を取得するアプリを簡単に許可しないようにしたりすることができます。

しかし、その前に、明確にする必要がある 2 つの質問があります。

まず、個人情報と個人のプライバシーは同じ概念ではありません。プライバシーとは、誰もが譲ることのできない個人情報です。もしこの情報の取引が許可されれば、私たちはもはや完全な人間ではなくなるでしょう。

一方、個人情報は、本人確認に重点を置いています。これらの情報を組み合わせることで、個人を特定することができます。

第二に、権利と義務は平等です。ユーザーがモバイルアプリケーションを無料で使用する場合、一部の個人情報を提供し、ターゲット広告を受け入れることになります。広告主はモバイルアプリケーションに料金を支払います。これが現在の無料インターネットモデルです。

「法律は個人情報の権利を完全に保護しているわけではない」と何元氏は説明した。

しかし、関連システムが徐々に改善されれば、一般データ保護規則（GDPR）などの法令に基づく集団訴訟や公益訴訟、高額の罰金など、国民が個人情報の安全を守る手段は増えるだろう。ただし「大企業にとって、より恐れているのは賠償ではなく、ブランドの失墜だ」という。

テクノロジーは中立的ですよね？

アルゴリズムは私たちの生活に大きな利便性をもたらす一方で、大きな論争も引き起こしてきました。そのため、人々はこの古典的な問題について再び議論し始めました。「テクノロジーは中立か?」

「私は常に、テクノロジー自体は中立的であると信じています。テクノロジーが作られたとき、それは単に技術的な問題を解決するためでした」と、上級インターネットソフトウェアエンジニアのジャスティン氏はザ・ペーパー紙のインタビューで語った。「将来がどうなるかということについては、テクノロジーが開発中に考慮するものではありません。」

しかし、さまざまな意見があります。

「いわゆる『中立的』なものは、特に人工製品の場合、実際には何らかの機能的方向性があらかじめ決められている」と復旦大学哲学学院の徐英金教授は例を挙げて述べた。「例えば、銃剣は野菜を切るのに絶対に適していない。その機能的方向性は野菜を切ることではないからだ。」

中立的であるかどうかは別として、アルゴリズムに関連する物議を醸す出来事は、特にCOVID-19パンデミックの文脈において、私たちの目にますます多くなってきました。

例えば、イギリス政府は、流行病の影響で大学入試が実施できない問題を解決するために、アルゴリズムを使って学生の成績を評価することを決定しましたが、アルゴリズムによって評価された学生の成績については多くの論争がありました。そのうち、イングランドの受験者の約40％は、少なくとも1段階スコアが下がった。 2020年8月25日、英国の試験規制当局のディレクターであるサリー・コリアー氏が辞任を発表した。

また、2020年3月には、一部のネットユーザーから、健康コードが不可解に赤くなっていると指摘された。あるネットユーザーは知书にこう書き込んだ。「旅程全体は正常で、感染者や感染疑い者との接触はなく、流行地域にも行っていなかった。しかし、健康コードがどういうわけか赤に変わったため、その日は泊まる場所がなく、路上で一夜を過ごした」

これらのアルゴリズムは私たちの日常生活に密接に関係しているが、その背後にある動作ロジックを理解している人はほとんどいない。「これが強力な技術的および知識的障壁を生み出し、このようなシステムを国民が監視するのに役立たない...それはある種の力の不均衡感を生み出している」と徐英金氏は説明した。

しかし、これらの論争の原因をアルゴリズムだけに限定すべきではない。前述したように、アルゴリズムの形成は、人々の過去の行動である大量のトレーニングデータと切り離せません。

2020年2月のVOXの記事には、「コンピューターは大量のデータにさらされると、データ内の繰り返しパターンを検出し、これらのパターンに基づいて独自の判断、評価、予測のロジックを形成する」と書かれている。つまり、アルゴリズムの使用は社会における差別や偏見を増幅させるだろう。

例えば、メルボルン大学が2020年12月に発表した研究では、人工知能採用ソフトウェアにおける性差別は、採用担当者自身の潜在意識による差別に起因している可能性があることが示されました。研究者らは40人の採用担当者に同一の履歴書を配布したが、性別が明記されているものもあれば、性別が削除されているものもあった。結果は、男性と女性の応募者が同じ能力と経験を持っていたにもかかわらず、採用担当者は男性に高いスコアを与えたことを示した。履歴書に性別が記載されていない場合でも、採用担当者は男性を好みます。

VOXの記事は、さまざまなアルゴリズムの背後にあるブラックボックスを説明することが、こうした偏見論争を解消するための第一歩であると主張している。一部の学者は、アルゴリズムのユーザーは少なくともトレーニングデータ、検証データ、テストデータの人口統計学的特性を公開する必要があると考えています。

徐英金氏は、アルゴリズムをトレーニングする際、研究者はデータを単に繰り返すのではなく、常に新しい知識を吸収し、関連する理解と予測を手動で修正する必要があると示唆した。「なぜなら、将来起こることは過去に起こったことと似ているだろうと私たちに言う哲学的な理由はないからです。」

そして「人」の役割は非常に重要です。たとえば、ジャスティン氏は、推奨アルゴリズムの弱点の 1 つは「機械の目標は通常は非常に明確ですが、私たちが学習したいことは定量化できないことが多い」ことだと考えています。そのため、現在では多くのコンテンツプラットフォームで、機械による推奨以外の戦略が取り入れられています。

いずれにせよ、アルゴリズムを修正するまでの道のりは長いものとなるでしょう。結局のところ、アルゴリズム開発の最大の原動力は企業の利益であることが多く、人間の弱点は一夜にして変えることはできません。

しかし、アルゴリズムの問題がようやく主流の議題に入ったという事実は、私たちの社会にとって大きな一歩です。

<<: 3つのステップで声紋システムを構築する方法

>>: 企業はどのように人工知能を導入し、そこから価値を得ることができるのでしょうか?

ブログ

2020年、アルゴリズムの話題が主流になる年

アルゴリズムはデータなしでは機能しないが、データがあるところには漏洩がある

テクノロジーは中立的ですよね？

NIOはまたしても窮地に陥った！運転支援の責任は誰が負うべきでしょうか?

AI が電子商取引におけるウェブサイトアクセシビリティ訴訟のリスクを最小限に抑える方法

シュナイダーエレクトリックの革新力は、デジタル化と低炭素化の二重の変革を加速させる上でどのような役割を果たすのでしょうか。

Meituan はどのようにしてディープラーニングに基づくインテリジェントな画像レビューを実現するのでしょうか?

Midjourney はテキストを生成できます。 V6バージョンの5つの主要なアップグレードがネットユーザーを驚かせる

推薦する

3分レビュー！ 2021年12月の自動運転業界の開発動向を簡単に概観

GTA5をプレイしていますか?インテルの新しいモデルは3Dレンダリングをリアルな画像に変換します

60年ぶり！ AI が新しい抗生物質の最初のバッチを発見し、MIT の主要な研究が Nature に掲載されました。人類はスーパーバグとの戦いに希望を持っている

APICloud CEO 劉欣: モバイルアプリケーションは人工知能の実装にとって最も直接的な媒体である

企業は機械学習の運用を活用してビジネス上の利益を得ています

ツールの選択からチームのコミュニケーションまで、ML エンジニアが実稼働レベルの機械学習を段階的に構築する様子をご覧ください。

アルゴリズムによる管理下にある労働者：労働の退化と集団不安

従来の連合学習が異種混在の課題に直面したときは、これらのパーソナライズされた連合学習アルゴリズムを試してみてください。

AIを活用して食材を分析し、より適切な栄養バランスを実現しましょう！

デジタル変革とAIイノベーションが銀行業界を新たな時代へ導く

100万個のニューロンをリアルタイムでスキャンできるようになりました。脳細胞活動の画像化における新たなブレークスルーです。

「疑似人工知能」が飛び交う。スマートホームで実現できるのか？

中国の自動運転分類の国家基準が正式に発表され、来年3月に施行される予定