2020年、アルゴリズムの話題が主流になる年

2020年、アルゴリズムの話題が主流になる年

[[397576]]

システムに閉じ込められた配達員から人々が飽きることのないソーシャルメディアまで、2020年には、アルゴリズムに関する議論がようやく主流の議論に入りました。

これはほんの始まりに過ぎません。データが生活のあらゆる場所に根付くにつれ、10 秒の短いビデオの選択から刑事事件の裁判まで、アルゴリズムの適用範囲はますます広がっています。しかし、アルゴリズムは具体的にどのように形成されるのか、それは私たちの行動にどのような影響を与えるのか、そしてそれに応じて社会生活にどのような変化をもたらすのか...これらのブラックボックスのような問題に直面して、多くの人々はまだそれを理解しておらず、疑問さえ持っていないかもしれません

一般的に言えば、アルゴリズムの形成には、トレーニング データの収集と、アルゴリズムの設計、トレーニング、および適用という 2 つの部分が主に含まれます。本論文では、これら2つの部分に関する2020年の主な出来事をまとめ、関連分野の専門家と実務家3名にインタビューし、アルゴリズムが私たちの生活に与える影響について彼らがどのように認識しているかを聞きました。

アルゴリズムはデータなしでは機能しないが、データがあるところには漏洩がある

アルゴリズムの形成はトレーニング データと切り離せません。前の図に示すように、アルゴリズムを実装してモデルを構築する前に、大量のデータを収集する必要があります。

これらのデータは、承認されたアプリによって収集された ID データ、アプリの使用によって生成された行動データ、さらには宅配便やホテル滞在中に記録されたデータなど、私たちの生活のあらゆる側面から得られます。

我々は透明なプライバシーの時代に入った」と上海交通大学データ法研究センターの執行ディレクター、何元氏はザ・ペーパーとのインタビューで語った。 「インターネットはあなた自身よりもあなたのことをよく知っています…これらの企業は、私たちが望むと望まざるとにかかわらず、すでに私たちのデータを持っています。」


これは、ユーザーが無力であることを意味するものではありません。たとえば、不明なソースからのアプリの使用を避けたり、個人情報を取得するアプリを簡単に許可しないようにしたりすることができます。

しかし、その前に、明確にする必要がある 2 つの質問があります。

まず、個人情報と個人のプライバシーは同じ概念ではありません。プライバシーとは、誰もが譲ることのできない個人情報です。もしこの情報の取引が許可されれば、私たちはもはや完全な人間ではなくなるでしょう。

一方、個人情報は、本人確認に重点を置いています。これらの情報を組み合わせることで、個人を特定することができます。

第二に、権利と義務は平等です。ユーザーがモバイル アプリケーションを無料で使用する場合、一部の個人情報を提供し、ターゲット広告を受け入れることになります。広告主はモバイル アプリケーションに料金を支払います。これが現在の無料インターネット モデルです。

「法律は個人情報の権利を完全に保護しているわけではない」と何元氏は説明した。

しかし、関連システムが徐々に改善されれば、一般データ保護規則(GDPR)などの法令に基づく集団訴訟や公益訴訟、高額の罰金など、国民が個人情報の安全を守る手段は増えるだろう。ただし「大企業にとって、より恐れているのは賠償ではなく、ブランドの失墜だ」という。

テクノロジーは中立的ですよね?

アルゴリズムは私たちの生活に大きな利便性をもたらす一方で、大きな論争も引き起こしてきました。そのため、人々はこの古典的な問題について再び議論し始めました。「テクノロジーは中立か?」

「私は常に、テクノロジー自体は中立的であると信じています。テクノロジーが作られたとき、それは単に技術的な問題を解決するためでした」と、上級インターネットソフトウェアエンジニアのジャスティン氏はザ・ペーパー紙のインタビューで語った。「将来がどうなるかということについては、テクノロジーが開発中に考慮するものではありません。」

しかし、さまざまな意見があります。

いわゆる『中立的』なものは、特に人工製品の場合、実際には何らかの機能的方向性があらかじめ決められている」と復旦大学哲学学院の徐英金教授は例を挙げて述べた。「例えば、銃剣は野菜を切るのに絶対に適していない。その機能的方向性は野菜を切ることではないからだ。」

中立的であるかどうかは別として、アルゴリズムに関連する物議を醸す出来事は、特にCOVID-19パンデミックの文脈において、私たちの目にますます多くなってきました。

例えば、イギリス政府は、流行病の影響で大学入試が実施できない問題を解決するために、アルゴリズムを使って学生の成績を評価することを決定しましたが、アルゴリズムによって評価された学生の成績については多くの論争がありました。そのうち、イングランドの受験者の約40%は、少なくとも1段階スコアが下がった。 2020年8月25日、英国の試験規制当局のディレクターであるサリー・コリアー氏が辞任を発表した。

また、2020年3月には、一部のネットユーザーから、健康コードが不可解に赤くなっていると指摘された。あるネットユーザーは知书にこう書き込んだ。「旅程全体は正常で、感染者や感染疑い者との接触はなく、流行地域にも行っていなかった。しかし、健康コードがどういうわけか赤に変わったため、その日は泊まる場所がなく、路上で一夜を過ごした」

これらのアルゴリズムは私たちの日常生活に密接に関係しているが、その背後にある動作ロジックを理解している人はほとんどいない。「これが強力な技術的および知識的障壁を生み出し、このようなシステムを国民が監視するのに役立たない...それはある種の力の不均衡感を生み出している」と徐英金氏は説明した。


しかし、これらの論争の原因をアルゴリズムだけに限定すべきではない。前述したように、アルゴリズムの形成は、人々の過去の行動である大量のトレーニングデータと切り離せません。

2020年2月のVOXの記事には、「コンピューターは大量のデータにさらされると、データ内の繰り返しパターンを検出し、これらのパターンに基づいて独自の判断、評価、予測のロジックを形成する」と書かれている。つまり、アルゴリズムの使用は社会における差別や偏見を増幅させるだろう。

例えば、メルボルン大学が2020年12月に発表した研究では、人工知能採用ソフトウェアにおける性差別は、採用担当者自身の潜在意識による差別に起因している可能性があることが示されました。研究者らは40人の採用担当者に同一の履歴書を配布したが、性別が明記されているものもあれば、性別が削除されているものもあった。結果は、男性と女性の応募者が同じ能力と経験を持っていたにもかかわらず、採用担当者は男性に高いスコアを与えたことを示した。履歴書に性別が記載されていない場合でも、採用担当者は男性を好みます。

VOXの記事は、さまざまなアルゴリズムの背後にあるブラックボックスを説明することが、こうした偏見論争を解消するための第一歩であると主張している。一部の学者は、アルゴリズムのユーザーは少なくともトレーニング データ、検証データ、テスト データの人口統計学的特性を公開する必要があると考えています。

徐英金氏は、アルゴリズムをトレーニングする際、研究者はデータを単に繰り返すのではなく、常に新しい知識を吸収し、関連する理解と予測を手動で修正する必要があると示唆した。 「なぜなら、将来起こることは過去に起こったことと似ているだろうと私たちに言う哲学的な理由はないからです。」

そして「人」の役割は非常に重要です。たとえば、ジャスティン氏は、推奨アルゴリズムの弱点の 1 つは「機械の目標は通常は非常に明確ですが、私たちが学習したいことは定量化できないことが多い」ことだと考えています。そのため、現在では多くのコンテンツ プラットフォームで、機械による推奨以外の戦略が取り入れられています。

いずれにせよ、アルゴリズムを修正するまでの道のりは長いものとなるでしょう。結局のところ、アルゴリズム開発の最大の原動力は企業の利益であることが多く、人間の弱点は一夜にして変えることはできません。

しかし、アルゴリズムの問​​題がようやく主流の議題に入ったという事実は、私たちの社会にとって大きな一歩です。

<<:  3つのステップで声紋システムを構築する方法

>>:  企業はどのように人工知能を導入し、そこから価値を得ることができるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2019年に主流となった10のAIテクノロジー

1956年にコンピューターの専門家ジョン・マッカーシーが「人工知能」という言葉を作り出して以来、わず...

人工知能の舞台裏:マイクロソフトとOpenAIのスーパーコンピューターはアイオワ州で大量の水を消費している

9月10日、マイクロソフトとOpenAIが共同開発した人工知能システム「ChatGPT」のトレーニ...

AIは古い文化的シンボルを解体し革新することはできない

1950 年代後半から 1960 年代前半にかけて、一群の芸術家と作家がパリの荒廃したホテルに移り住...

複数のAI企業の人事担当者/面接官が明かす:機械学習エンジニアの採用方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

テクノロジーフロンティア | 昆虫はIoT AIの未来となるか?

研究者たちは、特定の昆虫の神経系の機能が、決定論的、確率的、揮発性、不揮発性メモリの機能とどのように...

人工知能と拡張現実はオンラインショッピング行動に影響を与える

[[405357]]画像ソース: https://pixabay.com/images/id-468...

機械学習プログラムで使用される一般的な推奨アルゴリズムの例

推奨アルゴリズムは、機械学習とデータマイニングの分野の重要な部分であり、ユーザーにパーソナライズされ...

アリババDAMOアカデミー、世界初のマルチソース地球観測データ分析AI EARTHをリリース

DAMOアカデミーは宇宙から地球を眺める新たな方法を発見しました!9月18日、2020年雲啓大会にお...

...

...

わずか1行のコードでモデルを数秒でAPIに変換でき、TensorFlowなどのフレームワークをサポートしています。

[[283641]]機械学習モデルを API にパッケージ化することにまだ不安がありますか?このツ...

2018年中国人工知能都市ランキングトップ15

最近、工業情報化部直属の中国情報通信研究院傘下の研究機関であるCCIDコンサルティングが「中国の人工...

避けるべきよくあるコーディングミス

人は誰でも間違いを犯す。しかし、開発者が犯す間違いの多くは回避可能です。この記事で説明した一般的な間...