ビッグデータの時代に、「アルゴリズム崇拝」に陥らないためにはどうすればいいのでしょうか?

ビッグデータの時代に、「アルゴリズム崇拝」に陥らないためにはどうすればいいのでしょうか?

「データ」は今日、これほど広く注目されたことはありません。以前は、携帯電話番号などの情報を何気なく入力していましたが、今ではプライバシーの漏洩を恐れて慎重になっています。携帯電話番号は、私たちの多くのデータにリンクされている可能性があります。しかし現実には、一方ではデータの過剰な使用に大衆が困惑している一方で、他方では「アルゴリズム崇拝」に陥る可能性があり、アルゴリズムはデータに基づく技術原理です。

例えば、朝起きたら、Moji Weatherを開いて今日の天気を確認します。アプリは、何を着るべきか、傘を持っていくべきかどうかを思い出させてくれます。外出するときは、BaiduまたはAmapを開いて、通勤途中に渋滞があるかどうか、今日は交通規制があるかどうかを確認します。など。これらの行動は生活の習慣になっています。

技術的な観点から見ると、上記の動作は実際にはAPPコアのアルゴリズムによって引き起こされ、軽度の「アルゴリズム依存」です。一般の人々にとって、アルゴリズムという概念はありません。せいぜい「APP依存」または「デジタルライフへの依存」です。しかし、生活や仕事の決定を下すためにアルゴリズムに頼りすぎると、「アルゴリズム崇拝」に陥る可能性があります。これは心理学的には「テクノロジー迷信」の非合理的な行動として理解でき、その結果、アルゴリズムに心を支配されて迷うことになります。

01. ビッグデータとアルゴリズム

「アルゴリズム崇拝」に陥らないためには、アルゴリズムの過去と現在を源泉から理解する必要があります。アルゴリズムはデータと密接な関係があります。アルゴリズムは、大量のデータの生成と蓄積から生まれます。データを追跡可能かつ要約可能にし、同時にデータに商業的価値を持たせるために、さまざまなアルゴリズムが生み出されてきました。

たとえば、Moji Weather APP はリアルタイムの天気サービスを提供する初期のモバイル アプリケーションです。その技術原理は、公開されている天気データ インターフェイス (技術的には API インターフェイスと呼ばれます) に接続して、大量のリアルタイムの天気データを取得することです。取得される生のデータは、さまざまな天気関連のパラメーターだけであり、一般の人にはまったく理解できません。どうすれば、一般の人々に直感的に理解してもらえるでしょうか。

次に、製品マネージャーが APP の視覚効果と実装ロジックを設計し、JAVA エンジニアがデータ インポート用の APP 全体のシステム バックグラウンドを開発します。アルゴリズム エンジニアは、製品モデルに基づいて主要な元の気象データに対して論理計算を実行し、最終結果が私たちが目にする APP インターフェイスになります。

この事例をもっと深く理解してみましょう。例えば、Moji Weather APP では今日の気温が 20 度で雨が降っていると表示されています。アルゴリズム エンジニアは気温や降水量などのデータを総合的に分析し、この気温に適した服装や旅行に関する従来のデータを抽出します。例えば、気温が 20 度で雨が降っている場合、秋の服を着て傘を持ってくるように通知します。雨が降らずに気温が 20 度の場合、秋の服を着て傘を持ってくるように通知します。

より強力なアルゴリズムが詳細な計算を実行します。旅行や娯楽を容易にするだけでなく、周辺のどの場所が旅行に適しているかなどの情報も推奨します。これには、アプリが気象データだけでなく、生活、旅行、観光スポットのデータに接続する必要があります。

上記の事例から、高品質のAPPアルゴリズムの複雑さがわかります。さまざまなチャネルやさまざまなデータの取得の難しさなど、アルゴリズムの複雑さこそが、一定の技術的障壁を確立するのです。同時に、この技術は実際には普遍的です。重要なのは、データ障壁によって競合他社がそれを突破することが不可能になり、「信頼の独占」効果が生まれ、ユーザーの心の中に徐々に信頼感が確立され、「アルゴリズム崇拝」が引き起こされることです。これについては、次のセクションで詳しく説明します。

テクノロジーに関して、私たちは一貫して、テクノロジーは人間的であり、テクノロジーは究極的には人類に役立つと考えています。ビッグデータやアルゴリズムも例外ではありません。人間性から切り離されたテクノロジーには、用途も商業的価値もありません。

アルゴリズムはデータから派生するものなので、まずはデータとは何かを見てみましょう。テクノロジーライターであり、元アリババ副社長の Tu Zipei 氏は、Big Data の中で、データについて非技術的な説明をしています。

データには2種類あります。1つはスモールデータ、つまり気温、面積、大きさなどの測定値や、人口規模、土地面積などの一般的な統計値などから得られるデータです。もう1つはビッグデータ、つまり記録された行動、つまり情報の背景に基づいたデータで、規則性や行動の痕跡をたどることができます。かつては、ビッグデータはさまざまな行動の記録を通じて生成されていましたが、今日では、ユビキタスセンサーとマイクロプロセッサから生成されています。

大量のデータは、スモールデータであれビッグデータであれ、まず沈殿プロセスを経ます。データが必要になったら、データウェアハウスからデータを抽出してデータクリーニングを行います。このプロセスにより、不要なデータが除去され、価値のあるデータが残されます。最後に、データの分析と計算が実行され、分析と計算はアルゴリズムによって実現されます。

現在、私たちは主に次の 4 種類のデータをアルゴリズムを通じて推測しています。

  1. 行動データ:これは私たちの生活や仕事におけるさまざまな行動によって生成されるデータです。レストランでの消費、地下鉄やタクシーの乗車など。
  2. 状態データ:物または生物の固有の状態データ。台風パラメータ、森林緑化指標、人体状態など。
  3. ソーシャルデータ: Weibo、WeChat、TikTok などのソーシャル メディアを通じて当社が生成したログイン、時間、コメント、共有、その他の行動データ。
  4. 産業データ:生産、設計、製造プロセス中に生成されるデータであり、産業インテリジェンスの基礎となります。

アルゴリズムは基本的に上記の 4 種類のデータに基づいてさまざまな分析、推論、モデル出力を実行し、最終的には、やはりアルゴリズムに基づく人工知能や IoT の開発など、さまざまなアプリケーションを実現します。たとえば、検索エンジンの推奨アルゴリズム、地図アプリのナビゲーション アルゴリズム、フード デリバリー アプリのランキング アルゴリズム、音楽アプリの嗜好アルゴリズムなどです。

アルゴリズムを神秘的なものにしているのは、ビッグデータの巨大さとアルゴリズムの複雑さによるデータの壁です。古代から、人々は未知の領域の力を感じ取り、神秘的な空間と同じように、説明のつかない信仰と崇拝を生み出してきました。

02. 崇拝と権威

ヨーロッパの近代史において、科学と宗教の発展が激しい対立を生み出したように、データ アルゴリズムも伝統的な認識に挑戦しています。かつて、人々は天候の変化の傾向を理解したいと考え、天候に基づいて判断を下すために経験に頼ることが多かったです。かつて、医療も観察、聴取、質問、触診という伝統的な方法に従っていました。しかし今日、これらの伝統的な経験はデータ アルゴリズムによって挑戦されています。

私たちは携帯電話のアルゴリズムを通じて天気をチェックし、検索エンジンを通じて一般的な病気の解決策を検索します。さらに、音楽CDなどの従来の音楽を聴く方法は、少数の音楽マニアの趣味になりつつあり、一般の人々はNetEase Cloud Music、QQ Musicなどのスマートな推奨を楽しんでいます。過去の車載ナビゲーションシステムはもはや市場がなく、Baidu MapsとAmapはすべてのナビゲーション問題を解決できます。

これは、技術の発展とデータアルゴリズムによってもたらされた利便性です。このような無料サービスを享受できるのは嬉しいことですが、アルゴリズムに全面的に頼ると、予期せぬ結果を招くことになります。

例えば、数年前、運転手が携帯電話のナビゲーションに従っていたが、道順がわからなかったというニュースがありました。また、一部の企業は管理プロセスでデータの結果に重点を置きすぎて、人間味のある管理を無視し、チームの離職につながりました。生まれたばかりの子供に名前を付けるときも、インターネットで代替名を入力してスコアを確認していました。

なぜそうなるのでしょうか? それは、データ アルゴリズムの権威が人間の判断よりも高いと私たちが信じているからです。崇拝の出現は権威の認識に基づいています。

権威とは何でしょうか? 私たちは、「権威ある解釈」、「ある分野における権威ある専門家」、「ある権威ある技術を所有している」といった言葉をよく耳にします。

百科事典には権威について 5 つの説明があります。

一は権力と権威、二は人々を従わせる力と威信、三は支配と抑止、四は一定の範囲内で最高の地位にある人または物、五は権力と権力への自発的な服従を指します。

この記事の分析の観点から、いわゆる「アルゴリズム崇拝」は次のように説明できます。データ アルゴリズムには人々を信じさせる力があり、それによって権威感が生まれ、人々が自発的に納得し、判断に影響を与える他の要因が排除されます。たとえば、私たちは車を運転しているとき、運転手や他の人の経験よりもナビゲーション アプリを信頼します。テイクアウトを注文する際、同僚の提案などよりもEle.meのおすすめが上位に表示されると思います。

データ アルゴリズムに対する権威と崇拝の感覚は、次の 3 つの要因から生まれると私たちは考えています。

  1. 認知の混乱。特定の分野では認知上の困難や混乱が生じますが、データ アルゴリズムはこの問題を解決し、信頼につながります。例えば、見知らぬ街では天気やルートが判断できませんでしたが、天気や地図のアプリがこれらの問題を解決するのに役立ちました。
  2. データ処理の難しさ。人間では解決できないが、データアルゴリズムでは簡単に解決できるデータ処理の難易度を手動で判断できるため、信頼につながります。たとえば、AlphaGo はスーパーアルゴリズムを使って人間のチャンピオンに勝つことができますが、私にはそれができません。
  • 人間の本質に備わった怠惰。テクノロジーの発展が人々を怠惰にするというのは周知の事実です。データ アルゴリズムで解決できる問題の場合、私たちは手動で介入する傾向がありません。たとえば、以前は部屋を自分で掃除していました。しかし、インテリジェント アルゴリズムに基づく掃除機の登場により、部屋のデータを計算して指定されたエリアをインテリジェントに掃除できるようになり、手動の掃除が不要になりました。これは改善でしょうか、それとも退化でしょうか。

データ アルゴリズムの崇拝に関しては、その原因はアルゴリズムではなく人的要因であると常に考えています。アルゴリズムの開発を否定しているわけではありません。迷信や過度の信頼ではなく、適度な崇拝が最善の選択かもしれません。

03. 合理性と回帰

データアルゴリズムがどれだけインテリジェントであっても、技術の発展に直面して、私たちは合理性に戻る必要があります。特定の権威に固執すると、問題に対する多様な視点を失ってしまう可能性があります。

たとえば、市場決定を行う際、データアルゴリズムは多くの参考資料を提供しますが、消費者の内心はアルゴリズムの及ばないところにあります。また、多数の潜在的ユーザーの本当の気持ちを補足する必要があります。地図アプリは非常に強力ですが、私たち自身の感覚も考慮し、地元の人々から実際の道路状況を学ぶ必要もあります。

過度の「アルゴリズム崇拝」に陥らないために最も重要なことは、過剰を避けることです。過度の崇拝は迷信です。迷信の結果は、多様な視点を失うだけでなく、さらに恐ろしいことに、自分自身を失い、適切な理性的な判断を失うことです。

したがって、上記の議論に基づいて、データ アルゴリズムに過度に執着することを避けるために、次の参考資料を提供します。

  1. 多様な視点が重要です。データ アルゴリズムを信じますが、単一のデータ結果に頼らないでください。科学者の中には、結論を証明する際に、大量のサードパーティ データを裏付け証拠としてよく使用する人がいます。これは多角的な視点です。特定の分野で同じ結果が得られても、データ アルゴリズムが異なることが多く、異なる結果につながります。正しい結論を導き出すには、複数の視点を採用し、それらを比較する必要があります。
  2. 必要な人間の介入。データ アルゴリズムによって導き出された結論、またはデータ アルゴリズムの参加者自身に対して、状況に応じて必要な人間による介入を行うことで、アルゴリズムのグローバルな性質を高めることができます。例えば、企業が金融投資システムの開発を第三者に委託する場合、企業に適した投資システムを作るために、一般的な投資ロジックでは企業の投資哲学やリスク管理特性も考慮する必要があります。
  3. 物事に対して好奇心を持ち続けましょう。これは、上位レベルの認知と判断を決定する、根底にある思考ロジックです。すべてを盲目的に信じるのではなく、批判的思考を持つことで、個人的な偏見に陥らないようにするのにも役立ちます。

結論:

上記の 3 つの部分は、「アルゴリズム崇拝」に関する私たちの分析です。私たちはアルゴリズムの偉大さを否定するものではなく、アルゴリズムの適度な崇拝を拒否するものでもありませんが、合理的な理解と使用を主張しています。哲学者の周国平は次のように述べています。「好奇心は人間の合理性の始まりであり、最も基本的な要素です。」 「アルゴリズム崇拝」に陥らないためにはどうすればいいのでしょうか? データとアルゴリズム自体を理解することに加え、好奇心を持ち続けることが、思考の底から合理的な思考世界を構築するのに役立つかもしれません。

<<:  新たなAI詐欺事件が発覚! 「人工知能」は「インテリジェントな人工知能」ほど優れていないのでしょうか?

>>:  ディープラーニングへの扉を開くのに10分、コードはオープンソース

ブログ    

推薦する

人工知能の時代において、自己成長と教育においてどのような取り組みがなされるべきでしょうか?

近年、私たちは時代の広大さと大きな変化を痛感しています。潮流の下では、個人は泥や砂のように小さく、そ...

デジタルホーム: IoTとAIで家電をもっとスマートに

洗濯機、照明、スピーカー、テレビ、カメラなど、日常的に使用するデバイスが、離れた場所からあなたと通信...

ディープ ニューラル ネットワークを構築するための 20 の「未熟な」ヒント

当社の機械学習ラボでは、数多くの高性能マシンで何万時間ものトレーニングを行って豊富な経験を蓄積してき...

人工知能を理解するのに役立つ記事(画像付き)

近年、人工知能(AI)が普及するにつれ、その原理を理解できずにAIを迷信し崇拝する人が増えています。...

効率的な整数計画法ソリューション、Kuaishouは多変量因果森林モデルを提案し、インテリジェントなマーケティング効果が顕著です

一定額以上の購入に対する Meituan のクーポンや Taobao のショッピング紅包などのスマー...

...

テクノロジーリーダーはAIGCの長所と短所をどう評価しているか

AIGC は、現代の偉大な技術的進歩の 1 つとして広く認められています。 OpenAI の Cha...

最高裁判所は顔認識に関する新たな規制を発表:顔情報の収集には「個別の同意」が必要

[[414466]] 7月28日、最高人民法院は「顔認識技術を用いた個人情報処理に関する民事訴訟にお...

TensorFlow Lattice: 柔軟で制御可能、説明可能な機械学習

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

DAMOアカデミーが大規模モデルテストベンチマークを発表: GPT-4はかろうじて合格、他のモデルはすべて不合格

ビッグモデルの発展、特に最近のさまざまなオープンソースのビッグモデルのリリースにより、さまざまなモデ...

2021年なのに、出会い系アプリのアルゴリズムはなぜこんなにも悪いのでしょうか?

[[407925]]ビッグデータダイジェスト制作出典: Wiredパンデミックの間、出会い系アプリ...

猫=チューリングマシン? 4つのテストにより、「猫コンピューター」が任意の計算を実行できることが証明された

柔らかくてかわいい猫は、いつも私たちに「猫を撫でたい」「猫を抱きしめたい」という衝動を掻き立てます。...

「AI+教育」は偽のトリックか本物のスキルか?本質は依然としてAIの能力のテスト

近年、教育業界の資金のほとんどは「AI+教育」を追い求めています。現在、「AI+教育」分野では、さま...

AIのおかげで売上が24%増加しました。このようなAI人材はどこで見つけられるのでしょうか?

[[429444]]この記事はWeChatの公開アカウント「Computer World」から転載...

ChatGPTの不正行為から逃れるのは難しいです! 99%のヒット検出、カンザス大学の新しいアルゴリズム、Cellジャーナルに掲載された研究

これまで、多くの人が ChatGPT 検出器を開発してきましたが、実際に効果的に識別できるものはあり...