人工知能は人間を監視しているのでしょうか?現在のAIと未来のAIのギャップ

人工知能は人間を監視しているのでしょうか?現在のAIと未来のAIのギャップ

アルゴリズムで構成されたAI

多くの人は、一部の新しいハイテク概念は手の届かないものだと考えています。普通の人は、これらのハイテク概念を会話の話題として扱い、深く掘り下げることを拒否します。彼らは表面的には概念を理解していると思っていますが、実際には忙しすぎたり怠けたり、あるいは概念から遠すぎて、その根底に到達するのが面倒だと感じています。友人の中には、概念を表面的にしか理解せずに盲目的に投資する人もいますが、結果は予想通りです。 21世紀では、どんな新しい概念も基礎理論の層から生まれています。これらの概念の背後にある基礎理論を掘り起こす限り、これらの概念を理解することは難しくありません。今日の時代では、テクノロジーは急速に変化しています。21世紀に生きる人間として、新しい概念を理解する能力は高度な読解問題であり、これらの概念のいくつかは常識であると思います。情報技術の進歩は、知識と個人との距離を縮めています。これは、近年の民俗科学の出現の理由でもあります。いくつかの常識的な概念を選択して、一連の記事を作成しました。ご興味があれば、フォローして購読してください。

現在の人工知能技術の中で、強い人工知能に最も近い部分はニューラルネットワーク技術であり、両者は同じ方向を向いているものの、その間には距離があるということになります。既存の人工知能技術、いわゆる機械学習は、実際には受動的な学習、つまりアルゴリズムが指定した方向で大量のデータから特徴値を探し、この特徴を継続的に最適化する過程でより正確な特徴認識率を得るというものです。そのため、サポートとして大量のデータが必要です。ディープラーニングのトレーニング用のデータが多いほど、特徴値の分析はより正確になります。

たとえば、今日の画像認識技術はすでに非常に成熟しており、近年の AI 技術コンテストでは、技術チームと技術フレームワークを測定するための主なプロジェクトとベンチマークとして、画像認識技術がほぼ常に使用されています。その中でも、顔認識技術は特に成熟しており、わが国で広く使用されています。行政レベルでも商業レベルでも、顔認識はほぼすべての主要なアプリケーションがアクセスを検討する身元認証機能です。これは、わが国の個人情報の包括的な収集と個人のプライバシーに対する意識の弱さによるものです。大量の顔情報が収集・保存され、顔認識技術のトレーニングに使用できます。現在のAIの顔認識率は99.9%を超えており、これは人間の目の認識精度を超えているだけでなく、さらに有利なのは、AIが大量の画像認識タスクを同時に処理できることです。

わが国の行政レベルでは、顔認証技術が公共交通機関/銀行口座開設/公安犯罪捜査/オンライン実名認証など生活のさまざまな面に応用され、つい最近までチップ認証技術に急速に取って代わり、主要駅の券売機が廃止されました。今では、身分証明書/携帯電話と顔さえ持っていれば、公共交通機関で中国のどの都市に行くこともできます。近い将来、身分証明書を持ち歩かなくても済むようになると言えます。なぜなら、整形手術を受けていない限り、顔の情報は身分証明書/携帯電話番号/銀行口座/信用/行動軌跡に結び付けられるからです...現在、国はデジタル通貨の発行を準備しています。最も完全な住民情報を持つ国民機械として、将来的には携帯電話を取り出して支払う必要がなくなり、顔をスワイプするだけで直接支払いができ、スーパーマーケットに行って買い物をして持ち帰ることもできます。なぜなら、外出した瞬間にカメラが顔を認識し、信用口座から直接お金が差し引かれるからです。将来的にはこれが完全に可能になります。

一部のAI分野でアプリケーションレベルの進歩が見られる理由

画像認識の成果に加え、音声認識、音声翻訳、画像スキャンによるテキスト認識など、テキスト認識と音声認識でもかなりの成果がありました。これらのアプリケーションは、異言語コミュニケーションのための異職種間の利便性を提供します。アプリケーション レベルの進歩がこれらの分野で起きているのに、機械力学や株価予測などの他の分野では起きていないのはなぜかと疑問に思う人もいるかもしれません。

実際、過去 20 年間のインターネットの発展を振り返ってみると、明確な流れが見つかります。 MSN の初期の頃は、主にテキストでメッセージを送信していました。当時最も人気があったメッセージは絵文字でした。これは、画像コンテンツがまだ普及しておらず、誰もがカメラを持っているわけではなかったためです。画像情報の希少性は、過去の通信事業者によるマルチメディア メッセージの送信料金からわかります。その後、ブログが普及し、写真とテキストによるブログで情報を伝えることが一般的になりました。NetEaseやSohuなどのポータルサイトが登場し、主導権を握りました。音声メッセージは、スマートフォン時代の到来とともに始まりました。コンピューターとは異なり、スマートフォンにはマイクが搭載されており、音声メッセージの普及の条件が整っていました。WeChatなどのソーシャルアプリケーションは、この機会を捉えて市場に素早く参入し、モバイルソーシャルソフトウェアで入力できない人々の問題を音声メッセージでチャットする最初のアプリケーションとなり、ソーシャルアプリケーション市場を席巻しました。

[[386010]]

AppStoreからの画像

3Gの普及後、画像コンテンツの人気が高まり、さまざまな顔文字が爆発的に増加し、顔文字文化が形成されました。これはまさに画像情報の繁栄の証拠です。この繁栄の波に乗って、多くの優れた共有ソーシャルソフトウェアが登場しました。
Facebook/instagram/Twitterなどがあり、Meitu XiuXiu/camera360などの優れた画像処理ソフトウェア群もあります。4G時代には、KuaishouからMeipai、Douyinまで、ビデオアプリが新しい波として登場しました。当時のライブブロードキャストプラットフォーム間の競争は、格闘技の世界の戦いのようで、本当にエキサイティングでした。

これを読んで、読者は通信技術の発展の威力を実感できただろうか。 1Gから4Gへの過程で、私たちの情報応用シーンは、文字、画像、音声から動画/ライブ放送へと大きく変化し、大量の文字/画像/音声/動画情報が蓄積されました。そのため、最も早く開発された人工知能技術はすべて、大量の基礎データを蓄積したこれらの分野にありました。

アプリケーション レベルの成長が発生する領域はすべて、対応する基本データが大量にある領域です。

この時点で、私たちは自分自身に問いかける必要があります。5G 時代が到来しますが、どの通信モードが前面に出てくるのでしょうか?残念ながら、新しい購読アカウントではメッセージ機能を有効にできません。興味のある読者は購読アカウントにプライベートメッセージを送信できます。

[[386011]]

AppStoreからの画像

アプリケーションレベルの成長の参照指標

考えるための背景を提供します。

バイオニクスの観点から見ると、文字/音声/画像は人間が世界を理解するための最も基本的な窓であり、人工知能が世界を理解するための窓としても使用できます。別の観点から考えると、世界を理解するための窓は、人間個人の五感の適用範囲に属します。

視覚: 画像情報を分析し、空間を観察します。

聴覚:音波情報を分析して距離を判断します。

匂い: ガス情報を識別します。

味覚: 液体の情報を認識する。

タッチ: 確かな情報を認識します。

テキストと言語はそれぞれ視覚と聴覚の分析の高度な応用であり、文化の誕生の兆候です。テキストは記号論の応用です。すべての記号の背後にはヒントがあります。いわゆるヒントは論理または情報です。複数の単純な記号の組み合わせを使用して複雑な論理情報を表現することが、記号論の本質です。人工知能理論学派の記号論は、最終的には記号論の応用に基づいています。簡単に言えば、すべてのプログラミング言語は記号論の応用の具体化です。単純なif文でバイナリツリーロジックシステムを構築でき、その威力を発揮します。

象徴主義について話しているうちに、現在の人工知能理論学派の 3 つの学派を完結させる必要があります。

人工知能理論の 3 つの流派:

  1. 記号主義は、論理主義、心理主義、コンピュータ主義とも呼ばれ、物理的記号システム(つまり、記号オペレーティング システム)仮説と限定合理性の原則に基づいています。
  2. コネクショニズムは、バイオニクス主義または生理学とも呼ばれ、ニューラル ネットワークの原理と、ニューラル ネットワーク間の接続メカニズムおよび学習アルゴリズムに基づいています。
  3. 行動主義は進化論やサイバネティクス主義とも呼ばれ、サイバネティクスと知覚行動制御システムの原理に基づいています。


上記の抽象的な名前にこだわる必要はありません。実は、これら3つの流派に違いはありません。人間が思い描く強い人工知能の結論から言えば、これら3つの流派はすべて強い人工知能を実現するために必要な道であり、どれも欠けてはいけません。 (強い人工知能という概念に興味のある方は、こちらをクリックしてください:人工知能は人間を超えられるか?(I)AIの本当の姿)

象徴主義

よく考えてみてください。強力な人工知能プロジェクトを人工人間を作成するプロジェクトとして理解すると、バイオニクスの対象は人間そのものです。したがって、人間を創造するためには、まず人間自身を理解する必要があります。人間の第一の特徴は思考です。思考を脳の活動として理解するには、最も基本的なことは論理です。人間の思考はすべて論理的です。ドアを見ると、ドアの後ろに何があるのか​​想像するでしょう。[xx 女性スターが xx ファンに当惑] というクリックベイトの見出しを見ると、多くのことを想像するでしょう。[女性スター/当惑] という言葉は男性の脳のホルモンに関連しているからです。その結果、クリックすると、コンテンツがないことがわかります。レオの記事を読んだほうがよいでしょう。象徴主義が解決する主な問題は、脳の思考の基本的な論理です。たとえば、Honor of Kings などの現在のゲームのコンピューター キャラクターは、このルールに基づいて作成されています。

コネクショニズム

しかし、人間は意識的な認識だけでなく、潜在意識や本能的な反応も持っており、人間の思考には経験という基準があります。経験を理解することは非常に興味深いことです。人が初めて猿を見たとき、脳の認識センターは猿を未知の種として定義します。人々はさまざまな情報チャネルを使用して猿を理解し、その外見特性/名前/習慣/クラスを分析して保存し、「猿」と呼ばれる動物の枝に属する経験ニューロンを形成します。猿を何度も見た後、人間はもはや好奇心を持たず、注意深く観察します。なぜなら、経験が彼らに「これは猿だ」と教えてくれるからです。ここでの経験は、脳内ですでに分類されているニューロンです。目を通してサルの画像を入力すると、脳はサルのニューロンを迅速かつ正確に検索し、以前に保存された情報を認識センターに反映します。認識センターは、サルの情報が[既知の]ラベルに属すると判断すると、それ以上の反応を起こさず、「これはサルだ」という表面的な結論を出して通り過ぎます。人々はもはや好奇心を持たず、これが人々が古いものに飽きて新しいものを好む理由です。

ニューロンの働きをシミュレートする

言い換えれば、この経験ニューロンの役割は、小型データベース + パーサーです。最初の数回の学習とトレーニング セッションの後、完全な認識プログラムが形成されます。脳は、再計算することなく、このニューロンから直接結論を導き出すことができます。このアプローチにより、プログラムのエネルギー消費が大幅に削減され、応答速度が向上します。これがコネクショニズムの主な方向性です。ニューラル ネットワーク モデルを通じて高速応答ユニットが確立されます。これはまさに、現在の画像認識/テキスト認識/音声認識 AI プログラムが行っていることです。実際、これらの AI プログラムはニューロンです。トレーニング後は、画像/音声情報を入力するだけで結論が得られます。

[[386012]]

画像はボストンダイナミクス公式サイトより

行動主義

人工人間というからには、データ分析ができるだけでは、決して強い人工知能とは言えません。2017年、人工知能の文脈では、BDのロボット宙返り動画が話題になりました。ボストンダイナミクスが開発したロボット犬やロボットは、行動主義の代表です。行動主義の方向性は機械的行動であり、地球の重力環境下での複雑な地形や行動に適応する機械行動学習と説明できます。 BD がロボット アルゴリズムに機械学習をあまり使用しなかったのは残念ですが、これによって機械ダイナミクスに関する研究結果が将来の実際の機械動作学習の基礎を築くことが妨げられることはありませんでした。収益性の問題から、BDはDARPA/Google/ソフトバンクに相次いで買収され、昨年韓国のヒュンダイに30%値下げの9億2000万ドルで買収された。宝物とみなされていた。機械力学の分野に関しては、ディープラーニングやダイナミクスがより高度化していくことで、今後急速に成長していくと思います。

これらに加えて、将来的に強力な人工知能を実現するためには、他のさまざまな分野に大きく依存することになります。最も遠いのはバイオテクノロジー、次に材料科学とチップ技術、そして最も近いのはエネルギー分野だと思います。近年の電気自動車の爆発的な成長は、実は配当の1つです。なぜなら、バッテリーエネルギー分野の発展は、機械力学への道も開くからです。

結局のところ、現在強力な人工知能への道を歩んでいるさまざまな業界は、今でなくても近い将来にはその実現の最前線に立つことになるでしょう。

<<:  認知的ブレークスルー II: 人工知能の時代に私たちが経験している社会的、文化的変化

>>:  ブラックミラードッグが帰ってきた!ボストン・ダイナミクスの「ビッグ・イエロー・ドッグ」がスペースXで爆発現場の調査に当たっている

ブログ    

推薦する

AIとIoTの完璧な組み合わせ

AI と IoT が広く使用されるようになるにつれて、これら 2 つのテクノロジーがどのように連携し...

機械学習は、足を上げることから敷居に落ちることまで行います

突然、AI 時代に入ったようです。裏では、多くの友人が、来たる All in AI を迎えるために、...

AI主導のサプライチェーンが業界の変革を加速させる方法

アラブ首長国連邦(UAE)の企業がほぼ全面的にクラウドに移行する前に、政府はすでに大規模なデジタル変...

...

TOP50 人工知能のケーススタディ: AI は単なる誇大宣伝ではなく、努力によって実現される

AIは自慢するだけでなく、実践を通じて達成されます。コンセプトがどんなに優れていても、結果が重要です...

企業が AI 戦略を採用するための 8 つのヒント

人工知能技術は企業のビジネスに応用され、夢から現実へと変わりました。実際、最近の O'Rei...

AIはワクチン業界に何をもたらすのでしょうか?

[[237673]]画像出典: Visual Chinaワクチンは良いビジネスなのか、それとも生命...

OpenAIのSora、中国は追いつけないのか?

春節の時期にOpenAIのSoraが大人気でした。私も見てみましたが、正直GPT4が出た時ほどの衝撃...

テンセントは顔認識技術を使って未成年者への薬物依存防止規制を強化

米国のメディアによると、子供や十代の若者はビデオゲームに関するほぼすべての制限に対処する方法を見つけ...

ネットワークディスク上の大きなモデルを使うのはとても気持ちがいいです!隠された写真は3秒で発見され、親戚や友人全員が衝撃を受けた

AIの助けを借りて、自分が会社の重役になれる日が来るとは思ってもいませんでした!同僚のクローゼットの...

...

機械学習業界の発展はなぜ「オープンソース」から切り離せないのか

[[187490]] 2016 年末、Google DeepMind は機械学習プラットフォームであ...

AT&T Business: ゼロトラストは AI アプリケーションのリスクを軽減する万能薬

人工知能(AI)技術は、多くの業界の業務運営モデルを変えつつあります。AIは、多くの人材を面倒な事務...

スマートビジョンが AI アプリケーションに及ぼす 5 つの影響

インテリジェントビジョンは人工知能への扉です。この扉が開かれなければ、人工知能に関する詳細な研究を行...