顔認識は簡単すぎる、AIは指の動きも認識できる、これは非常に恐ろしい

現代のコンピュータービジョンテクノロジーは、これまで映画でしか見たことのないようなテクノロジーの超大国を私たちに見せることが十分に可能です。 AI システムにビデオをロードし、低解像度のフレームを拡大するように指示すると、少しのトレーニングと巧妙なアルゴリズムで、認識のために画像を「強化」できるようになります。

[[399612]]

これは大したことではないように聞こえるかもしれません。しかし、テスラが運転支援機能に使用しているのと同じ技術が、がんの検出から写真に写っている物体の数のカウントまで、数え切れないほどの目的に使用できることを考えてみてください。私たちはあらゆることにコンピュータービジョンを使用しています。ちょっと怖いですね。

賢い開発者が、キー入力や指の動きからテキストを推測するように AI システムをトレーニングすることを妨げるものは何もありません。これは恐ろしいことですが、その理由は後で説明します。

まず、AI がまだカメをライフルと見分けるなどの単純な間違いを犯していた 2017 年以降、コンピュータービジョンは大きく進歩したことを言及する価値があります。

今日のコンピュータービジョンシステムは、非常に少量のデータで驚くべき推論を行うことができます。たとえば、研究者たちは、AI ベースのタイピングの生体認証と心理学者が開発した自動ストレス検出システムを使用するだけで、タイピングのコンピューター分析を実証しました。

研究者たちは、人間のタイピングを模倣するように AI を訓練しました。その結果、スペル、文法、その他のコミュニケーションスキルの習得に役立つ、より優れたツールを開発できるようになります。簡単に言えば、私たちは AI システムに、ほとんどの人にはできないような指の動きから推論することを教えているのです。

唇の動きを言葉に翻訳する読唇術のように、指の動きを分析してそれをテキストとして解釈できるシステムを開発することは難しくないだろうと想像してみてください。このような AI 製品はまだ見たことがありませんが、存在しないということではありません。

それで、最悪の事態はどんなことが起こるのでしょうか?

インターネットが普及した現在、ショルダーサーフィンはコンピューターセキュリティに対する最大の脅威の 1 つです。そうは言っても、誰かのパスワードを盗む最も簡単な方法は、その人がパスワードを入力するのを観察することです。そのため、ほとんどのパスワード入力画面では、入力中のパスワードは非表示になりますが、誰が画面を見ているかはわかりません。

ほとんどの人は、どのキーを押したか、画面にどの数字を入力したかを正確に判断することができません。何をしているのかわかっているときは、私たちの指は信じられないほど速く動き、手と目の協調性は優れています。しかし、AI はこうした小さな動きを学習することができ、データが豊富な AI の世界では、ほぼ何でも可能になります。

理論的には、十分なリソースを持つ開発者であれば、AI チップ（多くの主力スマートフォンに搭載されているものなど）上で実行でき、クラウドベースのテクノロジーに接続できるモデルを簡単に構築できるはずです。これにより、世界中のほぼすべての人が、他の人が携帯電話やキーボードで何を入力しているかを「見る」ことができるようになります。

この技術が悪人によって利用された場合、結果は悲惨なものとなるでしょう。したがって、テクノロジー企業や政府が関与し、そうしたテクノロジーが適切な場所で使用されるよう厳重に管理されなければなりません。

<<: なぜ2G/3GとAIは火花を散らすことができないのでしょうか?この論文で答えが分かります

>>: 待望のAIは人工知能か、それとも人工的な愚かさか？