現代のコンピューター ビジョン テクノロジーは、これまで映画でしか見たことのないようなテクノロジーの超大国を私たちに見せることが十分に可能です。 AI システムにビデオをロードし、低解像度のフレームを拡大するように指示すると、少しのトレーニングと巧妙なアルゴリズムで、認識のために画像を「強化」できるようになります。
これは大したことではないように聞こえるかもしれません。しかし、テスラが運転支援機能に使用しているのと同じ技術が、がんの検出から写真に写っている物体の数のカウントまで、数え切れないほどの目的に使用できることを考えてみてください。私たちはあらゆることにコンピューター ビジョンを使用しています。ちょっと怖いですね。 賢い開発者が、キー入力や指の動きからテキストを推測するように AI システムをトレーニングすることを妨げるものは何もありません。これは恐ろしいことですが、その理由は後で説明します。 まず、AI がまだカメをライフルと見分けるなどの単純な間違いを犯していた 2017 年以降、コンピューター ビジョンは大きく進歩したことを言及する価値があります。 今日のコンピューター ビジョン システムは、非常に少量のデータで驚くべき推論を行うことができます。たとえば、研究者たちは、AI ベースのタイピングの生体認証と心理学者が開発した自動ストレス検出システムを使用するだけで、タイピングのコンピューター分析を実証しました。 研究者たちは、人間のタイピングを模倣するように AI を訓練しました。その結果、スペル、文法、その他のコミュニケーションスキルの習得に役立つ、より優れたツールを開発できるようになります。簡単に言えば、私たちは AI システムに、ほとんどの人にはできないような指の動きから推論することを教えているのです。 唇の動きを言葉に翻訳する読唇術のように、指の動きを分析してそれをテキストとして解釈できるシステムを開発することは難しくないだろうと想像してみてください。このような AI 製品はまだ見たことがありませんが、存在しないということではありません。 それで、最悪の事態はどんなことが起こるのでしょうか?インターネットが普及した現在、ショルダーサーフィンはコンピューターセキュリティに対する最大の脅威の 1 つです。そうは言っても、誰かのパスワードを盗む最も簡単な方法は、その人がパスワードを入力するのを観察することです。そのため、ほとんどのパスワード入力画面では、入力中のパスワードは非表示になりますが、誰が画面を見ているかはわかりません。 ほとんどの人は、どのキーを押したか、画面にどの数字を入力したかを正確に判断することができません。何をしているのかわかっているときは、私たちの指は信じられないほど速く動き、手と目の協調性は優れています。しかし、AI はこうした小さな動きを学習することができ、データが豊富な AI の世界では、ほぼ何でも可能になります。 理論的には、十分なリソースを持つ開発者であれば、AI チップ(多くの主力スマートフォンに搭載されているものなど)上で実行でき、クラウドベースのテクノロジーに接続できるモデルを簡単に構築できるはずです。これにより、世界中のほぼすべての人が、他の人が携帯電話やキーボードで何を入力しているかを「見る」ことができるようになります。 この技術が悪人によって利用された場合、結果は悲惨なものとなるでしょう。したがって、テクノロジー企業や政府が関与し、そうしたテクノロジーが適切な場所で使用されるよう厳重に管理されなければなりません。 |
<<: なぜ2G/3GとAIは火花を散らすことができないのでしょうか?この論文で答えが分かります
最近、世界一の富豪イーロン・マスク氏がTEDディレクターのクリス・アンダーソン氏が主催する独占インタ...
(1)要素が0から65535までの任意の数値であり、同じ値が繰り返し出現しない整数列。 0 は例外で...
あなたの目の前に表示されている画像の人物は現実には存在しません。実は、機械学習モデルによって作成され...
[[170615]]数年前、私が修士号を取得するために勉強していたとき、大学にアリコロニーアルゴリズ...
最近、OpenAIの研究科学者ヒョン・ウォン・チョン氏がソウル国立大学で「大規模言語モデル(2023...
この記事では、ハッシュテーブルを使用して重複を排除する通常の方法よりもはるかに高速な、繰り返しのない...
最近、マイクロソフトは最新の Azure ニューラル ネットワーク音声合成技術 Uni-TTSv3 ...
私は長年、学界と産業界の両方で機械学習モデリングに取り組んできましたが、Scalable ML で「...
[[422724]]今学期の一番の話題は、未成年がゲームをプレーできなくなった平日です!これにより、...
最近、Amazon は時系列予測にビッグモデルを使用する方法に関する論文を発表しました。これは時系列...
LLaMA-1 と比較して、LLaMA-2 はより高品質のコーパスを導入し、大幅なパフォーマンスの...
今日、AI プログラムは、写真やビデオ内の顔や物体を認識し、音声をリアルタイムで書き起こし、X 線ス...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...