WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。

WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。

Google の人工知能に対する皆の理解は、おそらく囲碁 AI AlphaGo から始まったのでしょうが、それだけではありません。 Google は、常に人々に好まれる方法で AI の能力を披露することに長けています。昨日、Google は初の WeChat ミニプログラム「Guess the Drawing」をリリースしました。これは、Google AI による興味深いソーシャル WeChat ミニプログラムです。ユーザーは制限時間内にスケッチや落書きをすることができます。各体験ラウンドでは、ユーザーは指定された時間内に日用品 (犬、時計、靴など) の絵を描く必要があり、人工知能は時間内に絵の中の物体を推測する必要があります。

描いた絵が Google の人工知能によって 20 秒以内に推測されれば、そのレベルをクリアできます。推測されなければ、ゲームは終了します。また、友達の間でのランキングを数えるリーダーボードもあり、これは WeChat ミニゲームの通常のソーシャル セクションでもあります。

上に示したように、ゲームの操作は簡単です。次のステップは、AIと「あなたが描いて、私が推測する」という暗黙の了解に達することです。複数のラウンドで正しく推測すると、連続したゲームのロックが解除され、友達の輪の中で1位になります。すべての「魂の画家」をテストする時が来ました。

編集者の友人達から届いた作品なので、気軽に体験していただけます。

もちろん、泣きながらみんなに判定をお願いする人もいました。人工知能に推測されなかったこれらの絵は誰のせいなのでしょうか?

誰もがゲームを楽しんでいる一方で、多くのネットユーザーは「AIは思っていたよりも強力だ」と嘆いていました。一部のネットユーザーもこう言っています。「このゲームは実はかなり退屈だ。試しにここに来ただけだ。」

「絵当てソング」の背後には5000万点以上の手描きスケッチのデータセットがある

「絵を当てよう」ゲームは、5,000 万点以上の手描きスケッチのデータセットから生成された Google AI のニューラル ネットワークによって駆動されます。Google が以前にリリースした類似のゲーム「Quick, Draw!」では、このニューラル ネットワークについて詳しく説明されています。「絵を当てよう」ゲームに興味がある場合は、Google で「Quick, Draw!」を検索して、PC でゲームをプレイすることもできます。

下の図に示すように、Google が提示するすべての絵を推測する質問には、実はすでに手描きスケッチに関する大量のデータが含まれています。描画中に、ニューラル ネットワークが反対側でそれらをすばやく比較します。

バナナをクリックすると、無数のさまざまな手描きのバナナが目の前に現れます。

以下は顔に関するデータです。さまざまな顔を見るのは非常に興味深いです。Googleの手描きスケッチデータ群では、ストロークの順序が記録されていることに注意してください。マウスを任意の顔に移動すると、描画プロセスが自動的に表示されます。

これを読んで、人工知能はまあまあで、データに基づいて比較することしかできないと思っているでしょうか? 外部からの助けなしに私が描いているものを推測できるほど魔法のようなものではありません。

ある程度はそう言えるが、正確ではない。実際、AIは多くの複雑な作業もこなしている。Googleは「絵を当てよう」ゲームについて次のように説明した。コンピューターは常に賢かった。AIのおかげで、コンピューターはより自然で人間的な方法で世界を理解できるようになった。エキサイティングな新開発の1つはコンピュータービジョン技術で、これによりコンピューターは入力された視覚情報を直接理解し、それによって世界を「見る」ことができる。

Google によれば、この技術はビデオ通話で友人を識別してタグ付けしたり、人間の目の診断画像で糖尿病の初期症状を特定したりするために使用できるとのことです。さらに、「ニューラル ネットワーク」テクノロジーのおかげで、コンピューターは一見非常に困難と思われるいくつかのことを非常にうまく処理できます。たとえば、大まかなスケッチからオブジェクトが何であるかを識別することができます。コンピューターは、耳の付いたランダムなインクの落書きがパンダである可能性があることを「認識」できるようになりました。

「ニューラルネットワーク」技術とは何ですか?

ニューラル ネットワーク (NN) または準ニューラル ネットワークは、機械学習と認知科学の分野で、生物学的ニューラル ネットワーク (動物の中枢神経系、特に脳) の構造と機能を模倣し、関数を推定または近似するために使用される数学モデルまたは計算モデルです。

ニューラル ネットワークは、計算のために相互に接続された多数の人工ニューロンで構成されています。ほとんどの場合、人工ニューラル ネットワークは外部情報に基づいて内部構造を変更できます。ニューラル ネットワークは適応型システムであり、一般的に学習機能を備えています。典型的なニューラル ネットワークには、アーキテクチャ、アクティビティ ルール、学習ルールという 3 つの部分があります。

Google Brain チームの神のような人物であり、トロント大学ベクター研究所の教授の意見では、犬と猫を 2 つの異なる性別として定義する必要がある場合、文化的な観点から、犬は雄、猫は雌とみなされる可能性があるとのことです。この定義には論理がありません (また、非常に性差別的です) が、私たちの連想や類推により、犬は攻撃的で毛深く、不器用であり、猫は狡猾で賢く、従順であるとわかります。前者は男性的な特徴を持ち、後者は女性的な特徴を持っています。この背後にある理由は論理では証明できませんが、私たちの脳の中に存在します。

機械がこれらと同じ表現を直感できるという考えには、詩的なところがあります。知識、つまり人生の蓄積された意味と経験は、存在する神秘的な物質です。それがニューラル ネットワークの美しさです。

ジェフリー・ヒントン氏らは、ニューラルネットワークの素晴らしさについて現在も研究を続けていますが、今日ではその魅力を私たちは簡単に感じることができます。「絵当てソング」は楽しいと思いますか?または、ご意見がありましたらメッセージを残してください。

<<:  まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

>>:  Googleの「AIが写真を推測」アプリがWeChat Momentsで人気:ユーザーの参加でよりスマートに

ブログ    
ブログ    
ブログ    

推薦する

ヘルスケアにおける IoT と AI

IoT 対応デバイスの登場により、医療における遠隔モニタリングが可能になりました。ほぼすべての大手...

データ分析技術:エッジ人工知能の応用

私たちが SF の世界に引き込まれると、人工知能と機械学習 (AI/ML) の概念は、映画「マトリッ...

海外のAIは使えない?国内お宝AIツール6選をシェア!

Chat GPTが普及して以来、さまざまなAIツールが次々と登場しました。AIの出現により、多くの...

150億のパラメータを持つ、史上最大のビジュアルモデル「V-MoE」の全コードをGoogleがオープンソース化

昨年 6 月に Google Brain チームが発表した 43 ページの論文「Scaling Vi...

Google AIがチューリングテストに合格、ビッグモデルドクターが登場か? GPT-4は17人の医師を困惑させた奇妙な病気を診断した

人類に利益をもたらす AGI を開発する必要がある理由の 1 つ:妻は過去 5 年間、あらゆる種類の...

...

Baiduの王海峰氏はオープンソースのディープラーニングプラットフォームPaddlePaddleを2019年のソフトウェアエキスポに導入した。

「ディープラーニングフレームワークは、インテリジェント時代のオペレーティングシステムです。百度のP...

...

[ビッグガイがやってくるエピソード4] データ駆動型の製品意思決定とインテリジェンス

データと製品を組み合わせるトピック 1 は、データと製品の組み合わせです。Stitch Fix を例...

AIはソフトウェアテスターの仕事を「奪う」のでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

AI戦争が近づく中、ChatGPTが軍事禁止を解除

先週末、大手人工知能企業OpenAIは、ChatGPTの使用ポリシーから軍事利用を禁止する条項をひっ...

C# 遺伝的アルゴリズム学習ノート

次のコードは、C# 遺伝的アルゴリズムを使用して、単純な花の進化シミュレーション プロセスを実装しま...

...

「百度脳産業イノベーションフォーラム」が本格始動、伝統産業向けAIソリューションを提案

「将来、AIとは何の関係もないと主張する企業はなくなるだろう」これは、2018年の世界人工知能会議で...

...