Google の人工知能に対する皆の理解は、おそらく囲碁 AI AlphaGo から始まったのでしょうが、それだけではありません。 Google は、常に人々に好まれる方法で AI の能力を披露することに長けています。昨日、Google は初の WeChat ミニプログラム「Guess the Drawing」をリリースしました。これは、Google AI による興味深いソーシャル WeChat ミニプログラムです。ユーザーは制限時間内にスケッチや落書きをすることができます。各体験ラウンドでは、ユーザーは指定された時間内に日用品 (犬、時計、靴など) の絵を描く必要があり、人工知能は時間内に絵の中の物体を推測する必要があります。 描いた絵が Google の人工知能によって 20 秒以内に推測されれば、そのレベルをクリアできます。推測されなければ、ゲームは終了します。また、友達の間でのランキングを数えるリーダーボードもあり、これは WeChat ミニゲームの通常のソーシャル セクションでもあります。 上に示したように、ゲームの操作は簡単です。次のステップは、AIと「あなたが描いて、私が推測する」という暗黙の了解に達することです。複数のラウンドで正しく推測すると、連続したゲームのロックが解除され、友達の輪の中で1位になります。すべての「魂の画家」をテストする時が来ました。 編集者の友人達から届いた作品なので、気軽に体験していただけます。 もちろん、泣きながらみんなに判定をお願いする人もいました。人工知能に推測されなかったこれらの絵は誰のせいなのでしょうか? 誰もがゲームを楽しんでいる一方で、多くのネットユーザーは「AIは思っていたよりも強力だ」と嘆いていました。一部のネットユーザーもこう言っています。「このゲームは実はかなり退屈だ。試しにここに来ただけだ。」 「絵当てソング」の背後には5000万点以上の手描きスケッチのデータセットがある 「絵を当てよう」ゲームは、5,000 万点以上の手描きスケッチのデータセットから生成された Google AI のニューラル ネットワークによって駆動されます。Google が以前にリリースした類似のゲーム「Quick, Draw!」では、このニューラル ネットワークについて詳しく説明されています。「絵を当てよう」ゲームに興味がある場合は、Google で「Quick, Draw!」を検索して、PC でゲームをプレイすることもできます。 下の図に示すように、Google が提示するすべての絵を推測する質問には、実はすでに手描きスケッチに関する大量のデータが含まれています。描画中に、ニューラル ネットワークが反対側でそれらをすばやく比較します。 バナナをクリックすると、無数のさまざまな手描きのバナナが目の前に現れます。 以下は顔に関するデータです。さまざまな顔を見るのは非常に興味深いです。Googleの手描きスケッチデータ群では、ストロークの順序が記録されていることに注意してください。マウスを任意の顔に移動すると、描画プロセスが自動的に表示されます。 これを読んで、人工知能はまあまあで、データに基づいて比較することしかできないと思っているでしょうか? 外部からの助けなしに私が描いているものを推測できるほど魔法のようなものではありません。 ある程度はそう言えるが、正確ではない。実際、AIは多くの複雑な作業もこなしている。Googleは「絵を当てよう」ゲームについて次のように説明した。コンピューターは常に賢かった。AIのおかげで、コンピューターはより自然で人間的な方法で世界を理解できるようになった。エキサイティングな新開発の1つはコンピュータービジョン技術で、これによりコンピューターは入力された視覚情報を直接理解し、それによって世界を「見る」ことができる。 Google によれば、この技術はビデオ通話で友人を識別してタグ付けしたり、人間の目の診断画像で糖尿病の初期症状を特定したりするために使用できるとのことです。さらに、「ニューラル ネットワーク」テクノロジーのおかげで、コンピューターは一見非常に困難と思われるいくつかのことを非常にうまく処理できます。たとえば、大まかなスケッチからオブジェクトが何であるかを識別することができます。コンピューターは、耳の付いたランダムなインクの落書きがパンダである可能性があることを「認識」できるようになりました。 「ニューラルネットワーク」技術とは何ですか? ニューラル ネットワーク (NN) または準ニューラル ネットワークは、機械学習と認知科学の分野で、生物学的ニューラル ネットワーク (動物の中枢神経系、特に脳) の構造と機能を模倣し、関数を推定または近似するために使用される数学モデルまたは計算モデルです。 ニューラル ネットワークは、計算のために相互に接続された多数の人工ニューロンで構成されています。ほとんどの場合、人工ニューラル ネットワークは外部情報に基づいて内部構造を変更できます。ニューラル ネットワークは適応型システムであり、一般的に学習機能を備えています。典型的なニューラル ネットワークには、アーキテクチャ、アクティビティ ルール、学習ルールという 3 つの部分があります。 Google Brain チームの神のような人物であり、トロント大学ベクター研究所の教授の意見では、犬と猫を 2 つの異なる性別として定義する必要がある場合、文化的な観点から、犬は雄、猫は雌とみなされる可能性があるとのことです。この定義には論理がありません (また、非常に性差別的です) が、私たちの連想や類推により、犬は攻撃的で毛深く、不器用であり、猫は狡猾で賢く、従順であるとわかります。前者は男性的な特徴を持ち、後者は女性的な特徴を持っています。この背後にある理由は論理では証明できませんが、私たちの脳の中に存在します。 機械がこれらと同じ表現を直感できるという考えには、詩的なところがあります。知識、つまり人生の蓄積された意味と経験は、存在する神秘的な物質です。それがニューラル ネットワークの美しさです。 ジェフリー・ヒントン氏らは、ニューラルネットワークの素晴らしさについて現在も研究を続けていますが、今日ではその魅力を私たちは簡単に感じることができます。「絵当てソング」は楽しいと思いますか?または、ご意見がありましたらメッセージを残してください。 |
<<: まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!
>>: Googleの「AIが写真を推測」アプリがWeChat Momentsで人気:ユーザーの参加でよりスマートに
PwCは、モノのインターネット(IoTAg)ベースの農業モニタリングがコネクテッドスマート農業の分野...
最近、北京で開催された2019 Intel Innovation Accelerator AI パー...
人工知能技術と他の技術の最大の違いは、人間の頭脳労働の一部を代替できるだけでなく、一部の分野では人間...
言語モデルが前例のない規模にまで拡大し続けるにつれて、下流のタスクのすべてのパラメータを微調整するこ...
[51CTO.com からのオリジナル記事]昨日の記事「顔認識の威力はどれほどか? AIFR 技術...
テクノロジー業界は歴史的に平均給与が最も高い業界の一つであり、リストのトップにランクされることも少な...
「Dlib は、高度なソフトウェアを作成するための機械学習アルゴリズムとツールの最新の C++ ツー...
機械学習による翻訳は人間のコミュニケーションに非常に有益ですが、限界もあります。機械学習は、企業に文...
ここ数年、データサイエンスの概念は多くの業界で受け入れられてきました。データ サイエンス (科学的研...
5月3日、上海国際会議センターで行われた記者会見で、カンブリアン・テクノロジーズのCEO、陳天石氏が...
フェデレーテッド ラーニングは、データがローカルの場所から出ないようにするプライバシー保護戦略により...
中国はいつになったら、極めて強力な一般化能力を持つさまざまな知的存在を創造し、人類の真の助手となるこ...
最近、南京、江蘇省、天津などではAI顔認識技術の使用を禁止し始めている。 11月末、南京市のある男性...