中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

CNNとは何ですか? CNNですか?

AI に興味を持つ初心者は誰でも、最初に CNN (畳み込みニューラル ネットワーク) という用語に遭遇するでしょう。

しかし、初心者が CNN が一体何なのか、なぜインテリジェントに顔を認識し、声を区別できるのかを理解しようとすると、毎回混乱してしまい、形而上学としてしか理解できません。

さて、Wikipedia が解決できなかった問題を誰かが解決しました。

CNN Explainerと呼ばれるこのオンラインのインタラクティブな視覚化ツールは、CNN を解説し、初心者に CNN とは何か、なぜオブジェクトを識別できるのかを説明します。

TensorFlow.js を使用して 10 層の事前トレーニング済みモデルをロードします。これは、ブラウザで CNN モデルを実行するのと同じです。コンピューターを起動するだけで、CNN がどのようなものかを理解できます。

さらに、この Web ツールはインタラクティブです。グリッド (CNN の「ニューロン」) のいずれかをクリックするだけで、入力内容と、どのような微妙な変化が生じたかが表示されます。

それぞれの畳み込み演算も明確に確認できます。

畳み込みをはっきりと見る

CNN インタープリターも非常に使いやすく、マウスでタップするだけです。

ニューロンをクリックして弾性解釈ビューに入り、畳み込みカーネルのスライディング プロセスのアニメーション シミュレーションを確認します。

畳み込みプロセス図をクリックすると、より詳細なプロセスが表示されます。

基礎となる畳み込み演算プロセスと、演算後に 3×3 畳み込みカーネルが 1 つの数値に変換される様子を確認できます。

ReLUと最大プーリング層をはっきりと見る

特定のプロセスを確認するには、ReLU レイヤーのニューロンをクリックします。ReLU 関数は次のように動作します。

プーリング ニューロンをクリックすると、最大プーリング層がどのように機能するかを確認できます。

CNNがどのように予測を出力するかを見る

右端の出力ニューロンをクリックすると、弾性解釈ビューに入ります。

Softmax 関数の詳細を表示できます。

「ニック」を特定してみますか?

CNN インタープリターにはデフォルトで 10 枚の画像が付属していますが、独自のカスタム画像を追加することもできます。

たとえば、次のようになります。

[[324608]]

チーズ入り焼きピーマン?ピーマンのピザ?それとも一体何なの?

画像リンクをコピーするか画像をアップロードすると、10 段階の処理を経て、次の結果が得られます。

それはピーマンですが、カメムシである可能性もあります。

ただし、トム・ヌークを配置するなど、右側にある元の 10 個のカテゴリにのみ分類できます。

[[324609]]

エスプレッソとして認識されます。

ジョージア工科大学の中国人博士課程学生が制作

最後に、この CNN インタープリターの作者は、ジョージア工科大学の中国人 Zijie Wang です。彼は昨年、機械学習の博士課程を始めたばかりです。彼はウィスコンシン大学マディソン校を 3.95/4.00 の GPA で卒業しました。

[[324611]]

彼はまた、ウィスコンシン大学マディソン校の中国人学部生がどこから来たのかを調べるなど、他の興味深いデータ視覚化プロジェクトも行っています。

ポータル

CNN解説

https://poloclub.github.io/cnn-explainer/

GitHub

https://github.com/poloclub/cnn-explainer

https://arxiv.org/abs/2004.15004

​​



<<:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

>>:  私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ    
ブログ    

推薦する

2024年の人工知能とデジタルツインの開発動向

人工知能 (AI) とデジタル ツインは、複数の業界で重要な用途を持つ、よく議論される 2 つの技術...

...

産業用 AI チェックリスト: 始めるための 10 ステップ

人類はもはや人工知能(AI)の波から逃れることはできない。彼らが行くところすべてで、最新の AI ソ...

...

...

MetaMath: 逆思考で大規模モデルをトレーニングする新しい数学的推論言語モデル

複雑な数学的推論は、大規模言語モデルの推論能力を評価するための重要な指標です。現在、一般的に使用され...

米裁判所、人工知能コンピューターは発明を特許できないと判決

[[421713]]人工知能(AI)がその発明に対して特許を申請できるかどうかに関して、米国連邦政府...

2020年の世界産業用ロボット業界の現在の市場状況と競争環境の分析

2020年の世界産業用ロボット産業の現状と競争環境の分析:アジア太平洋地域が世界最大の市場に1. 世...

家のドアをロックするChuangmi Technologyは、スマートホームセキュリティブランドをリードするスマートドアロックC1を発売しました。

「そう遠くない将来、スマートホームシステムを備えていない家庭は、インターネットにアクセスできない今...

Baidu がモバイル検索ランキングアルゴリズムを調整し、アプリのランキング結果を改善

百度の関係者は、現在、携帯電話でPCのウェブサイトにアクセスした場合、最高の閲覧体験を得ることは難し...

ロボティック プロセス オートメーション (RPA) を構築するための基本知識とベスト プラクティス

[[442548]]世界中でロボティックプロセスオートメーション (RPA) が使用され、ビジネスの...

流行中にどのようなホットなテクノロジーが使用されていますか? AI、5G、RTC、ビッグデータが登場

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2019年のAI技術のブレークスルーをすべて見る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2017 年最もホットなテクノロジーである人工知能について、あなたはどれくらい知っていますか?

2017 年の最もホットなテクノロジートピックは間違いなく人工知能です。人工知能は非常に難しい科学...