中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

CNNとは何ですか? CNNですか?

AI に興味を持つ初心者は誰でも、最初に CNN (畳み込みニューラル ネットワーク) という用語に遭遇するでしょう。

しかし、初心者が CNN が一体何なのか、なぜインテリジェントに顔を認識し、声を区別できるのかを理解しようとすると、毎回混乱してしまい、形而上学としてしか理解できません。

さて、Wikipedia が解決できなかった問題を誰かが解決しました。

CNN Explainerと呼ばれるこのオンラインのインタラクティブな視覚化ツールは、CNN を解説し、初心者に CNN とは何か、なぜオブジェクトを識別できるのかを説明します。

TensorFlow.js を使用して 10 層の事前トレーニング済みモデルをロードします。これは、ブラウザで CNN モデルを実行するのと同じです。コンピューターを起動するだけで、CNN がどのようなものかを理解できます。

さらに、この Web ツールはインタラクティブです。グリッド (CNN の「ニューロン」) のいずれかをクリックするだけで、入力内容と、どのような微妙な変化が生じたかが表示されます。

それぞれの畳み込み演算も明確に確認できます。

畳み込みをはっきりと見る

CNN インタープリターも非常に使いやすく、マウスでタップするだけです。

ニューロンをクリックして弾性解釈ビューに入り、畳み込みカーネルのスライディング プロセスのアニメーション シミュレーションを確認します。

畳み込みプロセス図をクリックすると、より詳細なプロセスが表示されます。

基礎となる畳み込み演算プロセスと、演算後に 3×3 畳み込みカーネルが 1 つの数値に変換される様子を確認できます。

ReLUと最大プーリング層をはっきりと見る

特定のプロセスを確認するには、ReLU レイヤーのニューロンをクリックします。ReLU 関数は次のように動作します。

プーリング ニューロンをクリックすると、最大プーリング層がどのように機能するかを確認できます。

CNNがどのように予測を出力するかを見る

右端の出力ニューロンをクリックすると、弾性解釈ビューに入ります。

Softmax 関数の詳細を表示できます。

「ニック」を特定してみますか?

CNN インタープリターにはデフォルトで 10 枚の画像が付属していますが、独自のカスタム画像を追加することもできます。

たとえば、次のようになります。

[[324608]]

チーズ入り焼きピーマン?ピーマンのピザ?それとも一体何なの?

画像リンクをコピーするか画像をアップロードすると、10 段階の処理を経て、次の結果が得られます。

それはピーマンですが、カメムシである可能性もあります。

ただし、トム・ヌークを配置するなど、右側にある元の 10 個のカテゴリにのみ分類できます。

[[324609]]

エスプレッソとして認識されます。

ジョージア工科大学の中国人博士課程学生が制作

最後に、この CNN インタープリターの作者は、ジョージア工科大学の中国人 Zijie Wang です。彼は昨年、機械学習の博士課程を始めたばかりです。彼はウィスコンシン大学マディソン校を 3.95/4.00 の GPA で卒業しました。

[[324611]]

彼はまた、ウィスコンシン大学マディソン校の中国人学部生がどこから来たのかを調べるなど、他の興味深いデータ視覚化プロジェクトも行っています。

ポータル

CNN解説

https://poloclub.github.io/cnn-explainer/

GitHub

https://github.com/poloclub/cnn-explainer

https://arxiv.org/abs/2004.15004

​​



<<:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

>>:  私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ    
ブログ    

推薦する

ChatGPT Plusの登録が停止、OpenAIは容量の課題に直面

11月16日、海外メディアの報道によると、OpenAIのCEOであるサム・アルトマン氏は最近、Dev...

機械学習と予測アプリケーションに必要な50のAPI

[[231536]] API は、ソフトウェア プログラムを構築するためのプロトコルとツールのセッ...

映画業界におけるAI:将来はアカデミー賞の背後にAIが立つ

[[258542]]最近終了した2019年のアカデミー賞授賞式では、最優秀脚本賞や最優秀視覚効果賞を...

IT 業界で最も過小評価されている 6 つのテクノロジーと、まだ廃れていない 1 つのテクノロジー

翻訳者 | ジン・ヤンレビュー | Chonglou 2023 年、生成 AI、具体的には Chat...

...

人工知能は議論の的になっています。それは人類にとって利益となるのでしょうか、それとも脅威となるのでしょうか?

人工知能はここ2年で急速に発展し、狂気のレベルにまで達しました。例えば、ロボットは人間社会の「市民」...

人間を倒すのは人間自身であり、人工知能は人間を倒すだろう

私たちが住む世界では、炭素をベースとするほぼすべての生物は、遺伝子をその特異性の根拠として利用してい...

...

...

素晴らしい配達でした!インテルビジョン観測室は、実体経済の発展に向けた新たな道を切り開きます|インテルビジョン

5月23日、 「実体経済の新たなエンジンを動かす『中核』のダイナミックエネルギー」をテーマにしたイ...

都市 AI アプリケーションの失敗事例: 善意の自治体 AI プロジェクトはなぜ失敗したのか?

編集者注: AI をどのように実装できるかを検討してきた私たちにとって、この Flint の事例は目...

ChatGPTを使った学生の不正行為を防ぐため、一部の大学教授は紙ベースの試験と手書きのエッセイへの復帰を検討している。

8月14日、人工知能(AI)の発展は教育に新たな課題をもたらしました。フォーチュン誌の最近の報道に...

危険なAIアルゴリズムを識別し、倫理原則に従ったビッグデータモデルを作成する方法

人工知能がもたらす脅威について議論するとき、スカイネット、マトリックス、ロボットによる終末の世界とい...

...