中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

CNNとは何ですか? CNNですか?

AI に興味を持つ初心者は誰でも、最初に CNN (畳み込みニューラル ネットワーク) という用語に遭遇するでしょう。

しかし、初心者が CNN が一体何なのか、なぜインテリジェントに顔を認識し、声を区別できるのかを理解しようとすると、毎回混乱してしまい、形而上学としてしか理解できません。

さて、Wikipedia が解決できなかった問題を誰かが解決しました。

CNN Explainerと呼ばれるこのオンラインのインタラクティブな視覚化ツールは、CNN を解説し、初心者に CNN とは何か、なぜオブジェクトを識別できるのかを説明します。

TensorFlow.js を使用して 10 層の事前トレーニング済みモデルをロードします。これは、ブラウザで CNN モデルを実行するのと同じです。コンピューターを起動するだけで、CNN がどのようなものかを理解できます。

さらに、この Web ツールはインタラクティブです。グリッド (CNN の「ニューロン」) のいずれかをクリックするだけで、入力内容と、どのような微妙な変化が生じたかが表示されます。

それぞれの畳み込み演算も明確に確認できます。

畳み込みをはっきりと見る

CNN インタープリターも非常に使いやすく、マウスでタップするだけです。

ニューロンをクリックして弾性解釈ビューに入り、畳み込みカーネルのスライディング プロセスのアニメーション シミュレーションを確認します。

畳み込みプロセス図をクリックすると、より詳細なプロセスが表示されます。

基礎となる畳み込み演算プロセスと、演算後に 3×3 畳み込みカーネルが 1 つの数値に変換される様子を確認できます。

ReLUと最大プーリング層をはっきりと見る

特定のプロセスを確認するには、ReLU レイヤーのニューロンをクリックします。ReLU 関数は次のように動作します。

プーリング ニューロンをクリックすると、最大プーリング層がどのように機能するかを確認できます。

CNNがどのように予測を出力するかを見る

右端の出力ニューロンをクリックすると、弾性解釈ビューに入ります。

Softmax 関数の詳細を表示できます。

「ニック」を特定してみますか?

CNN インタープリターにはデフォルトで 10 枚の画像が付属していますが、独自のカスタム画像を追加することもできます。

たとえば、次のようになります。

[[324608]]

チーズ入り焼きピーマン?ピーマンのピザ?それとも一体何なの?

画像リンクをコピーするか画像をアップロードすると、10 段階の処理を経て、次の結果が得られます。

それはピーマンですが、カメムシである可能性もあります。

ただし、トム・ヌークを配置するなど、右側にある元の 10 個のカテゴリにのみ分類できます。

[[324609]]

エスプレッソとして認識されます。

ジョージア工科大学の中国人博士課程学生が制作

最後に、この CNN インタープリターの作者は、ジョージア工科大学の中国人 Zijie Wang です。彼は昨年、機械学習の博士課程を始めたばかりです。彼はウィスコンシン大学マディソン校を 3.95/4.00 の GPA で卒業しました。

[[324611]]

彼はまた、ウィスコンシン大学マディソン校の中国人学部生がどこから来たのかを調べるなど、他の興味深いデータ視覚化プロジェクトも行っています。

ポータル

CNN解説

https://poloclub.github.io/cnn-explainer/

GitHub

https://github.com/poloclub/cnn-explainer

https://arxiv.org/abs/2004.15004

​​



<<:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

>>:  私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ    
ブログ    

推薦する

人工知能の発達により、親は子供たちに新しいエリートの考え方を教えざるを得なくなった

人工知能は急速に発展しており、その理論と技術はますます成熟し、その応用分野は絶えず拡大しています。人...

MIT、Wikipedia の更新、間違いの修正、偽ニュースの特定を行う AI 編集システムを開始

[[334141]]誰でも編集できるオンライン百科事典である Wikipedia では、各エントリを...

ロボットは銀行業務を破壊するのか?

[[223220]]世界経済フォーラムの最近のレポートでは、2020年までに先進国で500万の雇用...

Karpathy の新しいビデオが再び人気に: GPT Tokenizer をゼロから構築

技術の第一人者カパシー氏がOpenAIを去った後、彼のビジネスは非常に活発になっています。新しいプロ...

ラオ・ファン氏が投資に参加し、MITの中国人女性科学者が2億ドルの資金を調達! 10,000台のH100が1000億以上のパラメータでAIエージェントをトレーニング

今、シリコンバレーに新たな AI ユニコーンが誕生しました!この中国人女性科学者が設立した会社はIm...

ChatGPTはまたしても「おばあちゃんの抜け穴」に騙されました! PS おばあちゃんの遺物、Bing を騙して認証コードを完全に識別させる

「Granny Loophole」が戻ってきました!このミームを知らない人のために、数か月前にインタ...

ChatGPTは人気を集めており、OpenAIはAIソフトウェア用のアプリストアの作成を検討している

今年 5 月、OpenAI はすべての ChatGPT Plus ユーザー向けにネットワーキングおよ...

...

AIチップ帝国が戦争状態!アルトマン氏は米国政府と密かに会談し、孫正義氏は大きな賭けに向け1000億ドルを緊急調達

この時代において、AIは科学技術の将来の発展の重要な支点となり、AIチップは産業の発展を牽引する新た...

人工知能の新たなブレークスルー:ニューラルネットワークが画像内の物体を自律的に識別できる

海外メディアの報道によると、フィンランドのコンピューター科学者は神経生物学的手法を用いて人工知能研究...

...

ロシアとウクライナのドローン戦争:ドローン艦隊の製造に8年間で90億ドルを費やしたロシアはなぜ制空権を失ったのか?

ビッグデータ概要2014年にクリミアで戦っていたウクライナ軍兵士たちは、ロシアの無人機を目撃すると、...

2021 年の自然言語処理 (NLP) のトレンド トップ 10

2020 年は、ディープラーニングベースの自然言語処理 (NLP) 研究にとって忙しい年でした。最...

Python とディープニューラルネットワークを使用して画像を認識する方法は?

[[219378]]見れば分かります。わずか 12 行の Python コードで、独自のマシン ビ...