光速画像認識について学ぶ: 1ナノ秒未満

光速画像認識について学ぶ: 1ナノ秒未満

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ディープニューラルネットワークよりも速いものは何でしょうか?

おそらくフォトニック DNN がこの質問に答えられるでしょう。

現在、アメリカの研究者らが開発したフォトニックディープニューラルネットワーク(PDNN)により、わずか1ナノ秒で画像認識が可能になりました。

1ナノ秒の概念とは何ですか?これは 10-9 秒に相当し、最先端のマイクロチップの1 クロック サイクル(時間の最小単位)に匹敵します。

さらに、研究者らはテストを行い、画像の2分類と4分類におけるPDNNの精度はそれぞれ93.8%と89.8%と高いことを発見した。

今日の大規模な多層ニューラル ネットワークは効率的で強力な計算能力を備えているのは事実ですが、ハードウェアによって制限されており、多くの電力リソースを必要とすることもよくあります。

ペンシルバニア大学のエンジニアが開発したPDNNは、クロック、センサー、または大規模なストレージモジュールを必要とせずに画像を直接分析できるため、エネルギー消費を効果的に削減できます。

研究結果は6月1日にネイチャー誌に掲載された。

フォトニックDNNは従来のDNNよりも高速です

フォトニック DNN の原理とパフォーマンスは、従来の DNN とどう違うのでしょうか?

まず従来の DNNを見てみましょう。

図 a は、従来の DNN の構造の概略図です。データ配置ユニット、入力層、いくつかの隠れ層、および分類出力を提供する出力層が含まれています。

図 b は、従来の N 入力ニューロンの構造を示しています。入力の線形加重合計が非線形活性化関数を介してニューロンの出力を生成します。

図 c と図 d は、それぞれPDNNチップのニューラル ネットワークの概略図と N 入力ニューロン構造です

入力画像はまず 5×6 の格子カプラで形成され、次に 4 つの重なり合うサブ画像に配置されます。サブ画像のピクセルはニューロンの最初の層に送信され、畳み込み層を形成します。

後続のニューロンは前の層に完全に接続されており、ネットワークは最大 4 種類の画像情報を分類できる 2 つの出力を生成します。

これらのニューロンの場合、入力はすべて光信号です。

各ニューロンでは、線形計算は光学的に実行され、非線形活性化関数は光電子的に実装されるため、分類時間は 570 ps (= 0.57 ns)未満になります

論文の責任著者である電気技師フィローズ・アフラトゥーニ氏は、このPDNNの性能について次のように説明している。従来のビデオのフレームレートは1秒あたり24~120フレームであるのに対し、PDNNは1秒あたり約18億枚の画像を分類できる。

ここでの PDNN チップ回路はわずか 9.3 mm2 の領域に統合されており、クロック、センサー、または大きなストレージ モジュールは必要ありません。

レーザーがチップに結合され、各ニューロンに光を提供します。チップには 2 つの 5×6 格子カプラが含まれており、それぞれ入力ピクセル アレイとキャリブレーション アレイとして機能します。

ただし、均等に分散された光供給により、各ニューロンに同じ出力範囲が提供され、明らかにより大きな PDNN に拡張できるようになります。

フォトニックDNNチップの画像分類テスト

研究者たちは、このPDNNマイクロチップに手書きの文字を認識するように教えました。

一連の実験により、PDNN チップのバイナリ分類性能がテストされました。分類する必要のあるデータ セットは、合計 216 個の「p」と「d」の文字で構成されていました。

チップの精度は93.8%以上です。 (92.8%+94.9%)/2)

別の一連の実験では、PDNN チップの 4 つのカテゴリのパフォーマンスをテストしました。分類する必要のある文字は合計 432 個で、「p」、「d」、「a」、「t」の 4 つのカテゴリから成るデータ セットです。

チップの分類精度は 89.8% を超えています。

これらの結果は、クラス数が多くても(4 つなど) 、プリンターによる変動やノイズがあっても、PDNN チップは依然として高い分類精度を達成することを示しています。

この PDNN の画像分類精度を従来の DNN と比較するために、研究者らは Keras ライブラリを使用して Python で実装された 190 ニューロンの DNN もテストし、同じ画像で 96% の分類精度を示した。

著者について

論文の筆頭著者である Farshid Ashtiani 氏は、現在ペンシルバニア大学電気システム工学部の博士研究員です。彼の主な研究分野は、光電子ジョイント/ハイブリッド統合システムです。

この論文の他の著者もペンシルバニア大学の電気システム工学科の出身者である。

昨年、日本のNTT研究所の科学者は、フォトニックコンピューティングはニューラルネットワークコンピューティングのエネルギー消費を削減でき、大きな可能性を秘めており、将来的にはディープラーニングの重要な開発目標になる可能性が高いと述べました。

この研究に携わったペンシルバニア大学のエンジニアらは、PDNNの光データの直接かつクロックフリーの処理により、アナログからデジタルへの変換や大容量のメモリモジュールの必要性がなくなり、次世代のディープラーニングシステム向けニューラルネットワークの速度とエネルギー効率が向上すると述べた。

フォトニックディープニューラルネットワークの展望と応用についてどう思いますか?

論文の宛先:

https://www.nature.com/articles/s41586-022-04714-0#article-info

<<:  あなたを偲んで!孫建博士が早朝に逝去されました。AIは偉大な人物を失い、Megviiは技術リーダーを失いました。

>>:  AI が企業のランサムウェア対策やクラウド セキュリティ侵害防止にどのように役立つか

ブログ    
ブログ    

推薦する

科学ニュース: 機械学習による人間のリスク認識のモデル化

[[406948]]人間が意思決定を行うプロセスは、複雑で恣意的であるように見えることもあります。そ...

人工知能技術が教育業界に与える主な影響は何ですか?

今日、人工知能技術は社会のあらゆる分野にますます大きな影響を及ぼしており、教育も例外ではありません。...

ビッグデータとリアルタイム分析のためのアルゴリズム分類

今日、ビッグデータ技術の発展と進歩により、大量のデータを収集および送信するための新しい、より効率的な...

AI企業の成人式:自由が996と衝突し、技術的理想が地上戦争と衝突する

戦争の理由はすべて、例外なく一つのこと、つまり生き残ることにつながります。狼の本能がなければ、生き残...

AIと自動化によるセキュリティの向上

2020年に突如発生した新型コロナウイルス感染症のパンデミックにより多くの従業員が自宅待機を余儀なく...

GPT-4 には意識がありません!しかし、チューリング賞受賞者のベンジオ氏らの88ページの論文は、「スカイネット」が遅かれ早かれやってくることを示唆している。

今日まで人工知能は発展してきましたが、人工知能は意識を持っているのでしょうか?チューリング賞受賞者の...

GPT-4/Gemini は惨敗、旅行ガイド作成の成功率は ≈ 0% です!復旦大学OSUと他の中国チーム:エージェントは複雑なタスクを計画できない

AI エージェントは現在、学界で注目の話題であり、多くの専門家によって大規模モデルの開発における次の...

自動運転車は未来の社会で老後の暮らしをどう変えるのか?

フロリダ州中部にある、約12万5000人の住民を抱えるザ・ビレッジの退職者コミュニティには、約750...

素晴らしい配達でした!インテルビジョン観測室は、実体経済の発展に向けた新たな道を切り開きます|インテルビジョン

5月23日、 「実体経済の新たなエンジンを動かす『中核』のダイナミックエネルギー」をテーマにしたイ...

製薬業界を覆すAIは「仕掛け」か「希望」か?

人工知能 (AI) は、過去 10 年ほどの間に SF の世界から現実の世界へと移行し、地球上のほぼ...

注目の話題 | 3年生が独力でAIモデルを解読

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

SQL Server 2008 の 9 つのデータ マイニング アルゴリズム

1. 決定木アルゴリズム決定木は判断木とも呼ばれ、バイナリ ツリーやマルチ ブランチ ツリーに似たツ...

...