Google Brain の最新の操作は「レトロ」: 畳み込み注意は不要、画像分類は SOTA に近い

Google Brain の最新の操作は「レトロ」: 畳み込み注意は不要、画像分類は SOTA に近い

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

Google Brain の Visual Transformer チーム (ViT) がレトロなものを作りました。

彼らは畳み込みニューラルネットワーク(CNN)やトランスフォーマーを使用せず、初期の AI ビジョンタスクで採用された多層パーセプトロン(MLP)構造のみに依存して SOTA に近いパフォーマンスを達成し、ImageNet 画像分類タスクで 87.94% の精度を達成しました。

このアーキテクチャはMLP-Mixerと呼ばれ、2 つの異なるタイプの MLP レイヤーを使用します。これは、チャネルミキシング(ビット単位の操作)に 1×1 畳み込みを使用し、文字ミキシング(クロスビット操作) に完全な受容野とパラメータ共有を備えた単一チャネルの深い畳み込みを使用する特別な CNN と見ることができます。

JFT-300Mデータセットで事前トレーニングされ、224解像度に微調整されたMixer-H/14バージョンは、 86.32％の精度を達成しました。これは、SOTAモデルViT-H/14よりもわずか0.3％低いですが、実行速度は2.2倍です。

論文の宛先:
https://arxiv.org/abs/2105.01601

プロジェクトアドレス:
https://github.com/google-research/vision_transformer/tree/linen

<<: seq2seq モデルよりも 90 倍高速です。 Google、新しいテキスト編集モデルFELIXを発表

>>: 映画品質の CG レンダリングを作成しましょう!スタンフォード大学の研究者がニューラル光学レンダリングを提案

集中治療室における人工知能の未来

集中治療室における人工知能の未来

ブログ

高速微分ソートアルゴリズム、カスタムC++、CUDAのパッケージで、パフォーマンスが向上しました。

高速微分ソートアルゴリズム、カスタムC++、CUDAのパッケージで、パフォーマンスが向上しました。

ブログ

AIが観測性を高める方法

AIが観測性を高める方法

ブログ

WeBank AI 主任科学者 NeurIPS の論文で「最新のニューラルネットワーク盗難防止技術」が明らかに

WeBank AI 主任科学者 NeurIPS の論文で「最新のニューラルネットワーク盗難防止技術」が明らかに

ブログ

脳とコンピューターのインターフェースのための新しい「接着剤」が発明され、人間と機械の融合「サイボーグ」における新たな進歩がもたらされる

脳とコンピューターのインターフェースのための新しい「接着剤」が発明され、人間と機械の融合「サイボーグ」における新たな進歩がもたらされる

ブログ

開発者にとって必須の 5 つの AI ツール、お見逃しなく!

開発者にとって必須の 5 つの AI ツール、お見逃しなく!

ブログ

フィンテックの台頭：アルゴリズムが決済業界をどう変えるかデータセットの分析は最初のステップに過ぎない

フィンテックの台頭：アルゴリズムが決済業界をどう変えるかデータセットの分析は最初のステップに過ぎない

ブログ

スタンフォード大学の新刊「Decision Algorithms」が発売され、400ページを超える全文PDFが無料でダウンロードできます！

スタンフォード大学の新刊「Decision Algorithms」が発売され、400ページを超える全文PDFが無料でダウンロードできます！

ブログ

認知システムが機械学習とセマンティック技術を組み合わせるべき理由

認知システムが機械学習とセマンティック技術を組み合わせるべき理由

ブログ

電子商取引検索アルゴリズム技術の進化

電子商取引検索アルゴリズム技術の進化

ブログ

推薦する

2019年、AIバブルは崩壊寸前

[[256693]]中国工業情報化部傘下の中国情報通信研究院によると、2018年上半期の世界の人工知...

PyTorch ライブラリの 95% がこのバグの影響を受けます。テスラのAIディレクターも例外ではなかった

[[393110]]この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI...

機械学習を拡張するための5つのポイント

Facebook は効果的な人工知能について私たちに多くのことを教えてくれます。最近のガートナー社の...

10,000台以上のカメラが他人の家に接続されています。ネットワーク障害により中断と再起動が発生し、公式の責任はサードパーティのキャッシュライブラリに帰せられました。

自宅に設置したカメラにシステム障害が発生し、他人にプライバシーが「覗き見」されてしまう――心配してい...

...

倉庫の自動化は人気が高い。ソフトバンクは28億ドルを投じてオートストアの40％を買収した。

ソフトバンクグループは、ノルウェーの倉庫自動化企業オートストアの株式40％を28億ドルで買収すること...

人工知能の最初のグループが解雇された

全世界を置き換えると叫んだ人工知能は、ついに失業という苦境に陥った。スウェーデンのオンライン銀行であ...

GoogleのチーフAIサイエンティスト、フェイフェイ・リーがスタンフォード大学のAIラボを離れ、再び戻る可能性

BI中国語ウェブサイトが6月28日に報じた。グーグルの主任人工知能（AI）科学者、フェイフェイ・リー...

トップカンファレンスで新たな AI 技術が登場: リアルな 3D 顔を生成できるのは顔写真だけ

写真しかない場合、どのようにして人物のリアルなデジタルアバターを作成するのでしょうか? 2020年の...

核酸の結果を数えるのは難しいですか？復旦大学の博士課程の学生の活動が人気に

核酸レポートの手動検証は時間がかかり、面倒で、エラーが発生しやすくなります。どうすればよいでしょうか...

「AI＋コンピューティングパワー」が海外企業に「活力」を与えた

海外に進出する企業は、さまざまな市場のニーズをより正確に理解し、適応するために、大量の国境を越えたデ...

...

...

...

ついにビッグデータ、機械学習、データサイエンスをわかりやすく説明する人が出てきた

データの爆発的な増加とその利用可能性は、人工知能 (AI) の発展を促進しました。人工ニューラルネ...