今年のAI論文は8つの分野でブレークスルーを達成。ビデオブロガーが最も好まれ、国境を越えた出力が非常に流行している。

今年のAI論文は8つの分野でブレークスルーを達成。ビデオブロガーが最も好まれ、国境を越えた出力が非常に流行している。

[[435319]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

自動運転、画像生成、2Dから3Dへの変換...

2021 年に最も人気のある AI 論文はどれですか?最も画期的な論文はどれですか?

最近、ÉTS の大学院生であり YouTube ブロガーでもある人物が、今年の最新の AI ブレークスルーのリストを、ビデオ、記事、コードを含めてまとめました。

8つのカテゴリーに分けてみましたので、一緒に見ていきましょう〜

ビデオブロガーの皆さん、ぜひご覧ください

私たちが最もよく整理したのは、ビデオブロガーにとって有益ないくつかのテクニックです。

例えば、このTimeLensはスローモーション動画を制作することができ、最大範囲を元の30フレームから900フレームまで拡張することができます。

もう 1 つの例は、数秒以内に 1 つのビデオから多様なコンテンツを生成できる編集ツール VGPNN です。

人物の削除や追加、背景の変更、時間の延長、アスペクト比や解像度の変更などの機能はすべて、その前にある基本的な操作です。

背景や他のオブジェクトに影響を与えずに画像内のオブジェクトを移動したり、AIを使用して現実世界の音、声、音楽、効果音を分離したりすることもできます...

具体的には、画質処理に関して、Intel は今年、NVIDIA グラフィックス カードを使用して画質向上パッチを作成しました。今年 6 月、このデモはインターネット全体で人気を博しました。

GTA での効果をよりリアルにするために、研究者はビデオの 3 つの特徴を変更しました。車の光沢を増し、植生の全体的な外観を改善し、アスファルト道路をより滑らかに見せました。

これに対して、一部のネットユーザーは、これはパス追跡よりもはるかに安価だと述べた。

猛威を振るう伝染病によってビデオ会議が普及したのなら、ビデオ会議ソフトウェアによって背景置換技術が最前線に登場したことになります。

Google の研究者は、ポートレートの背景を置き換えるために Total Relighting と呼ばれる再照明手法を提案しました。

新しく追加されたシーンの照明に基づいてポートレートを再照明し、よりリアルに見せることができます。

この方法は、映画やプロのビデオ制作にもさらに拡張でき、アップローダーによって使用できます。

背景の置き換えだけでなく、テキストの置き換えもあり、スタイルは保持されます。

今年、Facebook は同じスタイルに従って、画像内のテキストを直接翻訳または編集できる AI モデルを開発しました。

これに似てる〜

DALL·Eが主導する画像生成

画像生成の分野で最も画期的なものは、OpenAIが新年に発表した「AIデザイナー」 DALL·Eであり、アンドリュー・ン氏はこれを賞賛した。

簡単に言えば、テキスト要件を提示すると画像が生成されます。原理的には、テキストから画像への合成の方向における GPT-3 の拡張バージョンに似ています。

たとえば、「OpenAI 会社のファサード」と入力すると、選択できる設計図が 12 点以上表示されます。

手描きのスケッチから画像を生成したり、確率微分方程式を使用して画像を合成および編集したりするなどの進歩もあります。

2D画像から3Dモデルを生成する

画像生成に加えて、これは 2021 年の AI 分野におけるもう 1 つの非常にホットな研究方向です。

現実世界の物体の写真を撮り、それを 3D 形式にしてビデオやゲームに挿入できたらどんなに素晴らしいか想像してみてください。

Google Research が提案した ShaRF は、たとえば椅子のランダムな写真を撮ることでこれを実現できます。

NVIDIA も同様のソリューションであるGANverse3Dを提案しており、これは 1 つの画像だけでカスタマイズ可能な 3D アニメーションを作成できるものです。

以前インターネットで流行った偽の 3D シーンもあり、これも一連の写真でレンダリングされています。

そして、LASR モデル - 短いビデオからオブジェクトを選択し、人間または動物の 3D モデルを作成します...同様の方法はたくさんあります。

トランスフォーマーであらゆるものを組み合わせることができます

CNN と Transformer を組み合わせることを考えたことはありますか?

2021年、AI分野では「国境を越えたアウトプット」がトレンドとなっている。

CNN の効率性と Transformer の表現力に基づいて、ドイツのハイデルベルク大学の研究者が高解像度画像生成の方法を提案しました - Tl;DR。

CNN と Transformer だけではありません。

スタンフォード大学と Facebook の研究者は、StyleGAN2 アーキテクチャの Transformer の注目メカニズムを使用してシーン画像を生成するGANsformers を提案しました。

アプリケーション層: 試着室、天気予報

さらに、元のモデルに基づいてアプリケーション レベルで拡張されています。

Google が StyleGAN2 アーキテクチャに基づく改良版を提案し、AI オンライン試着室を作成したのと同じです。

自分の画像を提供するだけで、どんな服でも自動的に試着できます。

バルセロナ大学には、空中写真から浮遊ゴミを自動検出し、その量を数えることができるディープラーニングベースのシステムを開発した研究者もいる。

[[435325]]

この目的のために、彼らはユーザーが海面画像でこれらのゴミを識別できるようにするアプリも作成しました。

Appleはまた、iOS 15でプライベート写真に写っている人物を自動的に識別するためにフォトアルバムに適用されるMLアルゴリズムを提案した。DeepMindは、レーダーを使用して天気をより正確に予測する深層生成モデルを提案した。

AI搭載サイバーパンクアーム

ミネソタ大学の研究者らは、AIを搭載した神経インターフェースであるサイバーパンクアームを開発した。

切断患者は普通の人と同じように腕を巧みにコントロールできると報告されている。

プログラミング成果物: GitHub Copilot

開発者にとって、今年最も画期的な開発は、GitHub と openAI が共同で開発したプログラミング アーティファクト、 GitHub Copilotです。

実行したいコマンドを記述するだけで、対応するコードが生成されます。

プログラマーがコメントを書くだけの場合でも、Github Copilot は残りのコードを完成させ、改善の提案をしてくれるので、プログラマーの検索時間を大幅に節約できます。

テスラのオートパイロット

今回、テスラの自動運転も選ばれたのは特筆すべき点だ。

テスラの AI デーでは、人工知能担当ディレクターの Andrej Karpathy 氏が、テスラが 8 台のカメラを使用して画像を取得し、道路をナビゲートする方法を実演しました。

これには、データの圧縮や 2 次元出力から 3 次元出力への変換などの操作が含まれます。

さらに、人工知能の第3波に直面して、研究者たちはAIにおける速さと遅さについて考えています。AIは「タンタン」に似た個人プロファイルを偽造して、人間が右にスワイプするかどうかを探ります。TransformerはCV分野でどのようにCNNに取って代わりますか?

ご興味がございましたら、以下のリンクをクリックして詳細をご覧ください〜

まだ更新中です。

GitHub リンク:
https://github.com/louisfb01/best_AI_papers_2021

<<:  中国の博士が強化学習を使ってSpaceXのロケットを回収

>>:  「ICV革新的アルゴリズム研究タスク」が正式にリリースされました!登録は11月18日に開始されます

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

チャットボットをよりエレガントに設計する方法

AI アルゴリズムの人気により、近年会話型ロボットの人気が高まり、あらゆる分野で推進され、使用されて...

Microsoft XiaoIce がスピンオフしました!沈向陽氏が会長に就任、「小氷の父」がCEOに就任、中国での事業化を目指す

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

少数ショット学習における SetFit によるテキスト分類

翻訳者 |陳俊レビュー | Chonglouこの記事では、「少量学習」の概念を紹介し、テキスト分類で...

...

DeepMind: 畳み込みネットワークは ViT ほど優れていないと誰が言ったのですか?

ディープラーニングの初期の成功は、畳み込みニューラル ネットワーク (ConvNet) の開発による...

ビジョンと AI を追加することで、産業用ロボットはスマート製造をより効果的に支援できるでしょうか?

改革開放から30年、中国は科学技術の進歩の分野で非常に重要な役割を果たしてきました。人口ボーナス、政...

英国のサイバーセキュリティ機関がAIにおける大規模言語モデルのリスクを警告

英国の国家サイバーセキュリティセンター(NCSC)は、AIを活用した大規模言語モデル(LLM)を企業...

蜀のAI教育への道はどれほど危険か

19 世紀頃、イギリスの実証主義哲学者で社会学者の H. スペンサーは、「教育論」の中で、イギリスの...

...

アメリカの医師は新型コロナウイルスと戦うために人工知能をどのように活用しているのか

昨年、新型コロナウイルス感染症のパンデミックが始まったとき、クリーブランド・クリニックの医師で最高研...

ブロックチェーンにおける主流のコンセンサスアルゴリズムの簡単な分析

プルーフ・オブ・ワーク最も一般的なブロックチェーンのコンセンサス アルゴリズムは、ビットコインのプル...

インタビュアー: よく使用する暗号化アルゴリズムについて教えてください。

[[335623]]暗号化アルゴリズムは、一般的に、可逆暗号化と不可逆暗号化に分けられます。可逆暗...

業界のハイエンド複合AI人材を育成するために、第5回AICAチーフAIアーキテクトトレーニングプログラムが開始されました。

10月15日、国家深層学習技術応用工学研究所と百度が共同で開始した第5回AICAチーフAIアーキテ...

機械学習が自閉症の「非コード変異」の秘密を解明

新たな研究によると、遺伝子間の自然発生的な突然変異は、生まれつきの遺伝子と同じくらい自閉症において重...

3DES 暗号化アルゴリズムは S/MIME プロトコルに最適な選択肢でしょうか?

Q: S/MIME プロトコルでは 3DES 対称暗号化はどのように実装されていますか? A:実際...