マイクロソフトのオープンソースAIツールが古い写真に新たな命を吹き込む

序文

GitHub Hot Trends Vol.046では、HGがMicrosoftのオープンソースAIツール「Bringing-Old-Photos-Back-to-Life」を紹介しました。

傷んだ古い写真に新たな命を吹き込むことができ、今週は 3,000 個近くの星を獲得しました。この記事は、プロジェクトチームメンバーのZiyu WanがHacker Newsに掲載したプロジェクト紹介です。お楽しみください〜

概要

私たちはディープラーニングの手法を使って、劣化した古い写真を復元するつもりです。従来の教師あり学習による復元タスクとは異なり、実際の写真の経年劣化はより複雑であり、合成画像と実際の古い写真との間のドメインギャップにより、ネットワークは一般化できません。そこで、実際の写真と多数の合成画像ペアの両方を活用する、新しいトリプルドメイン翻訳ネットワークを提案します。具体的には、2 つの変分オートエンコーダ (VAE) をトレーニングして、古い写真ときれいな写真をそれぞれ 2 つの潜在空間に変換します。ペアになったデータを合成して、2 つの潜在空間間の変換を学習します。コンパクトな潜在空間ではドメインギャップが閉じられているため、この翻訳ネットワークは実際の写真にうまく一般化できます。

さらに、古い写真に混在する複数の劣化問題に対処するために、傷やほこりなどの構造的欠陥を処理するための部分的な非ローカルブロックを備えたグローバルブランチと、ノイズやぼやけなどの非構造的欠陥を処理するためのローカルブランチを設計します。 2 つのブランチは潜在空間で融合され、複数の劣化問題から古い写真を回復する能力が向上します。この方法は、写真の復元の視覚的な品質の点で既存の方法よりも優れています。

アーキテクチャの概要

まず、2 つの変分オートエンコーダ (VAE) をトレーニングします。VAE1 は実際の写真 r ∈ R と合成画像 x ∈ X 用で、敵対的識別器を共同でトレーニングすることでドメインギャップを狭めます。VAE2 はクリーンな画像 y ∈ Y 用です。 VAE は、画像をコンパクトな潜在空間に変換するために使用されます。
破損した画像から、コンパクトな潜在空間内の部分的な非ローカルブロックを含むクリーンな写真へのマッピングを学習します。

比較表

修復の詳細

クローズアップ表示

チームメンバーの Ziyu Wan が Bringing-Old-Photos-Back-to-Life の紹介を翻訳しました。興味のある方はぜひ試してみてください。プロジェクトのアドレスは次のとおりです。

 https://github.com/microsoft/古い写真を復活させる

<<: すべてのプログラマーが知っておくべきソートアルゴリズムトップ10

>>: 今後数年間の AI 求人市場はどのようになるでしょうか?

マイクロソフトのオープンソースAIツールが古い写真に新たな命を吹き込む

序文

概要

アーキテクチャの概要

比較表

修復の詳細

クローズアップ表示

AIがサイバーセキュリティにできること、できないこと

労働者は一生懸命働かなければなりません！ AI仮想人間が労働力に参入しようとしている

データ分析とAIのミスが原因の注目度の高い事件9件

洪水期に緊急通信を確保するにはどうすればよいでしょうか?ドローンは誰もが好む新たな力となる

テスト効率が2倍になりました!第2回NCTS中国クラウドテストサミットがAIテストの新たなパラダイムを切り開く

2018年のAIトレンドはこちら

アフリカはパンデミックの最中に包括的な接続性を構築しており、明確な投資方針を持っている

AIビッグモデルにおける言語の不平等：英語は最も安価、他の言語ははるかに高価

推薦する

外国メディアが報じたところによると、EUはデータプライバシーを弱めるため、エンドツーエンドの暗号化にバックドアを検討している。

ワンクリックで漫画に変身！流行のDouyin特殊効果の背後にある技術

70億のオープンソース数学モデルがGPT-4に勝利、中国チーム

分散ストレージシステムのデータ分散アルゴリズムを簡単に見てみましょう。

プログラマーでなくてもわかる「機械学習」の原理

デジタルマーケティング: AI はどのようにして人間の行動パターンを「見抜く」のでしょうか?

GPT-4 の推論はより人間的です!中国科学院は「思考コミュニケーション」を提唱、類推思考はCoT、プラグアンドプレイよりも優れている

マスク氏はテスラ向けにChatGPTをカスタマイズする予定

動的ベンチマークDynabenchがリリースされました。Facebookは人間を使って人工知能を「尋問」したいと考えています

まだ NeRF に取り組んでいますか?リアルタイムレンダリングでリアルな自動運転データを生成！ストリートガウス：すべての SOTA を超えよう！

人工知能は「新たな生産要素」である

人工知能時代に対応するための知識と技術の蓄積を向上させる