トレンド検索No.1! B駅のアップマスターはAIを使って李大昭、陳延年らを笑顔にした

トレンド検索No.1! B駅のアップマスターはAIを使って李大昭、陳延年らを笑顔にした

[[408814]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

このニュースはかつてWeiboのトレンド検索リストのトップに上がった。

AIの回復は李大昭と陳延年を笑顔にした。

[[408815]]

多くのネットユーザーを感動させたシーンとは?

見てください、これが李大昭と王金美です:

李大昭は処刑されたとき38歳だった。王金美(本名は王瑞軍)は、病気で亡くなったとき27歳だった。

陳延年と鄧忠夏です。

陳延年氏は亡くなったとき29歳だった。鄧忠霞は処刑されたとき39歳だった。

この事態を受けて、人民日報の公式Weiboアカウントは次のように述べた。

あなたが笑う瞬間はとても感動的です。今日の中国はあなたが望む通りのものです!

そして数え切れないほどのネットユーザーも感動した。

「旅に出た者は決して振り返らず、自分の血肉を使う者は永遠に国を守るだろう。」

すべての英雄に敬意を表します。この繁栄の時代こそがあなたがたの望むものです。

1世紀にわたり、偉人と遠くから対峙

この瞬間、AI技術を駆使して、革新的な先人たちを画面の前の私たちに笑顔で見せてくれたのが、B局アップマスター大谷だった。

この裏話は何ですか?大谷さんと交流しました。

[[408816]]

Quantum位: 「Make Them Smile」のようなプロジェクトをやろうと思ったのはなぜですか? 当初の意図は何ですか?

大谷:実はこのプロジェクトは、年配の世代が中国が自分たちの望み通りに発展したのかどうかを知ることができる、一種の対話と視線(時空を超えた)のようなものなのです。

中国は、貧しく弱く、なすべきことが多かった時代から、徐々に繁栄し強くなり、現在の段階に至りました。これは簡単ではないので、このトピックを選択しました。

Quantum Bit : AI修復の意義と価値とは?

大谷向こう岸まで5分という概念だと思います。

つまり、この複雑な現代社会において、5分ほど時間を取って古代の映像や過去の影響を見て、古代の人々がどのように暮らし、何を考えていたかを知ることができるかもしれません。

レンズを通してお互いを見つめると、あなたが私を見て、私があなたを見ると、違った考えが生まれるかもしれません。

私が修復したコンテンツは、他の人にもっと努力するよう促す役割を担っています。おそらく視聴者100人のうち1人か2人がこの動画を通じて歴史や文化に興味を持ち、歴史業界に参入し、より多くの人が中国文化を理解できるようになるでしょう。

Quantum Bit :李大昭や他の偉人たちを復活させる準備はいつから始めましたか?どれくらい時間がかかりましたか?

大谷:今回の修復作業は人民日報と共同で行いました。私は主にプロジェクトのAI修復部分を担当しました。スケジュールが厳しかったため、完成までに約20〜30時間かかりました。

Quantum位:中国共産党創立100周年を機に、読者に何か伝えたいことはありますか?

大谷:星を見上げて、地に足をつけて。星空の向こう側を見ながら、着実に前に進んでいきます。

科学技術の発展に伴い、ますます多くの新技術が数千の家庭に浸透するでしょう。私たちも先人の精神を受け継ぎ、探求を続け、私たちの能力を活用して社会にとって有意義なことを行っていきます。

今回大谷が復元した革命の先人たちの笑顔には、

夏明寒は処刑されたとき28歳だった。項静宇は処刑されたとき33歳だった。

方志民は処刑されたとき36歳だった。趙一曼さんは亡くなったとき31歳だった。

董存瑞は亡くなったとき19歳だった。

龍華城を攻撃する戦いの決定的な瞬間、彼はためらうことなく左手で爆薬箱を掲げ、右手で導火線に火をつけ、叫んだ。

新しい中国に突撃せよ!

AI復元技術により9人の英雄たちの笑顔が再現され、彼らの目には決意と肯定が表れていた。

燃えている、本当に燃えている。

AIはどのようにして李大昭や陳延年のような人を笑顔にできるのでしょうか?

AIはどのようにして李大昭や陳延年のような殉教者たちを再び笑顔にできるのでしょうか?大谷氏自身によると、今回使用した主なAIプロジェクトは以下の通り。

  • GPEN;
  • ライフ;
  • DeOldify、Deep Exemplar ベースのビデオカラー化。
  • アートブリーダー;
  • トパーズラボ。

今回、大谷さんは主にアリババのオープンソースプロジェクト「GPEN」を高解像度顔補正に利用して顔写真を修復した。

GPEN は、古い写真のぼやけた顔を鮮明にするだけでなく、白黒ポートレートをカラー写真に変換することもできます。

GPEN は GAN prior embedded network の略で、GAN prior embedded network です。

簡単に言えば、GAN 事前ネットワークはディープ ニューラル ネットワーク (DNN) に埋め込まれ、そこから微調整されます。

GPEN モデルは、顔の復元に関して他の GAN モデルよりも大幅に優れていることがわかります。

RIFE は、Megvii と北京大学によって提案されたリアルタイム中間フロー推定アルゴリズムです。

ビデオ フレームの補間に使用すると、アーティファクトを改善し、ビデオをよりスムーズにすることができます。

DeOldify と Deep Exemplar ベースのビデオカラー化は、画像のカラー化に使用される 2 つのテクノロジーです。

DeOldify は NoGAN テクノロジーに基づいており、ビデオの色付けの安定性を保証します。たとえば、ビデオ内の同じ衣服が複数の色に変換されることはありません。

また、カラーリング時間の一貫性と安定性を確保するために、Deep-Exemplar ベースのビデオカラー化も行われます。

顔生成用のArtbreederもあります。

Artbreeder では、ユーザーはスライダーを調整することで、さまざまなスタイルの肖像画やアニメーションを作成できます。

また、機械学習技術とトライマップ技術に基づく超解像技術のTopaz Labsは、写真の解像度を高め、ピクセルの詳細を補完します。

マスクの追加、AI による色とディテールの強化、AI によるノイズ低減、ロスレス拡大などの機能を提供します。

大谷氏を知る友人たちは、彼がこれまでに100年前の北京のビデオブログなど、AIで復元した作品を数多く制作してきたことを知っている。

数日前、私はこれらの手法を試して、1930 年代の梅蘭芳の崑曲オペラ「刺虎」の一部を復元しました。

いわゆる周囲を見回すというのは、次のようなことです。

数フレーム撮るだけで、クラシックなものが見つかります。

<<:  AI特許出願件数は世界第1位で、世界総出願件数の約4分の3を占める。

>>:  自動運転車にLIDARはなぜ必要ないのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

マルウェアの検出と分類にディープラーニングが広く利用されている理由

人工知能 (AI) は進化を続けており、過去 10 年間で驚異的な進歩を遂げてきました。ディープラー...

UdeskブランドアップグレードWofeng TechnologyはAIコア技術を深化させ、5つの主要製品ラインでトップ1または2戦略を全面的に推進

6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...

SurfelGAN でメタバースを作成する車の脳を訓練するためにシムシティを立ち上げるお金がないからですか?

自動運転はディープラーニングの重要な応用分野です。長年にわたる蓄積の結果、現在では科学研究者が AI...

...

これはオートエンコーダーとRNNの両方である。DeepMindの科学者は拡散モデルを8つの観点から分析する。

最も人気のある AI ペイント ツールの 1 つである Stable Diffusion を試したこ...

PaddlePaddle を使用してオブジェクト検出タスクを実装する - Paddle Fluid v1.1 の詳細なレビュー

【51CTO.comオリジナル記事】 1. はじめに11月1日、BaiduはPaddle Fluid...

人間の言語を話せる人工知能はより価値がある

[[187065]]ここ数年でビッグデータが徐々に登場してきました。しかし、TDWI の調査によると...

...

機械学習プロジェクト用の Python インターフェースを設計する方法

序文機械学習プロジェクトを実行するには、まずモデルを(ほとんどの場合は予測 API として)デプロイ...

3分レビュー:8月の自動運転業界の完全な概要

[[426135]]チップ不足と疫病の影響により、今年初めから自動運転産業の発展は減速を余儀なくされ...

新しいマルチモーダル大型モデルがリストを独占!画像とテキストの混合入力をサポートしているので、知識がわからなくても学習できます

マルチモーダル大型モデルファミリーに新しいメンバーが加わりました!複数の画像とテキストを組み合わせて...

...