XiaomiのFALSRアルゴリズムが正式にオープンソース化され、画像超解像エンジニアリングアプリケーションに大きな進歩をもたらしました。

XiaomiのFALSRアルゴリズムが正式にオープンソース化され、画像超解像エンジニアリングアプリケーションに大きな進歩をもたらしました。

本日、Xiaomi は、弾性探索 (マクロ + ミクロ) に基づく超解像で驚くべき結果を達成した新しい論文を発表しました。このモデルはオープンソース化されたと報告されています。

この論文では、同等の FLOPS で複数のモデルが生成され、その結果が ECCV 2018 スター モデル CARNM (乗算および加算パラメータの数が少ない、PNSR/SSIM 指標が高い、論文では優位とされている) よりも優れていることが示されています。これは、2018 年時点で同等の FLOPS 制約の下での SOTA になるはずです (ICCV 2017 と CVPR2018 をカバー)。この効果を実現するために、この論文では V100 を使用し、3 日もかかりませんでした。この技術には一定の普遍性があり、理論的にはあらゆる教師あり学習に適用できることを指摘しておく必要があります。注目と研究に値する技術です。

さらに、この論文ではいくつかの将来モデルも提示されています。前回の論文では、彼らの予備結果が CVPR 2016 を上回り、わずか半月で大きな進歩を遂げたことを知っておく必要があります。これは、Automl NAS テクノロジーの威力と素晴らしさをさらに証明しています。

論文アドレス: https://arxiv.org/pdf/1901.07261v2.pdf

画像超解像再構成技術とは?

画像超解像再構成技術とは、1 つまたは複数の低解像度画像から対応する高解像度画像を再構成することを指します。主に2つのカテゴリに分けられます。1つは、1枚の低解像度画像から高解像度画像を再構築することです。 2つ目は、複数の低解像度画像から高解像度画像を再構築することです。ディープラーニングに基づく SR は、主に単一画像の再構成手法に基づいています。その応用分野は軍事、医学、地理学など非常に広範囲にわたります。

超解像度再構成は、ノイズ除去、グリッド除去、ぼかし除去などの問題に似ています。低解像度の画像の場合、それに対応する高解像度の画像が複数存在する可能性があるため、高解像度画像を解くときに正規化制約を実行するために事前情報が追加されるのが一般的です。従来の方法では、この事前情報が最初に学習されるのが通常です。ディープラーニングに基づくSR方式は、ニューラルネットワークを介して低解像度画像から高解像度画像までエンドツーエンドの学習を直接実行します。

<<:  AIは奥が深いので、早く田舎へ行きましょう

>>:  これほど長い時間が経ったのに、なぜ物流ロボットは何千もの家庭に導入されていないのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

顔認識技術のまとめ:従来の方法からディープラーニングまで

1970 年代以来、顔認識はコンピューター ビジョンと生体認証の分野で最も研究されているトピックの ...

世紀の奇跡!華中科技大学の師弟が世界で初めて韓国の常温超伝導磁気浮上を再現、アメリカン・スーパーコンダクターは取引セッション中に150%急騰

人類は物質とエネルギーの新しい時代を迎えようとしているのでしょうか?未来のテクノロジーへの扉が開かれ...

科学者たちは古い携帯電話を分解してリサイクルするためのAI搭載ロボットを開発している

2016年、AppleはiPhoneを11秒で分解できるリサイクルロボット「Liam」を開発したと発...

LeCun、Zhou Zhihua、Kai-Fu Leeらは2020年にAIに何を期待しているのでしょうか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

北京の自動運転路上試験、安全走行距離が300万キロ超え

IT Homeは5月30日、新華社通信が伝えたところによると、記者が29日に北京市インテリジェント車...

画像類似性比較 CLIP または DINOv2

人工知能の分野において、コンピューター ビジョンの 2 大巨頭は CLIP と DINOv2 です。...

...

...

コンシステントハッシュアルゴリズムの詳細な説明

サーバー負荷分散を行う際には、ラウンドロビン、HASH、最小接続、応答時間、加重など、さまざまな負荷...

機械学習の時代に神経科学者はいかにして人間の思考を読み取り解読できるか

[[408373]]この記事では主に機械学習 (ML) と機能的磁気共鳴画像法 (fMRI) の応用...

ビル・ゲイツ:AIは教育と医療の向上に活用されるべき

[[260198]]米テクノロジーメディアCNETによると、マイクロソフトの共同創業者で慈善家のビル...

Golang と OpenCV ライブラリ: 顔認識を実装するには?

Go 言語で顔認識を実装するには、通常、OpenCV ライブラリを使用する必要があります。 Go ...

PyTorch がトップカンファレンスを席巻: CVPR 論文は TensorFlow の 4 倍を占める

オープンソース フレームワークの分野では、PyTorch と TensorFlow の間で常に議論が...

GPT-4はバードに追い抜かれても納得せず、最新モデルが市場に投入された

「ビッグモデル予選コンペティション」チャットボット アリーナの公式リストが更新されました: Goog...