AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これで誰でも画像セグメンテーションを試して遊ぶことができます。

オンライン API では、画像の URL を入力するだけで、対象の背景を自動的に削除できます。

今朝チャンピオンズリーグで優勝したばかりのバイエルンに挑戦してみましょう。

そしてこうなりました。

しかし、この象のように、物事がうまくいかないこともあります。

割れた後...ねえ、もう片方の歯はどこに行ったの?

また、手と猫が同時にいる場合も。

結果は...ちょっと変です。

この新しいアプリケーションは ObjectCut と呼ばれています。Reddit でリリースされると、12 時間で700 回以上のアクセスがありました。

多くのネットユーザーは「すごい!」と言った。

誰でも試せる簡単な3つのステップ

上記の象を例にとると、使用手順は非常に簡単です。

まず、任意の画像を選択し、画像のアドレスをコピーします。

2 番目のステップでは、Web サイトの指定された場所にアドレスを貼り付けて、「エンドポイントのテスト」をクリックします。

数秒待ってから、その横に生成された URL をクリックすれば完了です。

そして、牙のない象になりました。

それはまだ北京大学の卒業生の研究です

この技術はあなたにとって馴染み深いものですか? ほんの数ステップの簡単な操作で画像の背景を削除できます。

これは、実際のオブジェクトをリモートでコンピューターに「コピーして貼り付ける」ことができる以前の AR アプリケーション AR Cut & Paste に似ています。

これら 2 つのアプリケーションの背後にある主なテクノロジーは、BASNet と呼ばれる顕著なオブジェクト検出方法です。

この研究はCVPR 2019の最終候補に選ばれました。論文の筆頭著者は中国人の秦雪斌氏で、今年2月にカナダのアルバータ大学で博士号を取得し、北京大学で修士号を取得しました。

[[339095]]

BASNet のコア フレームワークは下の図に示されており、主に 2 つのモジュールで構成されています。

最初のモジュールは予測モジュールで、U-Net に似た高密度監視エンコーダー/デコーダー ネットワークです。その主な機能は、入力画像から顕著性マップを予測することを学習することです。

2 番目のモジュールは、マルチスケール残差改良モジュール (RRM) です。その主な機能は、残差と実際の値との間の残差を学習することによって予測モジュールによって取得された顕著性マップを改良し、それによって予測モジュールの顕著性マップを改良することです。

BASNetに加えて、一部のネットユーザーは、同じ作者によるものでより良い結果が得られるU2-Netも推奨しています。

彼の研究は「U2-Net: 顕著な物体検出のためのネストされた U 構造の深化」です。

実験結果は次のとおりです。

同じテクノロジー、異なる遊び方。この方法にはどんな興味深い応用があると思いますか?

また、このオンライン画像分割アプリケーションを試してみたい場合は、以下のリンクをクリックしてください。

Webサイト:
https://rapidapi.com/objectcut.api/api/background-removal

<<:  人工知能が話題になって3年。雇用情勢は依然として明るいのか?

>>:  AIアプリケーションのための実用的なフレームワークを構築するための5つのステップ

ブログ    
ブログ    

推薦する

OpenAIはひっそりとその約束を放棄し、大量の社内文書を公開しなくなった

1月25日、人工知能のスタートアップ企業OpenAIは設立以来、常にオープン性と透明性の原則を堅持し...

人工知能の利点をどう生かすか

企業で人工知能が応用され、開発されるにつれて、ビジネスリーダーは市場競争力を向上させるためにクラウド...

テレンス・タオ:私の数学的経験に基づくと、室温超伝導LK-99とその再現は非常に刺激的です

昨今、室温超伝導の再現に対する世界的な熱気は衰えを知らず、さまざまな有力者が自らの見解を表明している...

掃除ロボットはほこりを吸い取るだけでなく、プライバシーも「吸い取る」ことができます

家庭でますます一般的になりつつある掃除ロボットは、ほこりを吸い取るだけでなく、個人のプライバシーも「...

...

CES 2018: 見逃せない 4 つの主要なテクノロジー トレンド

[[214658]] 2週間後、2018 CESがラスベガスで開幕します。今年と同様に、CES 20...

ハイリアンと手を携えてデジタル変革の道を議論する

モバイルインターネットの発展に伴い、企業の生産・運営プロセスで生成されるデータは、これまでにない爆発...

自然災害の予測に関しては、AIはまだ大丈夫でしょうか?

古代から現代に至るまで、自然災害は人類に限りない損失をもたらしてきました。都市社会がますます発展する...

三国志を例に挙げて分散アルゴリズムについて語るのって、気楽なことでしょうか?

[[357046]]序文「三国殺し」は、中国の三国時代を背景に、身分を手がかりにカードを形にした人...

2018 年のビッグデータ、機械学習、人工知能の予測!

AI へのビッグデータ投資は減速の兆しを見せていません。今後 1 年間の予測をいくつかご紹介します...

Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

[[393503]]基本的な紹介マージソートは、マージの考え方を使用するソート方法です。このアルゴ...

清華大学の学生が強化学習プラットフォーム「TianShou」を開発:数千行のコードが完成、オープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Weilingsi チームは、グラフ同型性の下での同変性と高い計算効率を備えた「自然グラフ ネットワーク」メッセージ パッシング メソッドを提案しました。

最近、ウェリングスチームによる研​​究では、グラフの局所的な対称性を研究することで新しいアルゴリズム...

...

2024年はテクノロジー企業の終焉となるでしょうか?報告書:3年後には技術の80%が素人によって提供される

[[405703]]最近、アメリカの有名なテクノロジー調査・コンサルティング会社であるガートナーは、...