AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これで誰でも画像セグメンテーションを試して遊ぶことができます。

オンライン API では、画像の URL を入力するだけで、対象の背景を自動的に削除できます。

今朝チャンピオンズリーグで優勝したばかりのバイエルンに挑戦してみましょう。

そしてこうなりました。

しかし、この象のように、物事がうまくいかないこともあります。

割れた後...ねえ、もう片方の歯はどこに行ったの?

また、手と猫が同時にいる場合も。

結果は...ちょっと変です。

この新しいアプリケーションは ObjectCut と呼ばれています。Reddit でリリースされると、12 時間で700 回以上のアクセスがありました。

多くのネットユーザーは「すごい!」と言った。

誰でも試せる簡単な3つのステップ

上記の象を例にとると、使用手順は非常に簡単です。

まず、任意の画像を選択し、画像のアドレスをコピーします。

2 番目のステップでは、Web サイトの指定された場所にアドレスを貼り付けて、「エンドポイントのテスト」をクリックします。

数秒待ってから、その横に生成された URL をクリックすれば完了です。

そして、牙のない象になりました。

それはまだ北京大学の卒業生の研究です

この技術はあなたにとって馴染み深いものですか? ほんの数ステップの簡単な操作で画像の背景を削除できます。

これは、実際のオブジェクトをリモートでコンピューターに「コピーして貼り付ける」ことができる以前の AR アプリケーション AR Cut & Paste に似ています。

これら 2 つのアプリケーションの背後にある主なテクノロジーは、BASNet と呼ばれる顕著なオブジェクト検出方法です。

この研究はCVPR 2019の最終候補に選ばれました。論文の筆頭著者は中国人の秦雪斌氏で、今年2月にカナダのアルバータ大学で博士号を取得し、北京大学で修士号を取得しました。

[[339095]]

BASNet のコア フレームワークは下の図に示されており、主に 2 つのモジュールで構成されています。

最初のモジュールは予測モジュールで、U-Net に似た高密度監視エンコーダー/デコーダー ネットワークです。その主な機能は、入力画像から顕著性マップを予測することを学習することです。

2 番目のモジュールは、マルチスケール残差改良モジュール (RRM) です。その主な機能は、残差と実際の値との間の残差を学習することによって予測モジュールによって取得された顕著性マップを改良し、それによって予測モジュールの顕著性マップを改良することです。

BASNetに加えて、一部のネットユーザーは、同じ作者によるものでより良い結果が得られるU2-Netも推奨しています。

彼の研究は「U2-Net: 顕著な物体検出のためのネストされた U 構造の深化」です。

実験結果は次のとおりです。

同じテクノロジー、異なる遊び方。この方法にはどんな興味深い応用があると思いますか?

また、このオンライン画像分割アプリケーションを試してみたい場合は、以下のリンクをクリックしてください。

Webサイト:
https://rapidapi.com/objectcut.api/api/background-removal

<<:  人工知能が話題になって3年。雇用情勢は依然として明るいのか?

>>:  AIアプリケーションのための実用的なフレームワークを構築するための5つのステップ

ブログ    
ブログ    

推薦する

自動車業界における人工知能の活用方法

[[431746]]自動車業界は、新しい技術の最前線に立つことが多いです。業界では数十年にわたって組...

...

Llama-2+Mistral+MPT=? 複数の異種大規模モデルの融合が驚くべき結果を示す

LLaMA や Mistral などの大規模言語モデルの成功により、大手企業やスタートアップ企業は独...

Zhiyuan が最も強力なセマンティック ベクトル モデル BGE をオープンソース化しました。中国語と英語の評価はあらゆる面でOpenAIとMetaを上回る

セマンティック埋め込みモデルは、検索、推奨、データマイニングなどの重要な分野で広く使用されています。...

機械学習の概念をインタラクティブに学習できる 5 つの視覚化 Web サイト

多くの人が理解していない点の 1 つは、機械学習アルゴリズムが舞台裏でどのように機能するかということ...

わずか1行のコードでモデルを数秒でAPIに変換でき、TensorFlowなどのフレームワークをサポートしています。

[[283641]]機械学習モデルを API にパッケージ化することにまだ不安がありますか?このツ...

マイクロソフトが積極的に顔認識データベースを削除した秘密は何でしょうか?

1. マイクロソフトはひそかに顔認識データベースを削除したマイクロソフトは、同社最大の公開顔認識デ...

...

インターネットで話題! 23歳の中国人医師が22歳の歴史的弱点を治す、ネットユーザー「この話はいいね」

最近、別の若い中国人男性が、22年間存在していたバグを修正したことでインターネット上で人気を博した。...

人工知能の時代において、女の子が将来勝てるようにするために親はどのような教育理念を持つべきでしょうか?

私は二人の女の子の母親です。親は子供に何でも良いものを残そうとすると言われていますが、子育ての過程で...

Go 言語アルゴリズムの美しさ - 高度なソート

[[415242]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...

Minecraft でニューラル ネットワークを構築し、操作プロセスを明確に表示する | オープン ソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Python+OpenCVを使用して顔追跡を実装するための50行のコード

こんにちは、親愛なる友人の皆さん、またお会いできて嬉しいです。私はただ興味本位でこのToutiaoア...

専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

2018年にバイトダンスがカラオケアプリ「Musical.ly」を買収し、TikTokとしてブランド...

工業情報化部:中国初の個人情報保護AIモデル「智慧」アシスタントをリリース

2月29日、工業情報化省は2023年第4四半期の電気通信サービスの品質に関する通知を発行した。通知で...