謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

[[410798]]

FaceAppの人気は過ぎ去り、最近では、あなたの顔を数秒で「ディズニー」に変身させることができる別のアプリが世界中のソーシャルネットワークで人気を集めています。

「AIによる顔の変形」の効果をテストするのに、古くからの友人であるLeCunがいなくてはならなかった。

実際のテスト結果はかなり良好で、確かに「ディズニー」風味が感じられます。「ピクサー スタイル」だと考える人もいますが、ソフトウェアではこれを「3D カートゥーン」と呼んでいます。

LeCun のぼやけたクラシックな写真で 2D 漫画効果を試してみませんか?

解像度が低い場合でも、高品質の出力を生成することができ、「無料」ソフトウェアとしては非常に優れています。

「ディズニー風」のほかに、下の編集者(犬の頭)のような「ルネッサンス風」もあります。

LeCun がまた登場。効果は先ほどの 2D のものよりずっと良く、彼の気質が完璧に捉えられています。

しかし、編集者は大量の写真をテストした結果、このソフトウェアは世論が言うほど強力ではないことを発見しました。たまに、数枚の写真が許容範囲内に収まりましたが、生成された他のほとんどの写真は奇妙に見えました。

トレーニングデータのせいかどうかは分かりませんが、公式が挙げている有名人の事例がとてもすごいです。例えば、このムスクは非常にハンサムに見え、ヨーロッパの貴族の雰囲気を漂わせているようです。

次のような若い女性もかなりハマっています。彼らが同じソフトウェアを使用しているかどうか疑問に思わざるを得ません。

これらの例は、ある意味ではなぜそれほど人気が​​あるのか​​を説明しています。写真に写っている人物を見たことがある人であれば、AI 処理後に基本的に一目で認識できるからです。

Voilà AI Artist とは誰ですか?

「Voilà AI Artist」と呼ばれるこのソフトウェアは、AIアルゴリズムのサポートにより、ポートレート写真をアップロードするだけで、3D漫画(ディズニースタイル)、2D漫画、ルネッサンス絵画、漫画キャラクターの4つのフィルタースタイルの画像を取得できます。

Voilà には有名人の写真のデータベースもあります。アプリで検索して、有名人の顔を入れ替えた効果を直接確認できます。

しかし残念なことに、ユーザーは目や口、髪の毛を調整したり、色やコントラストを変更したりするなど、画像を編集することはできません。

実験室モデルと比較すると、パッケージ化されたアプリケーションは明らかに使いやすい。海外メディアは、このアプリが「ウイルス」のように急速に広がっているとさえ表現した。

VoilàのiOS版は発売から約3か月で、多くの国と地域で無料ランキング1位を獲得し、TikTok、Instagram、Snapchatなどの強力な競合アプリを打ち負かした。

Android 版では、Voilà は Google Play ストアで 1,000 万回以上ダウンロードされ、26 の国と地域で人気チャートのトップ 10 にランクインしています。

公式Facebookアカウントは6月13日、ユーザー数2000万人達成を祝うメッセージを投稿した。

謎の首謀者

「Voilà AI Artist」の親会社は「Wemagine.AI」で、今年1月に英国ロンドンで登記され、設立から2か月も経たないうちにこのアプリをリリースしたと報じられている。

しかし、この会社についてこれ以上詳しい情報はほとんどありません。しかし、フォックス・カロライナは同社に連絡を取ったと述べている。Wemagine.AIは、本社はカナダにあるが、チームは小規模で、世界各地でリモートワークをしていると述べた。

英国の企業検索サイト「Company Check」のデータによると、同社の創設者はリム・エリスカ氏とウィルソン・チョア氏である。さらに、二人ともインドネシアに住んでおり、年齢は35歳以下です。

プライバシーコレクター「Xijiayi」

FaceApp事件以降、ユーザーはこの種のソフトウェアのプライバシー条件にさらに注意を払うようになりました。残念ながら、試してみたい場合は、心の準備を整えてください。以下はそのほんの一部です。

Voilà は、アプリの最終使用から 24 ~ 48 時間後に写真を削除すると主張しており、プライバシー規約では、情報を第三者 (協力者を除く) に提供しないことを明記しています。

また、アプリが最後に使用されてから 24 ~ 48 時間以内に写真とそれに関連付けられた情報を削除するように Google Cloud Platform を構成しました。

当社は、その他の状況においてもお客様の情報を開示することがあります。

当社の子会社および関連会社へ。

当社の事業をサポートする請負業者、サービスプロバイダー、および第三者。

しかし、Voilà は、訪問したウェブサイト、クッキー、携帯電話の機種、写真などのユーザーの個人情報を収集し、協力する広告主に提供していることを認めています。

この使用データには、インターネット プロトコル アドレス (IP アドレスなど)、ブラウザーの種類、ブラウザーのバージョン、お客様がアクセスしたサービスのページ、アクセスの日時、それらのページで費やした時間、デバイス識別子、その他の診断データが含まれる場合があります。

モバイル デバイスを使用してサービスにアクセスする場合、その使用データには、使用するモバイル デバイスの種類、固有のデバイス識別子、モバイル デバイスの IP アドレス、オペレーティング システム、使用するモバイル インターネット ブラウザーの種類、固有のデバイス識別子、その他の診断データなどの情報が含まれる場合があります。

また、Google Analytics を利用して、IP アドレス、デバイス モデル、画面解像度、オペレーティング システム、セッション期間、位置情報などのデータも収集します。このデータに基づいて、お客様のニーズと興味を分析し、サービスを改善します。

アプリの無料版をご利用の場合、アプリ内に広告が表示されます。これらの広告はパートナーによって提供され、アプリの使用状況やオンライン上の他の場所でのアクティビティに基づいてターゲット設定される場合があります。

それに、広告を見たくない場合はどうすればいいでしょうか?当然ですが、会員費を支払う必要があります。 Voilà によると、メンバーシップにより写真処理が高速化され、エクスポートされた画像のアプリ内広告や透かしが削除されるという。

料金は1週間で2.49ポンド(22.3元)、1ヶ月で4.99ポンド(44.6元)、1年で25.99ポンド(232.3元)。

しかし、Appleの中国地域ではこれをまったく販売していないため、国内ユーザーはこの問題を心配する必要はないかもしれない。 Android ユーザーは APK のダウンロード体験を見つけることができます。

生成的敵対ネットワーク

2014 年に Generative Adversarial Networks がリリースされて以来、その応用シナリオはますます広範囲になり、現在では商業的にも利用できるようになりました。

GAN は、ジェネレーター ネットワークと識別器ネットワークで構成されます。

生成ネットワークは潜在空間からランダムにサンプルを入力として取得し、その出力はトレーニング セット内の実際のサンプルを可能な限り模倣する必要があります。

判別ネットワークの入力は、実際のサンプルまたは生成ネットワークの出力です。その目的は、生成ネットワークの出力を実際のサンプルと可能な限り区別することです。生成されたネットワークは、識別ネットワークを可能な限り欺く必要があります。

2 つのネットワークは互いに競合し、パラメータを絶えず調整します。最終的な目標は、判別ネットワークが生成されたネットワークの出力結果が真であるかどうかを判断できないようにすることです。

中でも、NVIDIAが発表したStyleGANが生成した画像は非常にリアルで、ネットワーク内の各レベルの入力を個別に変更することで、大まかな姿勢、顔の形から細かい髪の色まで、そのレベルの視覚的特徴をコントロールできるという。

StyleGANによって生成された顔

StyleGAN は、リアルな肖像画だけでなく、他の動物、車、さらには部屋を生成するためにも使用できます。

アップグレード版のStyleGAN2では、アーティファクトの問題が修正され、生成される画像の品質がさらに向上します。

<<:  最も暑い夏の日がやってきました。ドローンを飛ばすのに最適な時期です

>>:  科学者は機械学習を利用して結晶構造の酸化状態の謎を解明する

ブログ    
ブログ    

推薦する

...

Google、AIアシスタント「Gemini」の修正を加速、拒否率を半減

2月18日、Googleは人工知能プロジェクトを大幅にアップデートし、BardをGeminiに改名し...

中国の人工知能産業における4つの大きなトレンド

人工知能は新たな産業変革の中核的な原動力であり、これまでの科学技術革命と産業変革によって蓄積された膨...

...

...

インテリジェント製造業が波に乗る中、産業用ロボットはどのようにして主導権を握ることができるのでしょうか?

インテリジェント製造(IM)は、インテリジェントマシンと人間の専門家で構成された人間と機械の統合イン...

アリババのPingtouge Xuantie CPUが重要な進歩を遂げました。RISC-V + Android 12 AIサポートを初めて実現しました。

アリババの平頭半導体は、ARMアーキテクチャの自社開発プロセッサYitian 710の商用化を実現し...

大規模言語モデルの詳細な分析: トレーニングから大規模モデルの展開まで

導入データサイエンスの分野が進歩するにつれ、複雑な自然言語を処理および生成できる高度な AI システ...

タオバオの推奨シナリオのための強力なツール:複雑な目的を統合し、リアルタイムの規制をサポートする再注文モデル

1. 情報フローシナリオの課題と並べ替えモデルの独自の利点多くの学生は再ランキングに馴染みがないかも...

JVM チューニングの概要: 基本的なガベージ コレクション アルゴリズム

ガベージ コレクション アルゴリズムは、さまざまな観点から分類できます。基本的なリサイクル戦略によれ...

Google、医療従事者が情報を素早く見つけられるようにAI検索機能を開始

10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...

垂直型AIスタートアップと水平型AIスタートアップ: 異なる製品ルートの選択

AIスタートアップは主に2つのスタイルに分けられます。本日の記事では、その両方を分析して見ていきます...

ディープラーニング プロジェクトをゼロから構築するにはどうすればよいでしょうか?詳細なチュートリアルはこちら

ディープラーニングに関する理論コースを受講した後、多くの人が独自のプロジェクトを構築してみることに興...

先日の清明節にはドローンが頻繁に登場しました!

近年、飛行制御、ナビゲーション、センシングなどの技術の急速な発展に伴い、ドローン業界はますます大きく...

Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

今後、Kaggle のコンペティションに参加する際には、AutoML を直接送信して、参加する AI...