Metaは独立したAI画像ジェネレーターを立ち上げました。現在は無料ですが、英語のプロンプトのみをサポートしています。

Metaは独立したAI画像ジェネレーターを立ち上げました。現在は無料ですが、英語のプロンプトのみをサポートしています。

ITホーム  12月7日、Metaは新しい独立したAI画像ジェネレーター「Imagine with Meta」をリリースしました。これにより、ユーザーは自然言語による説明を通じて画像を作成できます。

新しい人工画像ジェネレーターは、Meta の既存の Emu 画像生成モデルを活用しており、テキストプロンプトに基づいて高解像度の画像を作成できます。現在、米国の英語圏のユーザーは無料で利用できます (後で利用可能になるかどうかは不明)。プロンプトごとに 4 つの画像を生成します。

以前、Meta の画像生成モデルは、人種差別的な画像ステッカーに関して論争に直面していました。こうした問題に対処するため、Meta は Imagine with Meta で生成された画像に目に見えない透かしを追加する予定だと述べた。これらの透かしは人工知能モデルによって生成され、対応するモデルによって検出できるため、コンテンツの透明性が向上する。

IT Homeは、Metaが先週、写真とビデオに適用できる「Emu Edit」と「Emu Video」という、FacebookとInstagram向けの2つのAIベースの画像編集ツールのリリースを発表したと報じた。

公式紹介によると、Emu Edit はユーザーの指示を受け入れ、地域およびグローバル編集、背景の削除と追加、色の調整、ベクター画像変換の実行、画像要素の検出とセグメント化など、さまざまな形式の編集を実行できます。

Meta は、Emu Edit のトレーニングに 1,000 万の合成データセットを使用し、同種のデータセットとしては最大規模であると主張しています。

Meta 氏は、Emu Edit は生成されたモデルに視覚的なタスクを指示として組み込むことで、ビデオの生成と編集をより適切に制御できると述べました。研究者らは、現在の画像編集モデルは画像を過剰に修正したり、修正が不十分であったりすることが多いが、Emu Editの利点は指示に従って正確に編集できることだと指摘した。

<<:  X-Dreamerは2Dと3D生成のギャップを埋め、高品質のテキストから3D生成を実現します。

>>:  『Thinking Chain: Six Intuitions about Big Models』の著者、ジェイソン・ウェイ氏

ブログ    
ブログ    

推薦する

同意しますか?コンピューティングの未来は分散化です!

[51CTO.com クイック翻訳] 分散アプリケーションは何も新しいものではありません。最初の分...

マスクの後ろに隠れて沈黙しないでください。AIはあなたが誰であるかを知っています

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

現在最も興味深い AI は、実は系図会社から生まれたものなのでしょうか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

モノのインターネットはスマートな衛生設備を創り出し、都市環境の衛生を細かく管理します

旅行のピーク時に都市環境衛生がより大きな圧力に耐えられるか?清掃車両と清掃作業員をより適切に管理する...

機械学習における数学的意義

機械学習におけるパフォーマンスを主張するために使用される指標については、ほとんど議論されていません。...

...

企業が人工知能を応用する際に直面する課題

[[340820]] [51CTO.com クイック翻訳] 過去10年間、人工知能をめぐって大きな議...

2019年のAI研究開発のホットスポットのレビュー

人工知能技術を継続的に改善することで、より優れたインテリジェントな世界を創造することができます。 2...

AlphaFold2の最初の公開PyTorchバージョンが複製可能になりました。コロンビア大学のオープンソースで、1,000以上のスターが付いています。

ちょうど今、コロンビア大学のシステム生物学助教授であるモハメッド・アルクライシ氏が、AlphaFol...

Microsoft の 37 ページの論文では、Sora をリバース エンジニアリングしています。どのような結論に達したのでしょうか。

現段階では、Sora に追いつくことが多くのテクノロジー企業の新たな目標となっている。研究者たちが興...

強力なハードウェアがあれば、アルゴリズムはもはや重要ではないのでしょうか?

この記事は、プログラマーの質問と回答のコミュニティである stackexchange.com の質問...

2025年までに音声認識市場は267億9000万ドルに達する

3月29日、市場調査会社Meticulous Market Researchが発表した最新のレポート...

シリコンバレーの人工知能専門家:人類は20年以内に老化の束縛から解放されるかもしれない

現在、世界最高齢の人は、ギネス世界記録に認定された118歳の日本人老人、田中カネさんです。田中選手の...

顔認識は壊れているのでしょうか?心配しないでください。「フェイスプロテクションプラン」が始まります

かつて、顔認識は人々が非常に信頼する技術でした。生産と生活に利便性、効率性、正確性をもたらしたため、...