ITホーム 12月7日、Metaは新しい独立したAI画像ジェネレーター「Imagine with Meta」をリリースしました。これにより、ユーザーは自然言語による説明を通じて画像を作成できます。 新しい人工画像ジェネレーターは、Meta の既存の Emu 画像生成モデルを活用しており、テキストプロンプトに基づいて高解像度の画像を作成できます。現在、米国の英語圏のユーザーは無料で利用できます (後で利用可能になるかどうかは不明)。プロンプトごとに 4 つの画像を生成します。 以前、Meta の画像生成モデルは、人種差別的な画像ステッカーに関して論争に直面していました。こうした問題に対処するため、Meta は Imagine with Meta で生成された画像に目に見えない透かしを追加する予定だと述べた。これらの透かしは人工知能モデルによって生成され、対応するモデルによって検出できるため、コンテンツの透明性が向上する。 IT Homeは、Metaが先週、写真とビデオに適用できる「Emu Edit」と「Emu Video」という、FacebookとInstagram向けの2つのAIベースの画像編集ツールのリリースを発表したと報じた。 公式紹介によると、Emu Edit はユーザーの指示を受け入れ、地域およびグローバル編集、背景の削除と追加、色の調整、ベクター画像変換の実行、画像要素の検出とセグメント化など、さまざまな形式の編集を実行できます。 Meta は、Emu Edit のトレーニングに 1,000 万の合成データセットを使用し、同種のデータセットとしては最大規模であると主張しています。 Meta 氏は、Emu Edit は生成されたモデルに視覚的なタスクを指示として組み込むことで、ビデオの生成と編集をより適切に制御できると述べました。研究者らは、現在の画像編集モデルは画像を過剰に修正したり、修正が不十分であったりすることが多いが、Emu Editの利点は指示に従って正確に編集できることだと指摘した。 |
<<: X-Dreamerは2Dと3D生成のギャップを埋め、高品質のテキストから3D生成を実現します。
>>: 『Thinking Chain: Six Intuitions about Big Models』の著者、ジェイソン・ウェイ氏
マイクロソフトは9月21日午前1時、ニューヨーク市でSurfaceの新製品発表会を開催する。海外テク...
k-means アルゴリズムは比較的単純です。 k-means アルゴリズムでは、クラスターはクラ...
気がつくと、1 秒あたり 500 トークンを出力できる Groq モデルがインターネット上に広まって...
大規模言語モデル (LLM) はさまざまな分野でますます使用されるようになっています。ただし、テキス...
工業情報化部科学技術庁は、感染予防・抑制に努め、感染拡大を阻止するために、「人工知能の力を十分に発揮...
今日の小売ショッピング体験は、データを活用しカスタマイズと体験を実現することがすべてです。モノのイン...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事では主に、機械学習プロジェクトの編成と管理に関する実践的な経験をいくつか紹介します。パイソン...