Google版AIペイント検索ボックスで直接プレイ! Imagen 上に構築されたネットユーザー: DALL-E の代替品がここにあります

Google版AIペイント検索ボックスで直接プレイ! Imagen 上に構築されたネットユーザー: DALL-E の代替品がここにあります

Google 独自の「DALL-E/Midjourney」がついにオンラインになりました。

本日、Google は検索エンジンに大きなアップデートを行いました。

検索ボックスにプロンプ​​トワードを入力するだけで、画像の生成が直接開始されます。

ユーザーにとって、この新機能は「学習コスト」を追加せず、通常どおり検索を開くことができます。

デフォルトの結果は 4 枚の写真で、検索インターフェースの上部に表示されます。クリックすると jpg 形式でダウンロードされます。

満足できない場合はプロンプトワードを使ってさらに編集できるのでとても便利です。

さらに、画像検索機能にもちょっとしたサプライズがあります。

マウスを何回もスクロールしても、希望する結果が見つからなかったことはありませんか?

問題ありません。私たち自身でいくつか「新しい」ものを作ることができます。

(「新しいものを作成」という白いボックスをクリックすると、これを実行できます。下の画像は、「ミニマリスト ハロウィーン デスクトップ レイアウト」を検索したものです)

詳細を見てみましょう〜

Google版「DALL-E/Midjourney」はこちら

上記の画像生成機能は、Google 独自の Wensheng グラフ モデルを活用しています。

画像.

この作品は、昨年5月に公開されたが、これは「ネットワーク全体に衝撃を与えた」DALL・E 2の公開からわずか1か月後のことだった。

Imagen 言語モデル部分は Google 独自の T5-XXL を使用しており、テキスト エンコーダーはトレーニング後にフリーズされます。

画像生成部分は一連の拡散モデルであり、最初に低解像度の画像を生成し、次に段階的にスーパーサンプリングします。

最終的な効果は、リアリズムと高忠実度に重点を置いた DALL·E 2 よりもさらに優れています。

現在、Google 検索に統合された後、Google が Imagen 向けに生成したすべての画像には、 「これは AI によって生成されたものです」というメタデータ識別子が埋め込まれ、目に見えない透かしが追加されます。

この操作は、Google Cloud と DeepMind が今年 8 月にリリースした SynthID テクノロジーによってサポートされています。

この技術は画像の品質に影響を与えず、フィルターの追加、色の変更、さまざまな非可逆圧縮を使用した保存などの変更を行った後でも透かしを検出可能なままにすることができます。

この新機能について、Google は責任を非常に真剣に受け止めています。

これを使用して作品を生成すると、かなり厳しいフィルタリングとレビューを受けることになります。

最も基本的なわいせつな内容や有害内容の禁止に加え、実名の入力や実在の人物の画像の作成も禁止されています

ご利用には18歳以上である必要があります。

制限もあります:

Google は今年 5 月の I/O カンファレンスで検索の再構築と AI 対話などの機能の導入を発表したが、同社は「まだ完璧ではない」ため、完全に安心できていない。

検索 AI 機能全体は「Google Search Labs」で公開されており、使用するには事前に申請する必要があります。

さらに、当初はさまざまな新しい AI 検索機能が米国でのみ利用可能でしたが、最近になってインドと日本にも拡大されました。

明日より、このAI画像生成機能は申請を承認したユーザーのみにプッシュされます

そのため、最初に体験できる人は多くありません。

そしてこの観点から見ると、マイクロソフトのような企業と比較すると、Google は自社製品の AI の進歩が確かに遅いと言えます。

ライティングアシスタントもアップデートされました

検索における新しい AI 画像生成に加えて、もう 1 つのアップデートがあります。

ライティングアシスタント。

Google が想定しているシナリオは、ユーザーが Google を使用して装飾やガレージの改造などのコンテンツを検索し、請負業者や企業を検索するというものです。ライティング アシスタントを使用すると、AI が企業に見積もりを依頼するメールの作成などを手伝ってくれます。

現在、アシスタントはより多くの種類のテキストを出力できます。

長さは長いか短いか、口調は真面目かカジュアルか。

最終的なドキュメントについては、もちろん、Google メールや Google ドキュメントなどの Google Workspace アプリケーションにエクスポートして処理することもできます。

<<: 

>>:  「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

ブログ    
ブログ    
ブログ    

推薦する

GoogleのReCaptchaシステムが破られ、機械音声認証の精度は85%に達した

米国のメリーランド大学の研究者4人が、GoogleのキャプチャシステムReCaptchaを解読できる...

人工知能ブームの背景にある産業チェーンのレイアウト分析

「新世代人工知能発展計画」の発表に伴い、国務院は我が国の人工知能発展計画を全体的に展開し始めました。...

クリアビューAI、民間企業への顔認識技術の販売を永久に禁止することに同意

顔認識監視会社Clearview AIは、裁判所との和解により、ほとんどの民間企業による同社のサービ...

普遍近似定理を理解しなければ、ニューラルネットワークを理解することはできない

ニューラルネットワークの威力を示す証拠文字通り、普遍近似定理はニューラル ネットワークがどのように機...

RPA大手UiPath独占インタビュー:やがて「1人1台ロボット」の時代が到来

【51CTO.comオリジナル記事】 【はじめに】 2019年後半、RPAは一気に普及したように思わ...

分散ストレージシステムのデータ分散アルゴリズムを簡単に見てみましょう。

序文分散ストレージ システムが直面する主な問題は、大量のデータを異なるストレージ ノードに分散する方...

AIビッグモデルオープンソースヒーロー!ザッカーバーグ氏はLLaMAリークについて議会から質問を受けた。「慣れている」

ザッカーバーグ氏は最近また大きなトラブルに巻き込まれた。リチャード・ブルーメンソール議員(プライバシ...

ChatGPTのトラフィックは3か月連続で減少しており、大学生の活躍で回復に寄与している

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習の変革: 多分野にわたる問題に立ち向かい、新しい機械学習エコシステムを構築する

機械学習の手法は、生命、物理学、社会経済などの複雑なシステムにますます応用されています。特定のタスク...

...

「無人運転」の技術的道筋

無人運転車が実際に走行するには、認識、意思決定、実行における技術的な問題を解決する必要があります。 ...

ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

OpenAI は、何の発表もなく、ひっそりと AI テキスト検出ツールをシャットダウンし、ページは直...

AIとERPが出会うとどんな「化学反応」が起こるのでしょうか?

生成型人工知能 (GenAI) は、マーケティングや販売などのさまざまなビジネス分野で人気が高まって...

Weibo の背後にあるビッグデータの原理を探る: 推奨アルゴリズム

推薦システムは早くから誕生していたが、本格的に注目されるようになったのは、「Facebook」に代表...

...