Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える――

Google の研究者である Omer Bar-Tal 氏が Pika の創設科学者を務めています。

1か月前、Googleの共同執筆者としてビデオ生成モデルLumiereをリリースしたのですが、その効果は驚くべきものでした。

当時、ネットユーザーたちはこう言っていた。「Google がビデオ世代の戦いに参戦し、また素晴らしい番組が見られるようになるだろう。」

Stability AIのCEOや元Googleの同僚など、業界関係者の一部は祝福の言葉を送った。


ルミエール、修士号を取得したばかり

オメル・バータルは2021年にテルアビブ大学の数学・コンピュータサイエンス学部を卒業し、その後ワイツマン科学研究所に進学してコンピュータサイエンスの修士号を取得し、画像とビデオの合成分野の研究に重点を置きました。

彼の論文結果は、Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)など、トップカンファレンスで何度も採択されています。

彼らはTokenFlowを例に、トレーニングや微調整なしでビデオ編集タスクをサポートする拡散モデルに基づいたテキスト駆動型のビデオ編集を実装するためのフレームワークを提案しました。

Pika に入社する前は、Google Research で学生研究者として 9 か月間勤務し、7 か月間の研究を経て、ついに共同筆頭著者としてLumiereを立ち上げました。この時点では修士号はまだ取得していないはずです。

Lumiere の革新性は、提案された時空間 U-Net (STU-Net) アーキテクチャにあります。ビデオは空間次元と時間次元の両方で同時にダウンサンプリングおよびアップサンプリングされ、ネットワークの中間層でビデオの圧縮された時空間表現が得られます。

Lumiere は 3,000 万本のビデオから学習し、ビデオ生成、ビデオ編集と修復、画像からビデオへの変換、ビデオのスタイル設定など、複数の機能をサポートできます。

当時、ジェフ・ディーンは「マルチモーダルビデオ生成革命が起こっている」と称賛しました。

ウィル・スミスが麺を食べる(ピカバージョン)

ピカへの参加が正式に発表されると、関係者や投資家からも祝福の声が上がった。

数日前、ピカの Yilun Du という中国人研究者が論文を発表しました。しかし、彼はちょうど MIT で博士号を取得したばかり(あるいはまだ卒業していない)のはずで、論文の単位は依然として MIT のままです。

なお、公式サイトでは引き続き募集中です。


<<:  制御核融合における新たなマイルストーン! AIがプラズマの裂け目を予測することに成功し、ネイチャー誌に掲載され、クリーンエネルギーの「聖杯」に一歩近づいた。

>>:  GPT-4 が人間のデータ専門家を引き継いでいます!事前の知識により、LLMは従来の方法に匹敵する精度で大胆な予測を行うことができます。

ブログ    
ブログ    

推薦する

...

カーネルモデル化ガウス過程 (KMGP) を使用したデータモデリング

カーネル モデル ガウス過程 (KMGP) は、さまざまなデータセットの複雑さを処理できる高度なツー...

AlphaFold: ノーベル賞を受賞する可能性のある最初の AI 成果

「これは、ノーベル賞受賞が期待される最初の人工知能の成果かもしれない。しかし、その画期的な進歩は間違...

宇宙探査における人工知能の驚くべき7つの応用

宇宙探査は人類の最も挑戦的で刺激的な取り組みの一つです。これには、科学的知識、技術革新、そして人間の...

...

人工ニューラルネットワークとBPアルゴリズムについての簡単な説明

[[338555]] 【51CTO.comオリジナル記事】 1 はじめに現在、機械学習技術とも呼ばれ...

ハーバード大学のロボット魚は、知的に協力し、集団で「泳ぎ」、サイエンス誌の表紙に登場しました。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Twitterはボットアカウントのラベルをテスト中

Twitterは木曜日、自動/ボットアカウントラベルを導入すると発表した。 Twitter社は、ユー...

...

OpenAI、中小企業向けChatGPTチームサブスクリプションサービスを開始、月額料金は1人あたり30ドル

1 月 11 日、OpenAI は小規模なセルフサービス チーム専用の新しいサブスクリプション プラ...

マイクロソフトが新しいハイブリッド会議機能をリリース: Teams Rooms、リモート プレゼンテーション カメオ、Viva Connections モバイル アプリ

IT Homeは9月10日、マイクロソフトが、オフラインの会議室に中央制御のオーディオデバイスを設置...

人工知能: Web3 の救世主か破壊者か?

ブロックチェーン技術の発展に伴い、Web3(分散型Webとも呼ばれる)が徐々にWeb2(集中型Web...

人工知能は242万件の医療記録の分析を支援した

人工知能は242万件の医療記録の分析を支援した1月26日、iFLYTEKは最前線の防疫・管理を支援す...

Cloudera China: データと AI は、企業が「反脆弱性」になるのにどのように役立つのでしょうか?

2023年には、個人にとっても企業にとっても「脆弱性」はほぼ普遍的な状態になります。世界経済が大き...

ユニサウンドがマルチモーダルAIチップ戦略を発表、同時に開発中の3つのチップを公開

昨年5月に業界初となるモノのインターネット(IoT)向けAIチップ「Swift」とそのシステムソリュ...