Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える――

Google の研究者である Omer Bar-Tal 氏が Pika の創設科学者を務めています。

1か月前、Googleの共同執筆者としてビデオ生成モデルLumiereをリリースしたのですが、その効果は驚くべきものでした。

当時、ネットユーザーたちはこう言っていた。「Google がビデオ世代の戦いに参戦し、また素晴らしい番組が見られるようになるだろう。」

Stability AIのCEOや元Googleの同僚など、業界関係者の一部は祝福の言葉を送った。


ルミエール、修士号を取得したばかり

オメル・バータルは2021年にテルアビブ大学の数学・コンピュータサイエンス学部を卒業し、その後ワイツマン科学研究所に進学してコンピュータサイエンスの修士号を取得し、画像とビデオの合成分野の研究に重点を置きました。

彼の論文結果は、Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)など、トップカンファレンスで何度も採択されています。

彼らはTokenFlowを例に、トレーニングや微調整なしでビデオ編集タスクをサポートする拡散モデルに基づいたテキスト駆動型のビデオ編集を実装するためのフレームワークを提案しました。

Pika に入社する前は、Google Research で学生研究者として 9 か月間勤務し、7 か月間の研究を経て、ついに共同筆頭著者としてLumiereを立ち上げました。この時点では修士号はまだ取得していないはずです。

Lumiere の革新性は、提案された時空間 U-Net (STU-Net) アーキテクチャにあります。ビデオは空間次元と時間次元の両方で同時にダウンサンプリングおよびアップサンプリングされ、ネットワークの中間層でビデオの圧縮された時空間表現が得られます。

Lumiere は 3,000 万本のビデオから学習し、ビデオ生成、ビデオ編集と修復、画像からビデオへの変換、ビデオのスタイル設定など、複数の機能をサポートできます。

当時、ジェフ・ディーンは「マルチモーダルビデオ生成革命が起こっている」と称賛しました。

ウィル・スミスが麺を食べる(ピカバージョン)

ピカへの参加が正式に発表されると、関係者や投資家からも祝福の声が上がった。

数日前、ピカの Yilun Du という中国人研究者が論文を発表しました。しかし、彼はちょうど MIT で博士号を取得したばかり(あるいはまだ卒業していない)のはずで、論文の単位は依然として MIT のままです。

なお、公式サイトでは引き続き募集中です。


<<:  制御核融合における新たなマイルストーン! AIがプラズマの裂け目を予測することに成功し、ネイチャー誌に掲載され、クリーンエネルギーの「聖杯」に一歩近づいた。

>>:  GPT-4 が人間のデータ専門家を引き継いでいます!事前の知識により、LLMは従来の方法に匹敵する精度で大胆な予測を行うことができます。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

phind: 開発者に特化したAI検索エンジンの誕生!

みなさんこんにちは、三元です。前回の記事では、AIを使いこなせない人は本当に将来淘汰されていくのか?...

江長建、世界初のサイボーグと対談 - JD Smart Community 2.0 全国ローンチカンファレンス ライブプレビュー

[[374688]] 「半オーク」「半魚」… SF映画、漫画、おとぎ話では、それは驚くことではありま...

2021年に注目すべき10の重要なディープラーニングアルゴリズム

[[416068]] [51CTO.com クイック翻訳]人間が未来を予測することは困難ですが、人工...

十分なデータを使用してモデルをトレーニングしたかどうかをどのように確認しますか?

[51CTO.com クイック翻訳]ディープニューラルネットワーク (DNN) には大量のトレーニ...

RFID と AI が出会うとき: 「敵」か「味方」か?

近年の科学技術分野で最も代表的な技術をいくつか選ぶとしたら、AI技術は間違いなくそのリストに入るでし...

AI とデジタル病理学は医療通信をどのように改善できるのでしょうか?

人工知能 (AI) とデジタル病理学は、特に通信分野において医療業界に革命をもたらすと期待されていま...

人工知能開発における5つの制約問題、数千の問題を解決する5つの解決策

[[237095]]人工知能はどこにでもあるようです。私たちはそれを自宅や携帯電話で体験します。起業...

マスク氏はAIが人間を超えると述べ、それを信じない人は単に賢いだけだと語る

北京時間7月23日、テスラのCEOイーロン・マスク氏は水曜日、人工知能(AI)の将来についての懸念を...

人工知能は伝染病との戦いにおいてどのような役割を果たすのでしょうか?

新型コロナウイルスは間違いなく2020年で最もホットな話題であり、流行の防止はすべての国にとって最優...

...

バックプロパゲーションを用いた多層ニューラルネットワークのトレーニングの原理

記事「バックプロパゲーションを使用した多層ニューラル ネットワークのトレーニングの原理」では、バック...

体型の変化は千差万別! MIT が宇宙探査用人工物を開発 - モジュール式の自己再構成可能なマイクロロボット

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

機械学習の経験を人生の指針に活用する: 学習効率を最大化する方法

[[185313]]原作者 | ライムンド・マンテローラ編集チーム | Aileen、Huang W...

また鉄の飯碗が割れた!今後、これらの仕事は人工知能に置き換えられるかもしれません!

この時代に本物の鉄丼なんて存在しない!最近、広東省の高速道路で非接触型決済が導入されたというニュース...