なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密:私たちは

なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密:私たちは

OpenAI が最初に Sora を作成した理由は何ですか?

現在、世界中の研究者、エンジニア、投資家がこの疑問を抱いています。

最近、ビデオモデルSoraに関する人々の議論は引き続き加熱しており、情報はすでに循環を突破し、2ラウンドの関連投資ホットスポットが登場しています。

Sora が作成した「花虎」ビデオ。この生成能力によって、どれだけの新しいアイデアが生まれるのでしょうか?

カリフォルニア大学バークレー校でコンピューターサイエンスの博士号を取得し、Zhihu の著者でもある @SIY.Z 氏は、ある記事の中で、OpenAI の成功の理由のいくつかを分析しました。

  • 目標とビジネス モデルは明確です。目標は AGI に全力を注ぐことであり、すべての研究は AGI への道を探ることを中心に展開されます。ビジネス モデルは API を直接提供する SaaS です。
  • 方法論は明確で、「苦い教訓」(リッチ・サットンの古典的な論文「苦い教訓」から派生したもので、中心となる考え方は「人工知能を長期的に向上させたいのであれば、計算能力を利用するのが最善の方法である」)、スケーリングの法則、新たな特性などが含まれます。

@SIY.Zは、「OpenAIのビジネスモデル、AGIへの信念、体系的な方法論、積極的な試みはすべて、汎用人工知能の実現と、すべてのAGI技術スタックで実行できるモデルの実現という目標に向かって同社を推し進めている。これは、OpenAIが多くの研究機関や企業の中で際立っている重要な要素である」と結論付けた。詳細については、オリジナルのZhihuの投稿をご覧ください。

オリジナルのZhihu投稿アドレス: https://www.zhihu.com/question/644486081/answer/3398751210?utm_psn=1743584603837992961

さらに、才能の集結も OpenAI の成功の重要な要素であることもわかっています。これらの才能は OpenAI でどのように働くのでしょうか? ChatGPTやSoraのような最先端の技術的成果を生み出すには、天才たちは多大な努力を払う必要があるのではないでしょうか?答えはノーのようです。

今朝早く、OpenAI の研究者 Jason Wei 氏が自ら公開した日々の仕事のタイムラインがソーシャル ネットワーク上で話題になりました。

Jason Wei は大学卒業後に Google に入社し、第一著者として先駆的な研究「Thinking Chain」を執筆しました。現在は OpenAI で ChatGPT の作成に携わっています。

このスケジュールを時系列順に見てみましょう。

朝は普通に見えました:

  • 9時に起きてください。
  • 午前9時半にWaymoの無人運転車に乗って会社に行き、朝食にアボカドトーストを食べました。
  • 9:45: OpenAI 憲章 (その中核は、汎用人工知能が全人類に利益をもたらすようにすることです) を暗唱し、最適な神に祈り、「苦い教訓」を学びます。
  • 10 時に Google Meet ミーティングを開催し、より多くのデータでより大きなモデルをトレーニングする方法について話し合いました。
  • 11. より多くのデータでより大きなモデルをトレーニングするためのコードを記述します。
  • 12:00 カフェテリアへ行き、昼食(ベジタリアン、グルテンフリー)を食べます。

午後になると仕事の強度が増します。

  • 1 モデルのトレーニングを続けます。
  • 2. インフラストラクチャの問題をデバッグします。
  • 3. モデルのトレーニングを監視し、Sora で遊びます。
  • 4. 前述のトレーニング済みモデルに対してプロンプトエンジニアリングを実行します。
  • 4時半に休憩を取り、アボカドチェアに座りながら、ジェミニ ウルトラの素晴らしさを考えました。
  • 5. モデルを改善するための潜在的なアルゴリズムについてブレインストーミングします。
  • 5:05 結論: アルゴリズムを変更するのはリスクが大きすぎるため、コンピューティングとデータを拡張する方が安全です。
  • 6時に夕食を食べます。
  • 7時に帰宅。

そして、多くの人と同じように、夜が来て最も生産性の高い時間がやってきます。

  • 8 時、ワインを一杯飲みながらコードを書き続けました。この時点で、私はバルマーピークに達しました (伝説によると、マイクロソフトは 1980 年代後半に、血中アルコール濃度が 0.129% から 0.138% の間になるとプログラマーは超人的なプログラミング能力を発揮するという法則を発見しました)。
  • 9:00: 実験実行を分析します。
  • 午前 10 時: 実験を開始し、一晩実行して、翌朝に結果を取得します。
  • 午前 1 時: 実験が実際に実行され始めます。
  • 1時15分に寝ます。 「必要なのは圧縮だけだ」と自分に言い聞かせてください。

情報量はかなり豊富。ウルトラマン社長のベジタリアン食を真似したり、Teamsが使いにくいと揶揄したりと、OpenAIのエンジニアも競合他社の動向を非常に気にしているようです。

それを見た後、Meta FAIR研究所の研究員兼シニアマネージャーである田元東氏は次のように語った。「海外には996はないと言われていますが、実際に本当に恐ろしいのは、自己駆動のスケジュールです。」

先週末、DiT 論文の著者の 1 人である謝彩寧氏は、自分が Sora の著者ではないという噂を否定する一方で、プロジェクト リーダーのウィリアム (ビル) ピーブルズ氏らが Sora の構築に注いだ作業の激しさについて少し情報を明かしました。

「私は1年間、寝ずに一生懸命働きました。」

先週の水曜日、OpenAIに2度目の復帰を果たした著名なAI研究者のアンドレイ・カルパシー氏が、今度はわずか1年で再び辞任を発表した。 「特に何もなかった」としながらも、翌日のスケジュールを公開した。

画面から溢れ出るやさしさを感じさせます。

これは、製品がオンラインになる前の最前線のエンジニアにのみ当てはまるのでしょうか?あまり。生成 AI に火をつけた ChatGPT プロジェクトには多くの人が参加していますが、上から下まで大変な作業です。昨年、OpenAIがGoogleなどの企業に影を落としていたとき、同社の信頼と安全の責任者であるデイブ・ウィルナー氏はLinkedInで辞任を発表し、その理由として「熱意が強すぎた」ことを挙げた。

ウィルナー氏は7月20日に投稿した記事で、ワークライフバランスを優先するためOpenAIの幹部職を辞任すると述べ、辞任は「非常に簡単な選択」だったと語った。

同氏は、OpenAIの安全性プロジェクトを率いることは「今日最もクールで興味深い仕事の一つ」だが、2022年2月に同社に入社して以来、自身の仕事の範囲と規模は大幅に拡大したと述べた。 ChatGPT がスタートして以来、仕事よりも家族のニーズを優先することがますます難しくなりました。

ウィルナー氏の発表は、メタ、グーグル、エアビーアンドビーなどの管理職を含む同僚らから満場一致で支持され、評論家らはウィルナー氏の辞任は賢明で感動的な選択であり、優先事項の変化を公にするのは勇気がいることだと述べた。

その後の展開はすでにご存知のとおり、Google Gemini は追い上げを続け、先週は Sora が再び OpenAI のリードを広げました。

世の中にはタダ飯はないようだ。

正しい方向を選択し、信念を貫き、AGI の目標に向かって進んでください。長年にわたる OpenAI の浮き沈みは、最先端の研究機関がどのようなものであるべきかを私たちに鮮明に示してきました。

参考文献:

https://twitter.com/_jasonwei/status/1760032264120041684.

https://twitter.com/minchoi/status/1759932670782410880.

https://www.businessinsider.com/open-ai-sam-altman-daily-routine-schedule-for-productivity-2024-1.

https://www.businessinsider.com/openai-chatgpt-exec-resigns-work-life-balance-time-with-kids-2023-7.

<<:  人気のSoraはDiTを最前線に押し上げ、GitHubのホットリストにも載りました。新しいバージョンのSiTに進化しました。

>>:  世界シミュレーターはAGIの最終成果、12の状況予測です!チーフエキスパートによる1万語の記事がソラのマイルストーンを専門的に解釈

ブログ    
ブログ    

推薦する

...

...

...

Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

[[222004]]常にオープンで、常に新しいメンバーを引き付けてきた百度のアポロ自動運転プラット...

生涯にわたる機械学習: 持続可能な学習のパラダイム

[[207884]]序文:最近、アンサンブル学習における持続可能性に関する研究に関する非常に興味深い...

UniPAD: 自動運転のためのユニバーサル事前トレーニングパラダイムが登場!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

OpenAI、超知能AIの制御に関する中核的な技術的課題に取り組むため新チームを結成

7月7日、OpenAIは、共同設立者で主任科学者のイリヤ・スツケバー氏とアラインメント責任者のヤン・...

量子コンピューティングは今後10年間で物流業界を変えるだろう

近年、サプライチェーンおよび物流業界は、労働力不足から予測不可能な天候、需給の変化まで、ますます多く...

2020 年に注目すべき機械学習とデータサイエンスのウェブサイト トップ 20

今日最も進歩的で、最先端で、刺激的なもの…データ サイエンスと機械学習は、今日非常に魅力的で、非常に...

...

2017 年のトップデータサイエンスと機械学習手法

[51CTO.com クイック翻訳] 統計によると、回答者が現在選択している最も一般的に使用されてい...

...

とても早いですね!わずか数分で、10行未満のコードでビデオ音声をテキストに変換します。

みなさんこんにちは。私はFeng Kiteですオーディオおよびビデオ ファイル内のオーディオをテキス...