なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密:私たちは

なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密:私たちは

OpenAI が最初に Sora を作成した理由は何ですか?

現在、世界中の研究者、エンジニア、投資家がこの疑問を抱いています。

最近、ビデオモデルSoraに関する人々の議論は引き続き加熱しており、情報はすでに循環を突破し、2ラウンドの関連投資ホットスポットが登場しています。

Sora が作成した「花虎」ビデオ。この生成能力によって、どれだけの新しいアイデアが生まれるのでしょうか?

カリフォルニア大学バークレー校でコンピューターサイエンスの博士号を取得し、Zhihu の著者でもある @SIY.Z 氏は、ある記事の中で、OpenAI の成功の理由のいくつかを分析しました。

  • 目標とビジネス モデルは明確です。目標は AGI に全力を注ぐことであり、すべての研究は AGI への道を探ることを中心に展開されます。ビジネス モデルは API を直接提供する SaaS です。
  • 方法論は明確で、「苦い教訓」(リッチ・サットンの古典的な論文「苦い教訓」から派生したもので、中心となる考え方は「人工知能を長期的に向上させたいのであれば、計算能力を利用するのが最善の方法である」)、スケーリングの法則、新たな特性などが含まれます。

@SIY.Zは、「OpenAIのビジネスモデル、AGIへの信念、体系的な方法論、積極的な試みはすべて、汎用人工知能の実現と、すべてのAGI技術スタックで実行できるモデルの実現という目標に向かって同社を推し進めている。これは、OpenAIが多くの研究機関や企業の中で際立っている重要な要素である」と結論付けた。詳細については、オリジナルのZhihuの投稿をご覧ください。

オリジナルのZhihu投稿アドレス: https://www.zhihu.com/question/644486081/answer/3398751210?utm_psn=1743584603837992961

さらに、才能の集結も OpenAI の成功の重要な要素であることもわかっています。これらの才能は OpenAI でどのように働くのでしょうか? ChatGPTやSoraのような最先端の技術的成果を生み出すには、天才たちは多大な努力を払う必要があるのではないでしょうか?答えはノーのようです。

今朝早く、OpenAI の研究者 Jason Wei 氏が自ら公開した日々の仕事のタイムラインがソーシャル ネットワーク上で話題になりました。

Jason Wei は大学卒業後に Google に入社し、第一著者として先駆的な研究「Thinking Chain」を執筆しました。現在は OpenAI で ChatGPT の作成に携わっています。

このスケジュールを時系列順に見てみましょう。

朝は普通に見えました:

  • 9時に起きてください。
  • 午前9時半にWaymoの無人運転車に乗って会社に行き、朝食にアボカドトーストを食べました。
  • 9:45: OpenAI 憲章 (その中核は、汎用人工知能が全人類に利益をもたらすようにすることです) を暗唱し、最適な神に祈り、「苦い教訓」を学びます。
  • 10 時に Google Meet ミーティングを開催し、より多くのデータでより大きなモデルをトレーニングする方法について話し合いました。
  • 11. より多くのデータでより大きなモデルをトレーニングするためのコードを記述します。
  • 12:00 カフェテリアへ行き、昼食(ベジタリアン、グルテンフリー)を食べます。

午後になると仕事の強度が増します。

  • 1 モデルのトレーニングを続けます。
  • 2. インフラストラクチャの問題をデバッグします。
  • 3. モデルのトレーニングを監視し、Sora で遊びます。
  • 4. 前述のトレーニング済みモデルに対してプロンプトエンジニアリングを実行します。
  • 4時半に休憩を取り、アボカドチェアに座りながら、ジェミニ ウルトラの素晴らしさを考えました。
  • 5. モデルを改善するための潜在的なアルゴリズムについてブレインストーミングします。
  • 5:05 結論: アルゴリズムを変更するのはリスクが大きすぎるため、コンピューティングとデータを拡張する方が安全です。
  • 6時に夕食を食べます。
  • 7時に帰宅。

そして、多くの人と同じように、夜が来て最も生産性の高い時間がやってきます。

  • 8 時、ワインを一杯飲みながらコードを書き続けました。この時点で、私はバルマーピークに達しました (伝説によると、マイクロソフトは 1980 年代後半に、血中アルコール濃度が 0.129% から 0.138% の間になるとプログラマーは超人的なプログラミング能力を発揮するという法則を発見しました)。
  • 9:00: 実験実行を分析します。
  • 午前 10 時: 実験を開始し、一晩実行して、翌朝に結果を取得します。
  • 午前 1 時: 実験が実際に実行され始めます。
  • 1時15分に寝ます。 「必要なのは圧縮だけだ」と自分に言い聞かせてください。

情報量はかなり豊富。ウルトラマン社長のベジタリアン食を真似したり、Teamsが使いにくいと揶揄したりと、OpenAIのエンジニアも競合他社の動向を非常に気にしているようです。

それを見た後、Meta FAIR研究所の研究員兼シニアマネージャーである田元東氏は次のように語った。「海外には996はないと言われていますが、実際に本当に恐ろしいのは、自己駆動のスケジュールです。」

先週末、DiT 論文の著者の 1 人である謝彩寧氏は、自分が Sora の著者ではないという噂を否定する一方で、プロジェクト リーダーのウィリアム (ビル) ピーブルズ氏らが Sora の構築に注いだ作業の激しさについて少し情報を明かしました。

「私は1年間、寝ずに一生懸命働きました。」

先週の水曜日、OpenAIに2度目の復帰を果たした著名なAI研究者のアンドレイ・カルパシー氏が、今度はわずか1年で再び辞任を発表した。 「特に何もなかった」としながらも、翌日のスケジュールを公開した。

画面から溢れ出るやさしさを感じさせます。

これは、製品がオンラインになる前の最前線のエンジニアにのみ当てはまるのでしょうか?あまり。生成 AI に火をつけた ChatGPT プロジェクトには多くの人が参加していますが、上から下まで大変な作業です。昨年、OpenAIがGoogleなどの企業に影を落としていたとき、同社の信頼と安全の責任者であるデイブ・ウィルナー氏はLinkedInで辞任を発表し、その理由として「熱意が強すぎた」ことを挙げた。

ウィルナー氏は7月20日に投稿した記事で、ワークライフバランスを優先するためOpenAIの幹部職を辞任すると述べ、辞任は「非常に簡単な選択」だったと語った。

同氏は、OpenAIの安全性プロジェクトを率いることは「今日最もクールで興味深い仕事の一つ」だが、2022年2月に同社に入社して以来、自身の仕事の範囲と規模は大幅に拡大したと述べた。 ChatGPT がスタートして以来、仕事よりも家族のニーズを優先することがますます難しくなりました。

ウィルナー氏の発表は、メタ、グーグル、エアビーアンドビーなどの管理職を含む同僚らから満場一致で支持され、評論家らはウィルナー氏の辞任は賢明で感動的な選択であり、優先事項の変化を公にするのは勇気がいることだと述べた。

その後の展開はすでにご存知のとおり、Google Gemini は追い上げを続け、先週は Sora が再び OpenAI のリードを広げました。

世の中にはタダ飯はないようだ。

正しい方向を選択し、信念を貫き、AGI の目標に向かって進んでください。長年にわたる OpenAI の浮き沈みは、最先端の研究機関がどのようなものであるべきかを私たちに鮮明に示してきました。

参考文献:

https://twitter.com/_jasonwei/status/1760032264120041684.

https://twitter.com/minchoi/status/1759932670782410880.

https://www.businessinsider.com/open-ai-sam-altman-daily-routine-schedule-for-productivity-2024-1.

https://www.businessinsider.com/openai-chatgpt-exec-resigns-work-life-balance-time-with-kids-2023-7.

<<:  人気のSoraはDiTを最前線に押し上げ、GitHubのホットリストにも載りました。新しいバージョンのSiTに進化しました。

>>:  世界シミュレーターはAGIの最終成果、12の状況予測です!チーフエキスパートによる1万語の記事がソラのマイルストーンを専門的に解釈

ブログ    
ブログ    

推薦する

...

OpenAI の危機は解決されましたが、人工知能の未来はどこに向かうのでしょうか?

OpenAI は、人工知能 (AI) の作成と推進を専門とする非営利団体です。そのビジョンは、人間...

フランスの科学者がアリのように移動できる六脚ロボットを開発

通常、ロボットやその他のデバイスは GPS を使用して屋外で自律的に移動を行います。しかし、フランス...

PyTorch と TensorFlow で画像分類モデルをトレーニングする方法

導入画像分類は、コンピューター ビジョンの最も重要なアプリケーションの 1 つです。その応用範囲は、...

...

...

最新の NaViT モデルは最高です!あらゆるアスペクト比と解像度に対応する強力なトランスフォーマー

本日は、あらゆるアスペクト比と解像度で動作する Transformer モデルである NaViT を...

今後5年間であなたの人生はどのように変わるでしょうか?人工知能は水力発電のようなさまざまな産業に参入する可能性がある

中国は最近、第14次5カ年計画の草案と2035年までの長期目標を発表し、各界から激しい議論を巻き起こ...

マスク氏はWeChatの複製に本気だ! 𝕏は音声通話とビデオ通話を推進します、シャオ・ザッカーバーグ:私は4年前にそれをやりました

マスク氏はツイッターで新たな計画を発表した。音声通話とビデオ通話を提供します。電話番号は必要ありませ...

3枚の写真からフィギュアの3Dモデルを生成!南カリフォルニア大学の中国人博士が、より現実的な新しいモデル「NeROIC」を提案しました。

ディープラーニングが加わったことで、コンピュータグラフィックスには多くの新しい分野が生まれました。 ...

行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

Javaは4つのWeChat赤い封筒をつかむアルゴリズムを実装し、感謝せずにそれを受け取ります

概要2014年にWeChatが紅包機能を開始した後、多くの企業が独自の紅包機能の開発を開始しました。...

2020 年に注目すべき 4 つのエンタープライズ AR トレンド

AR テクノロジーは消費者向け分野ではそれほど優れた成果を上げていませんが、ビジネス界では好まれてい...

人工知能の時代では、機械学習とAIアルゴリズムが「80/20ルール」を変えるだろう

[[186517]]ハーバード・ビジネス・レビューは、機械学習と AI アルゴリズムの進歩により、私...