なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密：私たちは

OpenAI が最初に Sora を作成した理由は何ですか?

現在、世界中の研究者、エンジニア、投資家がこの疑問を抱いています。

最近、ビデオモデルSoraに関する人々の議論は引き続き加熱しており、情報はすでに循環を突破し、2ラウンドの関連投資ホットスポットが登場しています。

Sora が作成した「花虎」ビデオ。この生成能力によって、どれだけの新しいアイデアが生まれるのでしょうか?

カリフォルニア大学バークレー校でコンピューターサイエンスの博士号を取得し、Zhihu の著者でもある @SIY.Z 氏は、ある記事の中で、OpenAI の成功の理由のいくつかを分析しました。

目標とビジネスモデルは明確です。目標は AGI に全力を注ぐことであり、すべての研究は AGI への道を探ることを中心に展開されます。ビジネスモデルは API を直接提供する SaaS です。
方法論は明確で、「苦い教訓」（リッチ・サットンの古典的な論文「苦い教訓」から派生したもので、中心となる考え方は「人工知能を長期的に向上させたいのであれば、計算能力を利用するのが最善の方法である」）、スケーリングの法則、新たな特性などが含まれます。

@SIY.Zは、「OpenAIのビジネスモデル、AGIへの信念、体系的な方法論、積極的な試みはすべて、汎用人工知能の実現と、すべてのAGI技術スタックで実行できるモデルの実現という目標に向かって同社を推し進めている。これは、OpenAIが多くの研究機関や企業の中で際立っている重要な要素である」と結論付けた。詳細については、オリジナルのZhihuの投稿をご覧ください。

オリジナルのZhihu投稿アドレス: https://www.zhihu.com/question/644486081/answer/3398751210?utm_psn=1743584603837992961

さらに、才能の集結も OpenAI の成功の重要な要素であることもわかっています。これらの才能は OpenAI でどのように働くのでしょうか? ChatGPTやSoraのような最先端の技術的成果を生み出すには、天才たちは多大な努力を払う必要があるのではないでしょうか?答えはノーのようです。

今朝早く、OpenAI の研究者 Jason Wei 氏が自ら公開した日々の仕事のタイムラインがソーシャルネットワーク上で話題になりました。

Jason Wei は大学卒業後に Google に入社し、第一著者として先駆的な研究「Thinking Chain」を執筆しました。現在は OpenAI で ChatGPT の作成に携わっています。

このスケジュールを時系列順に見てみましょう。

朝は普通に見えました:

9時に起きてください。
午前9時半にWaymoの無人運転車に乗って会社に行き、朝食にアボカドトーストを食べました。
9:45: OpenAI 憲章 (その中核は、汎用人工知能が全人類に利益をもたらすようにすることです) を暗唱し、最適な神に祈り、「苦い教訓」を学びます。
10 時に Google Meet ミーティングを開催し、より多くのデータでより大きなモデルをトレーニングする方法について話し合いました。
11. より多くのデータでより大きなモデルをトレーニングするためのコードを記述します。
12:00 カフェテリアへ行き、昼食（ベジタリアン、グルテンフリー）を食べます。

午後になると仕事の強度が増します。

1 モデルのトレーニングを続けます。
2. インフラストラクチャの問題をデバッグします。
3. モデルのトレーニングを監視し、Sora で遊びます。
4. 前述のトレーニング済みモデルに対してプロンプトエンジニアリングを実行します。
4時半に休憩を取り、アボカドチェアに座りながら、ジェミニウルトラの素晴らしさを考えました。
5. モデルを改善するための潜在的なアルゴリズムについてブレインストーミングします。
5:05 結論: アルゴリズムを変更するのはリスクが大きすぎるため、コンピューティングとデータを拡張する方が安全です。
6時に夕食を食べます。
7時に帰宅。

そして、多くの人と同じように、夜が来て最も生産性の高い時間がやってきます。

8 時、ワインを一杯飲みながらコードを書き続けました。この時点で、私はバルマーピークに達しました (伝説によると、マイクロソフトは 1980 年代後半に、血中アルコール濃度が 0.129% から 0.138% の間になるとプログラマーは超人的なプログラミング能力を発揮するという法則を発見しました)。
9:00: 実験実行を分析します。
午前 10 時: 実験を開始し、一晩実行して、翌朝に結果を取得します。
午前 1 時: 実験が実際に実行され始めます。
1時15分に寝ます。「必要なのは圧縮だけだ」と自分に言い聞かせてください。

情報量はかなり豊富。ウルトラマン社長のベジタリアン食を真似したり、Teamsが使いにくいと揶揄したりと、OpenAIのエンジニアも競合他社の動向を非常に気にしているようです。

それを見た後、Meta FAIR研究所の研究員兼シニアマネージャーである田元東氏は次のように語った。「海外には996はないと言われていますが、実際に本当に恐ろしいのは、自己駆動のスケジュールです。」

先週末、DiT 論文の著者の 1 人である謝彩寧氏は、自分が Sora の著者ではないという噂を否定する一方で、プロジェクトリーダーのウィリアム (ビル) ピーブルズ氏らが Sora の構築に注いだ作業の激しさについて少し情報を明かしました。

「私は1年間、寝ずに一生懸命働きました。」

先週の水曜日、OpenAIに2度目の復帰を果たした著名なAI研究者のアンドレイ・カルパシー氏が、今度はわずか1年で再び辞任を発表した。「特に何もなかった」としながらも、翌日のスケジュールを公開した。

画面から溢れ出るやさしさを感じさせます。

これは、製品がオンラインになる前の最前線のエンジニアにのみ当てはまるのでしょうか?あまり。生成 AI に火をつけた ChatGPT プロジェクトには多くの人が参加していますが、上から下まで大変な作業です。昨年、OpenAIがGoogleなどの企業に影を落としていたとき、同社の信頼と安全の責任者であるデイブ・ウィルナー氏はLinkedInで辞任を発表し、その理由として「熱意が強すぎた」ことを挙げた。

ウィルナー氏は7月20日に投稿した記事で、ワークライフバランスを優先するためOpenAIの幹部職を辞任すると述べ、辞任は「非常に簡単な選択」だったと語った。

同氏は、OpenAIの安全性プロジェクトを率いることは「今日最もクールで興味深い仕事の一つ」だが、2022年2月に同社に入社して以来、自身の仕事の範囲と規模は大幅に拡大したと述べた。 ChatGPT がスタートして以来、仕事よりも家族のニーズを優先することがますます難しくなりました。

ウィルナー氏の発表は、メタ、グーグル、エアビーアンドビーなどの管理職を含む同僚らから満場一致で支持され、評論家らはウィルナー氏の辞任は賢明で感動的な選択であり、優先事項の変化を公にするのは勇気がいることだと述べた。

その後の展開はすでにご存知のとおり、Google Gemini は追い上げを続け、先週は Sora が再び OpenAI のリードを広げました。

世の中にはタダ飯はないようだ。

正しい方向を選択し、信念を貫き、AGI の目標に向かって進んでください。長年にわたる OpenAI の浮き沈みは、最先端の研究機関がどのようなものであるべきかを私たちに鮮明に示してきました。

参考文献:

https://twitter.com/_jasonwei/status/1760032264120041684.

https://twitter.com/minchoi/status/1759932670782410880.

https://www.businessinsider.com/open-ai-sam-altman-daily-routine-schedule-for-productivity-2024-1.

https://www.businessinsider.com/openai-chatgpt-exec-resigns-work-life-balance-time-with-kids-2023-7.

>>: 世界シミュレーターはAGIの最終成果、12の状況予測です！チーフエキスパートによる1万語の記事がソラのマイルストーンを専門的に解釈

なぜSoraはOpenAIから生まれたのでしょうか?最前線で働く従業員の勤務と休息のタイムラインの秘密：私たちは

CTOは「大きな衝撃を受けた」：GPT-4Vの自動運転テストを5回連続で実施

108 言語をサポートする Google 翻訳は、AI をどのように活用して翻訳の品質を向上させているのでしょうか?

1行のコードでデバッグと印刷を排除し、アルゴリズムの学習を支援

わずか 1/500 のデータで Atari ゲームをマスターしましょう!清華大学クロススクール研究所の助教授が小規模データRLモデルを提案し、AIコミュニティの波を引き起こした。

マイクロソフトはWindows 11アプリストアの検索アルゴリズムを改善し、ブラウザウェブアプリのインストールをサポートする予定

最新の出来事を常に把握しましょう! Soraモデルテキスト生成ビデオをサポートするWebクライアント

人工知能認識により、物流会社はダブルイレブンの注文に簡単に対応できます。

マスク氏は激怒：マイクロソフトはAI用のデータ収集にWindowsを使用しているが、登録なしでは使用できない

インテリジェント製造業が波に乗る中、産業用ロボットはどのようにして主導権を握ることができるのでしょうか?

推薦する

CAIOは企業が緊急に必要とする人材になりつつある

マッキンゼーのレポート: 2030 年までに 8 億人が機械に置き換えられ、約 1 億人の中国人が転職を余儀なくされる!

中国の新世代人工知能レポートが発表：中国はAI論文数で世界一

インテリジェントAIのサポートにより、Xiaomi YoupinはYESOUL Wild Beast高反発腹筋ホイールをクラウドファンディング

AIに単純なことを教える: ゼロから最初のニューラルネットワークを構築する

クラウドコンピューティングと人工知能が伝統的な医学を覆すのは時間の問題だ

マシンビジョンは人工知能の次のフロンティアとなる

物流でGenAIを効果的に活用するための鍵は、ユースケースを理解することです。

AIベースの顔認識は工場にとって次の技術的マイルストーンとなる

シンガポールは路上での悪質な行為を検知するためにロボットを使っている

AIビッグモデルがついにデータ争奪戦に参戦