OpenAI 宮殿ドラマが終わったばかりですが、すぐにまた別の騒動が勃発しました。 ロイター通信は、アルトマン氏が解雇される前に、数人の研究者が取締役会に宛てて書いた警告書が、この事件全体の引き金になった可能性があることを明らかにした。 社内で Q (Q-Star と発音)* と名付けられている次世代 AI モデルは、非常に強力かつ先進的であるため、人類を脅かす可能性があります。 Q* は、この嵐の中心にいる人物、主任科学者イリヤ・スツケヴァーによって率いられています。 人々はすぐに、アルトマン氏のAPECサミットでの前回のスピーチを結び付けた。 OpenAI の歴史の中で、最近ではここ数週間で 4 回、私たちが無知のベールを押しのけて発見の最前線に到達するのを目の当たりにしてきました。これは私のキャリアで最高の栄誉です。 ” 写真 Q* には以下のコア特性があり、AGI または超知能への重要なステップであると考えられています。
このニュースはすぐに大きな議論を巻き起こし、マスク氏もリンクを貼って質問した。 写真 最新のミームは、一夜にしてウルトラマンや OpenAI の取締役会の専門家だった人々が Q* の専門家になったというものです。 データの制限を突破するThe Information の最新ニュースによると、Q* の前身は GPT-Zero であり、これは Ilya Sutskever 氏が開始し、DeepMind の Alpha-Zero に敬意を表して名付けられたプロジェクトです。 Alpha-Zero は人間のチェスの記録を学ぶ必要はなく、自分自身と対戦することで囲碁の遊び方を学びます。 GPT-Zero を使用すると、インターネットからキャプチャしたテキストや画像などの現実世界のデータに依存するのではなく、合成データを使用して次世代の AI モデルをトレーニングできます。 2021年にGPT-Zeroが正式にプロジェクトとして立ち上げられましたが、それ以降は直接関連するニュースはあまり発表されていません。 しかし、ほんの数週間前、イリヤはインタビューでこう言いました。 あまり詳しく説明することはできませんが、データの制限は克服可能であり、進歩は続くだろうと言えば十分でしょう。 写真 Q* は GPT-Zero に基づいて、Jakub Pachocki と Szymon Sidor によって開発されました。 二人とも OpenAI の初期メンバーであり、ウルトラマンを追ってマイクロソフトに移籍することを最初に発表した人物の一人です。 写真 Jakub Pachocki 氏は先月、研究ディレクターに昇進しました。同氏は、Dota 2 プロジェクトや GPT-4 の事前トレーニングなど、これまで多くの画期的な成果に中核的な貢献をしてきました。 写真 Szymon Sidor 氏も Dota 2 プロジェクトに参加しました。彼の個人的なプロフィールは「コードを 1 行ずつ作成して AGI を構築する」です。 写真 ロイターの報道によると、Q* に膨大な計算リソースを提供することで、特定の数学的問題を解決できるようになるとのことです。現在の数学の能力は小学校レベルに過ぎないが、研究者たちは将来の成功について非常に楽観的である。 また、OpenAIは、初期の「Code Gen」チームと「Math Gen」チームを統合して「AI Scientists」という新しいチームを設立したことも言及されました。このチームは、AIの推論能力を最適化および改善し、最終的には科学的探究を行う方法を模索しています。 3つの推測Q* が何であるかについてはこれ以上の具体的な情報はありませんが、名前に基づいて Q 学習に関連しているのではないかと推測する人もいます。 Q 学習は 1989 年にまで遡ります。これは、環境のモデリングを必要とせず、特別な変更を加えずにランダムな要素を持つ伝達関数や報酬関数に適応できる、モデルフリーの強化学習アルゴリズムです。 他の強化学習アルゴリズムと比較して、Q 学習は、アクション ポリシー自体を直接学習するのではなく、各状態とアクションのペアの値を学習して、長期的にどのアクションが最大の報酬をもたらすかを決定することに重点を置いています。 2番目の推測は、OpenAIが5月に「結果の監視」ではなく「プロセスの監視」を通じて数学の問題を解くという発表に関連している。 写真 しかし、この研究成果への貢献者リストには、Jakub Pachocki 氏と Szymon Sidor 氏の名前は記載されていません。 写真 また、7月にOpenAIに加わった「テキサスポーカーAIの父」ノーム・ブラウン氏もこのプロジェクトに関係しているのではないかと推測する人もいる。 写真 入社した際、彼はこれまでゲームにしか適用できなかった手法を一般化したいと語った。推論は1,000倍遅くなり、コストもかかるかもしれないが、新薬の発見や数学的推測の証明につながるかもしれない。 これは、「膨大な計算リソースを必要とする」ことと「特定の数学的問題を解決できる」という噂の説明に当てはまります。 写真 まだほとんどが推測の域を出ませんが、合成データと強化学習が AI を次の段階に進めることができるかどうかは、業界で最も議論されているトピックの 1 つになっています。 NVIDIA の科学者 Linxi Fan 氏は、合成データによって何兆もの高品質なトレーニング トークンが提供されると考えています。重要な問題は、いかにして品質を維持し、ボトルネックに早く到達しないようにするかです。 写真 マスク氏もこれに同意し、これまで人間が書いたあらゆる本は1台のハードドライブに収まるが、合成データはその規模をはるかに超えるだろうと指摘した。 写真 しかし、チューリング賞の三大巨頭の一人であるルカン氏は、合成データの増加は一時的な対策に過ぎず、最終的には人間や動物のように非常に少ないデータでAIが学習できるようにする必要があると考えている。 写真 ライス大学の博士であるキャメロン・R・ウルフ氏は、Q学習はAGIを実現する秘密ではないかもしれないと語った。
強化学習による微調整が、高性能な大規模モデル(ChatGPT/GPT-4など)をトレーニングする秘訣であると彼は語った。しかし、強化学習は本質的にデータ効率が悪く、強化学習の微調整に手動で注釈を付けたデータセットを使用するとコストが非常に高くなります。これを念頭に置くと、AI 研究の進歩 (少なくとも現在のパラダイムでは) は、次の 2 つの基本的な目標に大きく依存することになります。
…デコーダーのみのトランスフォーマーの次のトークン予測パラダイム(事前トレーニング -> SFT -> RLHF)に固執する場合…これら 2 つのアプローチを組み合わせることで、資金が豊富な研究チームだけでなく、誰もが最先端のトレーニング手法を利用できるようになります。 写真 もう一つOpenAI内ではまだ誰もQ*のメッセージに反応していない。 しかしアルトマン氏は、取締役として残っているQuoraの創設者アダム・ダンジェロ氏と数時間にわたり友好的な会話をしたと明かしたばかりだ。 写真 誰もが推測していたように、この事件の背後にアダム・ダンジェロがいたかどうかはともかく、和解が成立したようだ。 参考リンク: |
<<: 「ビッグモデルは基本的に2つのファイルです!」テスラの元AIディレクターが一般向けに1時間にわたるLLMポピュラーサイエンスを披露
>>: AIは「技術力」の集中を加速させる。巨大企業によるAIの独占は深刻な結果をもたらすのか?
[[206421]]国慶節の連休中の数日間、河南省では新たなテクノロジードラマが繰り広げられた。コン...
[[409963]]学術研究の特許所有権は、研究者の研究成果を保護し、保証するものであるため、研究者...
[[315528]] [51CTO.com クイック翻訳] ビジネスの発展を推進するために、AI(人...
機械学習の初心者であっても、中級プログラマーであっても、この質問に戸惑うかもしれません。チートシート...
信用組合サービス組織の PSCU は、数年にわたって企業開発に注力しており、同社はロボットによるプロ...
今年末までに、世界中で接続されるデバイスの数は 500 億台に達すると予測されており、モノのインター...
最近、ZTEコーポレーションは人物再識別(ReID)技術で画期的な進歩を遂げました。Market15...
AIが描く人物をよりリアルにするため、香港中文大学の博士課程の学生たちは3億4000万枚の画像を使っ...
ニューラル ネットワーク (NN) アーキテクチャ ダイアグラムの作成には、多くの場合、時間と労力が...
現在の教育における人工知能の応用は、依然として「弱い人工知能」になりがちですが、教育の効率性を向上さ...
[Lieyun.com (WeChat ID: )] 9月14日レポート(小白訳)ソフトウェアは世界...
[[377911]]昨年12月中旬、上海市民の夏さんは徐匯河畔にレジャーに出かけ、「海上タワー」近...
今年初めの Red Hat Summit で、Red Hat は OpenShift AI によるプ...