ICML 2023 優秀論文賞発表!北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出

ICML 2023 優秀論文賞発表!北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出

ICML 2023 の賞品が発表されました!

今年は32件の候補論文の中から6件が優秀論文賞を受賞しました。

当局者らは、選考プロセスには平均点の審査とプログラム委員会メンバーからの推薦が含まれると述べた。

その後、16のテーマに関する論文が選ばれ、優秀論文賞の審査委員会に提出されました。

最終的に、審査員団は、明快さ、洞察力、創造性、および将来の潜在的な影響に基づいて、最終 6 つの論文を選択しました。

それでは、この6つの論文を見てみましょう。

D-適応による学習率フリー学習

組織: FAIR、Samsung AI Center

アーロン・デファジオ、コンスタンチン・ミシュチェンコ

論文アドレス: https://openreview.net/forum?id=GXZ6cT5cvY

D-適応とは、バックトラックや直線探索を行わず、各ステップで追加の関数値や勾配評価を行わずに、凸リプシッツ関数を最小化するための最適な収束率に漸近的に到達する学習率を自動的に設定する方法です。

このアプローチは、このような問題を最適化する際に従来の学習率選択によって課せられる制限を克服します。

研究者らの方法は、収束率に追加の乗法対数係数を伴わない、この種のものとしては初のハイパーパラメータフリー法である。

研究チームはまた、SGD と Adam の変種を使った広範な実験も発表しており、研究者のアプローチでは、大規模な視覚や言語の問題を含む 12 を超えるさまざまな機械学習の問題に対して、手動で調整された学習率を自動的に一致させています。

このプロジェクトはオープンソース化されました。

ICMLの関係者は、著者らがこのような問題を最適化する際に従来の学習率選択によって課せられる制限を克服する新しい方法を提案したと考えている。

この研究は、最適化分野への貴重かつ実用的な貢献が認められ、優秀論文賞を受賞しました。

大規模言語モデルのための透かし

機関: メリーランド大学

著者: John Kirchenbauer、Jonas Geiping、Yuxin Wen、Jonathan Katz、Ian Miers、Tom Goldstein

論文アドレス: https://openreview.net/forum?id=aX8ig9X2a7

過去 2 日間で、透かしについて何度も話しました。

米国の大手テクノロジー企業7社が共同で論文に透かしを追加し、透かしを検出できないことを証明したが、透かしがトレーニングデータ汚染の問題を解決できるかどうかは未解決のままである。

この論文では、LLM によって生成されたコンテンツに透かしを入れる実行可能な方法を紹介します。

概要: LLM の潜在的な害は、モデル出力に透かしを入れることで軽減できます。つまり、生成されたテキストに、人間には見えないが、短いトークンの範囲からアルゴリズムで検出できる信号を埋め込むことです。

研究者らは、独自の言語モデル用の透かしフレームワークを作成した。埋め込まれた透かしはテキストの品質にほとんど影響を与えず、言語モデルの API やパラメータにアクセスすることなく、効率的なオープンソース アルゴリズムを使用して検出できます。

これは、単語生成の前に緑のトークンのセットをランダムに選択し、サンプリング中に緑のトークンの使用を徐々に促進することによって機能します。

研究チームは、解釈可能なp値を使用した透かし検出の統計的テスト方法を提案し、透かしの感度を分析するための情報理論的枠組みを導き出しました。

透かしは、Open Pre-Trained Transformer (OPT) ファミリーのパラメータ モデルを使用してテストされ、堅牢性とセキュリティの問題について議論されます。

LLM によって生成された合成テキストを検出し監査するという重大な課題を考慮すると、この論文は業界に大きな影響を与える可能性があり、そのため受賞しました。

中国作家 温玉心

彼はメリーランド大学カレッジパーク校で学士号を取得し、現在はメリーランド大学カレッジパーク校のコンピューターサイエンス学部の博士課程に在籍しています。

目に見えないものの一般化、論理的推論、学位カリキュラム

機関: EPFL、Apple

著者: エマニュエル・アッベ、サミー・ベンジオ、アリオ・ロトフィ、ケビン・リズク

論文アドレス: https://openreview.net/forum?id=3dqwXb1te4

この論文では、分布外一般化の強力な例である GOTU 設定に焦点を当てて、ロジスティック関数の学習を検討します。

これは、一部の推論タスク (算術/論理など) では、データの豊富さの組み合わせの性質により、代表的なデータのサンプリングがより困難になり、GOTU 条件下での学習が成功すると、「外挿」または「推論」する学習者に直接的な情報が提供されるためです。

その後、研究チームは、GOTU の下で (S)GD によってトレーニングされたさまざまなネットワーク アーキテクチャのパフォーマンスを研究し、トランスフォーマー インスタンス、ランダム フィーチャ モデル、対角線形ネットワークなどのネットワーク モデルのクラスでは、未知のデータに対して最小次数補間を学習できるという理論的および実験的証拠を示しました。

同時に、研究者らは、他のインスタンスや学習率がより高い平均場ネットワークでも最小漏洩ソリューションを達成できることを証明しました。

これらの調査結果には 2 つの意味があります。

(1)長さの一般化問題を説明する。

(2)増分支援により単項式をより効率的に学習できるカリキュラム学習アルゴリズム「Degree-Curriculum」を紹介します。

ICML 関係者は、この論文がディープ ニューラル ネットワークの分野における重要な研究の方向性を概説している点で際立っていると考えています。

ゼロサム不完全情報ゲームにおけるゲームツリーへの適応

機関: エコール・ポリテクニーク、リヨン大学、オムロン・シニック・エックス、ディープマインド、フランス国立経済研究センター、CRITEO AI ラボ

著者: コーム・フィーゲル、ピエール・メナール、小角正、レミ・ムノス、ヴィアネイ・ペルシェ、ミハル・ヴァルコ

論文アドレス: https://openreview.net/forum?id=O1j4uFuSVW

ICML 関係者は、この研究によって新たな下限が厳密に確立され、Balanced FTRL と Adaptive FTRL という 2 つのアルゴリズムが提案されたと考えています。

これらの研究成果は、不完全情報ゲームの最適化を促進する上で重要な役割を果たしました。

実験はこれらの研究者によって出された結論を完全に確認した。

不完全情報ゲーム (IIG) とは、各参加者が現在のゲーム状態の一部しか観察できないゲームです。

研究者たちは、自己プレイと軌道フィードバックを通じてゼロサム不完全情報ゲームにおける最適な戦略を学習する方法を研究した

これらは、これらの高確率ポリシーを学習するために必要な実現回数について、問題に依存しない下限を提供します。

さらに、研究者らはこのシナリオに対して 2 つの Follow the Regularized Leader (FTRL) アルゴリズムを提案しました。

Balance FTRL はこの下限に一致しますが、正規化を定義するには情報セット構造に関する事前の知識が必要です。

2. Adaptive FTRL ではこの要件は必要ありません。

一般グラフ上の自己反発ランダムウォーク - 非線形マルコフ連鎖による最小サンプリング分散の達成

機関: IQVIA、ノースカロライナ州立大学

著者: Vishwaraj Doshi、Jie Hu、Do Young Eun

論文アドレス: https://openreview.net/forum?id=450iImFM4U

ICML の公式コメントでは、この論文は、自己排他的ランダムウォークを使用した MCMC (マルコフ連鎖モンテカルロ) 法という、挑戦的な未解決問題を検討していると考えています。

この論文は、従来の非バックトラッキング法を超え、MCMC サンプリング研究の新しい方向性を切り開きます。

著者らはマルコフ連鎖モンテカルロの文献に独創的で並外れた貢献をしており、このプロセスを厳密に分析し証明できたという事実は注目すべき成果です。

この論文はよく書かれており、主要な概念が明確かつ直感的に説明されており、結果も説得力があり包括的です。

具体的には、研究チームは、一般的な無向グラフなどの離散状態空間上のランダム ウォークの問題を研究しました。ランダム ウォーカーは、マルコフ連鎖モンテ カルロ (MCMC) プロセスを採用したアプローチで、サンプリングと近傍探索を通じてネットワーク トポロジ上のターゲット量を近似します。

研究者らは、ターゲット確率分布に対応する任意のマルコフ連鎖を前提として、過去に頻繁に訪問されたノードに向かう可能性が低く、めったに訪問されなかったノードに向かう可能性が高くなる自己反発ランダムウォーク (SRRW) を設計しました。

正の実数でパラメータ化された SRRW のクラスについては、プロセスの経験的分布が、基礎となるマルコフ連鎖カーネルのターゲット (定常) 分布にほぼ確実に収束することを示します。

次に、中心極限定理を提示し、結果として得られる漸近共分散行列の正確な形を導出します。これにより、より強い反発力 (より大きなパラメータ) を持つ SRRW は、共分散行列の Loewner 順序付けの意味で、常により小さな漸近共分散を達成することが示されます。

特に、SRRW 駆動型 MCMC アルゴリズムの場合、研究者らは漸近的サンプリング分散が の順序で減少し、最終的にゼロに近づくことを証明しました。

最後に、理論的結果を補完する数値シミュレーションを提供し、SRRW の時間増加バージョンが、より大きなパラメータによって引き起こされるより小さな漸近分散の利点と、より小さなパラメータで SRRW に観察されるより高速な混合特性を組み合わせていることを経験的に実証します。

その中には、中国の作家、Jie Hu 氏がいます。

彼は武漢理工大学で学士号、ノースウェスタン大学で修士号、ノースカロライナ州立大学で博士号を取得しました。現在はノースカロライナ州立大学のコンピュータ工学部の助手研究員です。

頻度主義的逐次学習のためのベイズ設計原則

機関: コロンビア大学

著者: Yunbei Xu、Assaf Zeevi

論文アドレス: https://openreview.net/forum?id=tRhQsHnoFw

ICMLの関係者は、この論文がスロットマシンやその他の逐次的な意思決定戦略の設計における非常に一般的な問題を解決すると確信している。

我々は、新しいアルゴリズム情報比を使用して任意のポリシーの後悔を制限する方法を提案し、この制限を最適化する方法を導出します。

この境界は、以前の同様の情報理論的量よりも厳密であり、これらの方法はランダムおよび敵対的なアームアンドアーム設定の両方で優れたパフォーマンスを発揮し、あらゆる面で最高の結果を達成します。

特に興味深いのは、この論文が、スロット マシンのよく知られたトンプソン サンプリング アルゴリズムや UCB アルゴリズムを超えて、ギャンブルの独特な探索-活用戦略を探求する新たな扉を開く可能性があることです。

さらに、この原理は強化学習の分野に拡張されると非常に有望になります。

したがって、この論文は専門家のレビューから満場一致で強力な支持を得ました。

具体的には、研究チームは、逐次学習問題における頻度主義的後悔を最適化するための一般理論を開発しました。これにより、統一されたベイズ原理から効率的なバンディット学習アルゴリズムと強化学習アルゴリズムを導き出すことができます。

彼らはまた、各ラウンドで「アルゴリズム的信念」を作成し、ベイズ事後確率を使用して決定を下す新しい最適化手法を提案しました。

これは、アルゴリズム的に単純で実装が容易でありながら、ベイズ型アルゴリズムを事前制約のない方法で一般的かつ最適な方法で敵対的設定に適用できるようにする最初のアプローチです。

研究者らは、重要な応用として、ランダム、敵対的、非定常な環境で「最適なグローバルパフォーマンス」を達成できる新しい多腕バンディットアルゴリズムも提案した。

研究者らは、これらの原理を線形バンディット、凸バンディット、強化学習に適用することも実証した。

この論文の中国人第一著者、徐雲北

彼は北京大学で学士号を取得し、コロンビア大学で博士号を取得し、現在はコロンビア大学で博士研究員として研究を行っています。

<<:  AIとソフトウェアが5Gデータセンターの変革を推進する方法

>>:  ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ソートアルゴリズムを簡単に学ぶ: よく使われるソートアルゴリズムを視覚的に体験

1. クイックソート導入:クイックソートは、Tony Hall によって開発されたソートアルゴリズム...

これらの10の機械学習手法をマスターすれば、あなたはサークルで最も人気のある人になるでしょう

科学研究でも産業界でも、機械学習はホットな話題であり、新しい機械学習手法が次々と登場しています。機械...

今日の世界において顔認識の重要性は何でしょうか?

顔認識技術の賛否は議論の余地がある。多くの利害関係者は利点を強調したが、批評家は欠点も指摘した。顔認...

ChatGPTはカスタムコマンドを起動します。一度言って覚えておけば、話すたびにそれに従います。

「私は小学校の理科の先生です。科学的な概念について説明していただきたいです。例や類推などのテクニッ...

ホワイトボードに描くだけでコードに変換されます。AI は UI デザイナーに取って代わるのでしょうか?

「新製品のホームページについてどう思いますか?」あなたは、UI、フロントエンド、マーケティング、運...

ネイチャー誌に「LK-99は超伝導体ではない」という記事が掲載された。

長年続いていた室温超伝導の謎が解明されたようだ。昨日、ネイチャー誌は「LK-99は室温超伝導体ではな...

スマート製品はどこにでもあります。人工知能と通常の知能の違いは何でしょうか?

多くの一般消費者にとって、どれが本物の人工知能でどれが単なる普通の知能なのかを区別することは不可能で...

Python 学習パス - Python スライス シミュレーション LRU アルゴリズム

問題の説明: プロセスが 3 つのメイン メモリ ブロックを使用する権利を取得しました。プロセスが ...

Scikit-learn を使用して機械学習用のテキストデータを準備する方法

[[208625]]テキスト データを使用して予測モデルを構築する前に、特別な準備が必要です。まずテ...

...

AIに関する哲学的考察 - 認知不変性とAI

米国国防高等研究計画局(DARPA)はかつて、第3波AIの概念を提唱しました。その議論では、第3波A...

...

機械学習における再現率、精度、正確さの指標は何ですか?

以前の記事では、Naive Bayes、KNN、KMeans、EM、線形回帰、ロジスティック回帰など...