ICML 2023 優秀論文賞発表！北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出

ICML 2023 の賞品が発表されました!

今年は32件の候補論文の中から6件が優秀論文賞を受賞しました。

当局者らは、選考プロセスには平均点の審査とプログラム委員会メンバーからの推薦が含まれると述べた。

その後、16のテーマに関する論文が選ばれ、優秀論文賞の審査委員会に提出されました。

最終的に、審査員団は、明快さ、洞察力、創造性、および将来の潜在的な影響に基づいて、最終 6 つの論文を選択しました。

それでは、この6つの論文を見てみましょう。

D-適応による学習率フリー学習

組織: FAIR、Samsung AI Center

アーロン・デファジオ、コンスタンチン・ミシュチェンコ

論文アドレス: https://openreview.net/forum?id=GXZ6cT5cvY

D-適応とは、バックトラックや直線探索を行わず、各ステップで追加の関数値や勾配評価を行わずに、凸リプシッツ関数を最小化するための最適な収束率に漸近的に到達する学習率を自動的に設定する方法です。

このアプローチは、このような問題を最適化する際に従来の学習率選択によって課せられる制限を克服します。

研究者らの方法は、収束率に追加の乗法対数係数を伴わない、この種のものとしては初のハイパーパラメータフリー法である。

研究チームはまた、SGD と Adam の変種を使った広範な実験も発表しており、研究者のアプローチでは、大規模な視覚や言語の問題を含む 12 を超えるさまざまな機械学習の問題に対して、手動で調整された学習率を自動的に一致させています。

このプロジェクトはオープンソース化されました。

ICMLの関係者は、著者らがこのような問題を最適化する際に従来の学習率選択によって課せられる制限を克服する新しい方法を提案したと考えている。

この研究は、最適化分野への貴重かつ実用的な貢献が認められ、優秀論文賞を受賞しました。

大規模言語モデルのための透かし

機関: メリーランド大学

著者: John Kirchenbauer、Jonas Geiping、Yuxin Wen、Jonathan Katz、Ian Miers、Tom Goldstein

論文アドレス: https://openreview.net/forum?id=aX8ig9X2a7

過去 2 日間で、透かしについて何度も話しました。

米国の大手テクノロジー企業7社が共同で論文に透かしを追加し、透かしを検出できないことを証明したが、透かしがトレーニングデータ汚染の問題を解決できるかどうかは未解決のままである。

この論文では、LLM によって生成されたコンテンツに透かしを入れる実行可能な方法を紹介します。

概要: LLM の潜在的な害は、モデル出力に透かしを入れることで軽減できます。つまり、生成されたテキストに、人間には見えないが、短いトークンの範囲からアルゴリズムで検出できる信号を埋め込むことです。

研究者らは、独自の言語モデル用の透かしフレームワークを作成した。埋め込まれた透かしはテキストの品質にほとんど影響を与えず、言語モデルの API やパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使用して検出できます。

これは、単語生成の前に緑のトークンのセットをランダムに選択し、サンプリング中に緑のトークンの使用を徐々に促進することによって機能します。

研究チームは、解釈可能なp値を使用した透かし検出の統計的テスト方法を提案し、透かしの感度を分析するための情報理論的枠組みを導き出しました。

透かしは、Open Pre-Trained Transformer (OPT) ファミリーのパラメータモデルを使用してテストされ、堅牢性とセキュリティの問題について議論されます。

LLM によって生成された合成テキストを検出し監査するという重大な課題を考慮すると、この論文は業界に大きな影響を与える可能性があり、そのため受賞しました。

中国作家温玉心

彼はメリーランド大学カレッジパーク校で学士号を取得し、現在はメリーランド大学カレッジパーク校のコンピューターサイエンス学部の博士課程に在籍しています。

目に見えないものの一般化、論理的推論、学位カリキュラム

機関: EPFL、Apple

著者: エマニュエル・アッベ、サミー・ベンジオ、アリオ・ロトフィ、ケビン・リズク

論文アドレス: https://openreview.net/forum?id=3dqwXb1te4

この論文では、分布外一般化の強力な例である GOTU 設定に焦点を当てて、ロジスティック関数の学習を検討します。

これは、一部の推論タスク (算術/論理など) では、データの豊富さの組み合わせの性質により、代表的なデータのサンプリングがより困難になり、GOTU 条件下での学習が成功すると、「外挿」または「推論」する学習者に直接的な情報が提供されるためです。

その後、研究チームは、GOTU の下で (S)GD によってトレーニングされたさまざまなネットワークアーキテクチャのパフォーマンスを研究し、トランスフォーマーインスタンス、ランダムフィーチャモデル、対角線形ネットワークなどのネットワークモデルのクラスでは、未知のデータに対して最小次数補間を学習できるという理論的および実験的証拠を示しました。

同時に、研究者らは、他のインスタンスや学習率がより高い平均場ネットワークでも最小漏洩ソリューションを達成できることを証明しました。

これらの調査結果には 2 つの意味があります。

（１）長さの一般化問題を説明する。

（２）増分支援により単項式をより効率的に学習できるカリキュラム学習アルゴリズム「Degree-Curriculum」を紹介します。

ICML 関係者は、この論文がディープニューラルネットワークの分野における重要な研究の方向性を概説している点で際立っていると考えています。

ゼロサム不完全情報ゲームにおけるゲームツリーへの適応

機関: エコール・ポリテクニーク、リヨン大学、オムロン・シニック・エックス、ディープマインド、フランス国立経済研究センター、CRITEO AI ラボ

著者: コーム・フィーゲル、ピエール・メナール、小角正、レミ・ムノス、ヴィアネイ・ペルシェ、ミハル・ヴァルコ

論文アドレス: https://openreview.net/forum?id=O1j4uFuSVW

ICML 関係者は、この研究によって新たな下限が厳密に確立され、Balanced FTRL と Adaptive FTRL という 2 つのアルゴリズムが提案されたと考えています。

これらの研究成果は、不完全情報ゲームの最適化を促進する上で重要な役割を果たしました。

実験はこれらの研究者によって出された結論を完全に確認した。

不完全情報ゲーム (IIG) とは、各参加者が現在のゲーム状態の一部しか観察できないゲームです。

研究者たちは、自己プレイと軌道フィードバックを通じてゼロサム不完全情報ゲームにおける最適な戦略を学習する方法を研究した。

これらは、これらの高確率ポリシーを学習するために必要な実現回数について、問題に依存しない下限を提供します。

さらに、研究者らはこのシナリオに対して 2 つの Follow the Regularized Leader (FTRL) アルゴリズムを提案しました。

Balance FTRL はこの下限に一致しますが、正規化を定義するには情報セット構造に関する事前の知識が必要です。

2. Adaptive FTRL ではこの要件は必要ありません。

一般グラフ上の自己反発ランダムウォーク - 非線形マルコフ連鎖による最小サンプリング分散の達成

機関: IQVIA、ノースカロライナ州立大学

著者: Vishwaraj Doshi、Jie Hu、Do Young Eun

論文アドレス: https://openreview.net/forum?id=450iImFM4U

ICML の公式コメントでは、この論文は、自己排他的ランダムウォークを使用した MCMC (マルコフ連鎖モンテカルロ) 法という、挑戦的な未解決問題を検討していると考えています。

この論文は、従来の非バックトラッキング法を超え、MCMC サンプリング研究の新しい方向性を切り開きます。

著者らはマルコフ連鎖モンテカルロの文献に独創的で並外れた貢献をしており、このプロセスを厳密に分析し証明できたという事実は注目すべき成果です。

この論文はよく書かれており、主要な概念が明確かつ直感的に説明されており、結果も説得力があり包括的です。

具体的には、研究チームは、一般的な無向グラフなどの離散状態空間上のランダムウォークの問題を研究しました。ランダムウォーカーは、マルコフ連鎖モンテカルロ (MCMC) プロセスを採用したアプローチで、サンプリングと近傍探索を通じてネットワークトポロジ上のターゲット量を近似します。

研究者らは、ターゲット確率分布に対応する任意のマルコフ連鎖を前提として、過去に頻繁に訪問されたノードに向かう可能性が低く、めったに訪問されなかったノードに向かう可能性が高くなる自己反発ランダムウォーク (SRRW) を設計しました。

正の実数でパラメータ化された SRRW のクラスについては、プロセスの経験的分布が、基礎となるマルコフ連鎖カーネルのターゲット (定常) 分布にほぼ確実に収束することを示します。

次に、中心極限定理を提示し、結果として得られる漸近共分散行列の正確な形を導出します。これにより、より強い反発力 (より大きなパラメータ) を持つ SRRW は、共分散行列の Loewner 順序付けの意味で、常により小さな漸近共分散を達成することが示されます。

特に、SRRW 駆動型 MCMC アルゴリズムの場合、研究者らは漸近的サンプリング分散がの順序で減少し、最終的にゼロに近づくことを証明しました。

最後に、理論的結果を補完する数値シミュレーションを提供し、SRRW の時間増加バージョンが、より大きなパラメータによって引き起こされるより小さな漸近分散の利点と、より小さなパラメータで SRRW に観察されるより高速な混合特性を組み合わせていることを経験的に実証します。

その中には、中国の作家、Jie Hu 氏がいます。

彼は武漢理工大学で学士号、ノースウェスタン大学で修士号、ノースカロライナ州立大学で博士号を取得しました。現在はノースカロライナ州立大学のコンピュータ工学部の助手研究員です。

頻度主義的逐次学習のためのベイズ設計原則

機関: コロンビア大学

著者: Yunbei Xu、Assaf Zeevi

論文アドレス: https://openreview.net/forum?id=tRhQsHnoFw

ICMLの関係者は、この論文がスロットマシンやその他の逐次的な意思決定戦略の設計における非常に一般的な問題を解決すると確信している。

我々は、新しいアルゴリズム情報比を使用して任意のポリシーの後悔を制限する方法を提案し、この制限を最適化する方法を導出します。

この境界は、以前の同様の情報理論的量よりも厳密であり、これらの方法はランダムおよび敵対的なアームアンドアーム設定の両方で優れたパフォーマンスを発揮し、あらゆる面で最高の結果を達成します。

特に興味深いのは、この論文が、スロットマシンのよく知られたトンプソンサンプリングアルゴリズムや UCB アルゴリズムを超えて、ギャンブルの独特な探索-活用戦略を探求する新たな扉を開く可能性があることです。

さらに、この原理は強化学習の分野に拡張されると非常に有望になります。

したがって、この論文は専門家のレビューから満場一致で強力な支持を得ました。

具体的には、研究チームは、逐次学習問題における頻度主義的後悔を最適化するための一般理論を開発しました。これにより、統一されたベイズ原理から効率的なバンディット学習アルゴリズムと強化学習アルゴリズムを導き出すことができます。

彼らはまた、各ラウンドで「アルゴリズム的信念」を作成し、ベイズ事後確率を使用して決定を下す新しい最適化手法を提案しました。

これは、アルゴリズム的に単純で実装が容易でありながら、ベイズ型アルゴリズムを事前制約のない方法で一般的かつ最適な方法で敵対的設定に適用できるようにする最初のアプローチです。

研究者らは、重要な応用として、ランダム、敵対的、非定常な環境で「最適なグローバルパフォーマンス」を達成できる新しい多腕バンディットアルゴリズムも提案した。

研究者らは、これらの原理を線形バンディット、凸バンディット、強化学習に適用することも実証した。

この論文の中国人第一著者、徐雲北

彼は北京大学で学士号を取得し、コロンビア大学で博士号を取得し、現在はコロンビア大学で博士研究員として研究を行っています。

<<: AIとソフトウェアが5Gデータセンターの変革を推進する方法

>>: ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

ICML 2023 優秀論文賞発表！北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出

MySQL インデックスの背後にあるデータ構造とアルゴリズムの基礎

AppleはAI競争で遅れをとり、市場価値ランキングはAmazon、Google、Microsoftに追い抜かれる可能性も

AIが中国の山水画を生成！プリンストン大学の女子学生が卒業制作で描いた線と筆致は、人間の観察者の半数を騙した。

AI研究も印象派から学べるのでしょうか？これらの生きているような人物は3Dモデルであることが判明した

高校の授業に人工知能が進出。全国40校がこの教材を導入

AIと機械学習が克服すべき3つのハードル

130 の大学が人工知能専攻を追加。次の「陥没穴」専攻になるのでしょうか?

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

Google Brain の最新研究: AutoML メソッドが Dropout モードを自動的に学習

AIエージェントに完全な人生を与えましょう！ HKU NYU Xie Sainingらによる最新の知的研究：仮想は現実である

推薦する

インタビュー必読: 4 つの典型的な電流制限アルゴリズムの説明

グラフ機械学習の特徴伝播を用いた欠損データの再構築

PAI-ChatLearn: 柔軟で使いやすく、大規模な RLHF 効率トレーニングフレームワーク (Alibaba Cloud の最新の実践)

無人運転車の現状はどうなっているのでしょうか?

建築環境における人工知能：その可能性を実現するためのステップ

Meta社が来年、新たな大型モデル「GPT-4レベルのオープンソース版」をリリースすることが明らかになりました！パラメータ数はLlama 2より数倍多く、商用利用も無料です。

AIoTは公共交通機関をよりスマートかつ安全にします

「Split Everything」のビデオ版はこちらです。数回クリックするだけで、動いている人物や物体が丸で囲まれます。

教科書では学べない機械学習に関する12の「民間伝承」

人工知能ニューラルネットワークとは何ですか?なぜ人間の推論を実現したり、意識を生成したりできないのでしょうか?

マイクロソフトがML.NET 3.0をリリース、ディープラーニング機能を拡張

医師は依然として自分の経験をより信頼しています。病院はビッグデータの収集と機械学習の過負荷の問題をどのように解決するのでしょうか?