ICML 2023 の賞品が発表されました! 今年は32件の候補論文の中から6件が優秀論文賞を受賞しました。 当局者らは、選考プロセスには平均点の審査とプログラム委員会メンバーからの推薦が含まれると述べた。 その後、16のテーマに関する論文が選ばれ、優秀論文賞の審査委員会に提出されました。 最終的に、審査員団は、明快さ、洞察力、創造性、および将来の潜在的な影響に基づいて、最終 6 つの論文を選択しました。 それでは、この6つの論文を見てみましょう。 D-適応による学習率フリー学習 組織: FAIR、Samsung AI Center アーロン・デファジオ、コンスタンチン・ミシュチェンコ 論文アドレス: https://openreview.net/forum?id=GXZ6cT5cvY D-適応とは、バックトラックや直線探索を行わず、各ステップで追加の関数値や勾配評価を行わずに、凸リプシッツ関数を最小化するための最適な収束率に漸近的に到達する学習率を自動的に設定する方法です。 このアプローチは、このような問題を最適化する際に従来の学習率選択によって課せられる制限を克服します。 研究者らの方法は、収束率に追加の乗法対数係数を伴わない、この種のものとしては初のハイパーパラメータフリー法である。 研究チームはまた、SGD と Adam の変種を使った広範な実験も発表しており、研究者のアプローチでは、大規模な視覚や言語の問題を含む 12 を超えるさまざまな機械学習の問題に対して、手動で調整された学習率を自動的に一致させています。 このプロジェクトはオープンソース化されました。 ICMLの関係者は、著者らがこのような問題を最適化する際に従来の学習率選択によって課せられる制限を克服する新しい方法を提案したと考えている。 この研究は、最適化分野への貴重かつ実用的な貢献が認められ、優秀論文賞を受賞しました。 大規模言語モデルのための透かし 機関: メリーランド大学 著者: John Kirchenbauer、Jonas Geiping、Yuxin Wen、Jonathan Katz、Ian Miers、Tom Goldstein 論文アドレス: https://openreview.net/forum?id=aX8ig9X2a7 過去 2 日間で、透かしについて何度も話しました。 米国の大手テクノロジー企業7社が共同で論文に透かしを追加し、透かしを検出できないことを証明したが、透かしがトレーニングデータ汚染の問題を解決できるかどうかは未解決のままである。 この論文では、LLM によって生成されたコンテンツに透かしを入れる実行可能な方法を紹介します。 概要: LLM の潜在的な害は、モデル出力に透かしを入れることで軽減できます。つまり、生成されたテキストに、人間には見えないが、短いトークンの範囲からアルゴリズムで検出できる信号を埋め込むことです。 研究者らは、独自の言語モデル用の透かしフレームワークを作成した。埋め込まれた透かしはテキストの品質にほとんど影響を与えず、言語モデルの API やパラメータにアクセスすることなく、効率的なオープンソース アルゴリズムを使用して検出できます。 これは、単語生成の前に緑のトークンのセットをランダムに選択し、サンプリング中に緑のトークンの使用を徐々に促進することによって機能します。 研究チームは、解釈可能なp値を使用した透かし検出の統計的テスト方法を提案し、透かしの感度を分析するための情報理論的枠組みを導き出しました。 透かしは、Open Pre-Trained Transformer (OPT) ファミリーのパラメータ モデルを使用してテストされ、堅牢性とセキュリティの問題について議論されます。 LLM によって生成された合成テキストを検出し監査するという重大な課題を考慮すると、この論文は業界に大きな影響を与える可能性があり、そのため受賞しました。 中国作家 温玉心 彼はメリーランド大学カレッジパーク校で学士号を取得し、現在はメリーランド大学カレッジパーク校のコンピューターサイエンス学部の博士課程に在籍しています。 目に見えないものの一般化、論理的推論、学位カリキュラム 機関: EPFL、Apple 著者: エマニュエル・アッベ、サミー・ベンジオ、アリオ・ロトフィ、ケビン・リズク 論文アドレス: https://openreview.net/forum?id=3dqwXb1te4 この論文では、分布外一般化の強力な例である GOTU 設定に焦点を当てて、ロジスティック関数の学習を検討します。 これは、一部の推論タスク (算術/論理など) では、データの豊富さの組み合わせの性質により、代表的なデータのサンプリングがより困難になり、GOTU 条件下での学習が成功すると、「外挿」または「推論」する学習者に直接的な情報が提供されるためです。 その後、研究チームは、GOTU の下で (S)GD によってトレーニングされたさまざまなネットワーク アーキテクチャのパフォーマンスを研究し、トランスフォーマー インスタンス、ランダム フィーチャ モデル、対角線形ネットワークなどのネットワーク モデルのクラスでは、未知のデータに対して最小次数補間を学習できるという理論的および実験的証拠を示しました。 同時に、研究者らは、他のインスタンスや学習率がより高い平均場ネットワークでも最小漏洩ソリューションを達成できることを証明しました。 これらの調査結果には 2 つの意味があります。 (1)長さの一般化問題を説明する。 (2)増分支援により単項式をより効率的に学習できるカリキュラム学習アルゴリズム「Degree-Curriculum」を紹介します。 ICML 関係者は、この論文がディープ ニューラル ネットワークの分野における重要な研究の方向性を概説している点で際立っていると考えています。 ゼロサム不完全情報ゲームにおけるゲームツリーへの適応 機関: エコール・ポリテクニーク、リヨン大学、オムロン・シニック・エックス、ディープマインド、フランス国立経済研究センター、CRITEO AI ラボ 著者: コーム・フィーゲル、ピエール・メナール、小角正、レミ・ムノス、ヴィアネイ・ペルシェ、ミハル・ヴァルコ 論文アドレス: https://openreview.net/forum?id=O1j4uFuSVW ICML 関係者は、この研究によって新たな下限が厳密に確立され、Balanced FTRL と Adaptive FTRL という 2 つのアルゴリズムが提案されたと考えています。 これらの研究成果は、不完全情報ゲームの最適化を促進する上で重要な役割を果たしました。 実験はこれらの研究者によって出された結論を完全に確認した。 不完全情報ゲーム (IIG) とは、各参加者が現在のゲーム状態の一部しか観察できないゲームです。 研究者たちは、自己プレイと軌道フィードバックを通じてゼロサム不完全情報ゲームにおける最適な戦略を学習する方法を研究した。 これらは、これらの高確率ポリシーを学習するために必要な実現回数について、問題に依存しない下限を提供します。 さらに、研究者らはこのシナリオに対して 2 つの Follow the Regularized Leader (FTRL) アルゴリズムを提案しました。 Balance FTRL はこの下限に一致しますが、正規化を定義するには情報セット構造に関する事前の知識が必要です。 2. Adaptive FTRL ではこの要件は必要ありません。 一般グラフ上の自己反発ランダムウォーク - 非線形マルコフ連鎖による最小サンプリング分散の達成 機関: IQVIA、ノースカロライナ州立大学 著者: Vishwaraj Doshi、Jie Hu、Do Young Eun 論文アドレス: https://openreview.net/forum?id=450iImFM4U ICML の公式コメントでは、この論文は、自己排他的ランダムウォークを使用した MCMC (マルコフ連鎖モンテカルロ) 法という、挑戦的な未解決問題を検討していると考えています。 この論文は、従来の非バックトラッキング法を超え、MCMC サンプリング研究の新しい方向性を切り開きます。 著者らはマルコフ連鎖モンテカルロの文献に独創的で並外れた貢献をしており、このプロセスを厳密に分析し証明できたという事実は注目すべき成果です。 この論文はよく書かれており、主要な概念が明確かつ直感的に説明されており、結果も説得力があり包括的です。 具体的には、研究チームは、一般的な無向グラフなどの離散状態空間上のランダム ウォークの問題を研究しました。ランダム ウォーカーは、マルコフ連鎖モンテ カルロ (MCMC) プロセスを採用したアプローチで、サンプリングと近傍探索を通じてネットワーク トポロジ上のターゲット量を近似します。 研究者らは、ターゲット確率分布に対応する任意のマルコフ連鎖を前提として、過去に頻繁に訪問されたノードに向かう可能性が低く、めったに訪問されなかったノードに向かう可能性が高くなる自己反発ランダムウォーク (SRRW) を設計しました。 正の実数でパラメータ化された SRRW のクラスについては、プロセスの経験的分布が、基礎となるマルコフ連鎖カーネルのターゲット (定常) 分布にほぼ確実に収束することを示します。 次に、中心極限定理を提示し、結果として得られる漸近共分散行列の正確な形を導出します。これにより、より強い反発力 (より大きなパラメータ) を持つ SRRW は、共分散行列の Loewner 順序付けの意味で、常により小さな漸近共分散を達成することが示されます。 特に、SRRW 駆動型 MCMC アルゴリズムの場合、研究者らは漸近的サンプリング分散が の順序で減少し、最終的にゼロに近づくことを証明しました。 最後に、理論的結果を補完する数値シミュレーションを提供し、SRRW の時間増加バージョンが、より大きなパラメータによって引き起こされるより小さな漸近分散の利点と、より小さなパラメータで SRRW に観察されるより高速な混合特性を組み合わせていることを経験的に実証します。 その中には、中国の作家、Jie Hu 氏がいます。 彼は武漢理工大学で学士号、ノースウェスタン大学で修士号、ノースカロライナ州立大学で博士号を取得しました。現在はノースカロライナ州立大学のコンピュータ工学部の助手研究員です。 頻度主義的逐次学習のためのベイズ設計原則 機関: コロンビア大学 著者: Yunbei Xu、Assaf Zeevi 論文アドレス: https://openreview.net/forum?id=tRhQsHnoFw ICMLの関係者は、この論文がスロットマシンやその他の逐次的な意思決定戦略の設計における非常に一般的な問題を解決すると確信している。 我々は、新しいアルゴリズム情報比を使用して任意のポリシーの後悔を制限する方法を提案し、この制限を最適化する方法を導出します。 この境界は、以前の同様の情報理論的量よりも厳密であり、これらの方法はランダムおよび敵対的なアームアンドアーム設定の両方で優れたパフォーマンスを発揮し、あらゆる面で最高の結果を達成します。 特に興味深いのは、この論文が、スロット マシンのよく知られたトンプソン サンプリング アルゴリズムや UCB アルゴリズムを超えて、ギャンブルの独特な探索-活用戦略を探求する新たな扉を開く可能性があることです。 さらに、この原理は強化学習の分野に拡張されると非常に有望になります。 したがって、この論文は専門家のレビューから満場一致で強力な支持を得ました。 具体的には、研究チームは、逐次学習問題における頻度主義的後悔を最適化するための一般理論を開発しました。これにより、統一されたベイズ原理から効率的なバンディット学習アルゴリズムと強化学習アルゴリズムを導き出すことができます。 彼らはまた、各ラウンドで「アルゴリズム的信念」を作成し、ベイズ事後確率を使用して決定を下す新しい最適化手法を提案しました。 これは、アルゴリズム的に単純で実装が容易でありながら、ベイズ型アルゴリズムを事前制約のない方法で一般的かつ最適な方法で敵対的設定に適用できるようにする最初のアプローチです。 研究者らは、重要な応用として、ランダム、敵対的、非定常な環境で「最適なグローバルパフォーマンス」を達成できる新しい多腕バンディットアルゴリズムも提案した。 研究者らは、これらの原理を線形バンディット、凸バンディット、強化学習に適用することも実証した。 この論文の中国人第一著者、徐雲北 彼は北京大学で学士号を取得し、コロンビア大学で博士号を取得し、現在はコロンビア大学で博士研究員として研究を行っています。 |
<<: AIとソフトウェアが5Gデータセンターの変革を推進する方法
>>: ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める
最近、ChatGPTの返信に見知らぬ男性の写真が現れるという事件が多くのネットユーザーに衝撃を与えま...
AI画像検出器が再び攻撃を受けました!最近、中東紛争の写真が大量にインターネット上に公開され、極限状...
坂を下るのと同じように、損失関数の最低点を見つけます。 [[336501]]ニューラル ネットワーク...
2022年11月30日のChatGPTのリリース以来、OpenAIが新しい機能をリリースするたびに...
[[404036]] 「仲間からのプレッシャーがリスクの高い行動につながることはわかっています。オン...
最近、中国人工知能学会、中国言語知能研究センターなどの主催による第3回中国知能教育会議が西安で開催さ...
インテリジェント製造(IM)は、インテリジェントマシンと人間の専門家で構成された人間と機械の統合イン...
Li Mu らによるオープンソースの中国語書籍「Hands-On Deep Learning」に ...
電子廃棄物[[277263]]環境の持続可能性のために AI と IoT を活用すると、現在の環境保...
3月15日にも、別の悪徳業者が監視カメラで摘発されたが、消費者の関心を最も集めたニュースは「顔情報の...