GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

仕事をうまくやり遂げたいなら、まず道具を研がなければなりません。

仕事で独自の ML プロジェクトを実施する前に、その分野の最先端の進歩を理解し、先人の経験を吸収する必要があります。

しかし、arXiv には毎日何百もの新しい論文が掲載されています。どれを読む価値があるのでしょうか?

この目的のために、Amazon のエンジニアである Eugene Yan 氏らは論文集を作成しました。この GitHub プロジェクトでは、Google、Amazon、Facebook などの大手企業のデータサイエンスや機械学習に関する論文やブログ投稿を継続的に共有しています。

これらの論文/記事は、検索ランキングから NLP や CV まで 24 の異なるカテゴリをカバーしており、こちらからご覧いただけます。

データ品質

データエンジニアリング

データマイニング

分類

戻る

推奨アルゴリズム

検索ランキング

埋め込み

自然言語処理

シーケンスモデリング

予測する

コンピュータビジョン

強化学習

異常検出

グラフィックス

最適化

情報抽出

弱い監督

生成する

効率

検証とA/Bテスト

倫理

練習する

失敗

現在の星評価は2.3kです。

推奨アルゴリズムを例に挙げてみましょう。

業界が異なれば、ビジネスも大きく異なります。アルゴリズムの基本的なフレームワークは似ていますが、正確な推奨モデルをトレーニングするには、細部にはまだ多くの違いがあります。

このリストには、電子商取引、ビデオ、音楽、コースなど、さまざまなビジネス向けの推奨アルゴリズム技術に関するブログ/論文が集められています。

たとえば、Alibaba の「Alibaba における E コマース推奨のための行動シーケンス トランスフォーマー」などです。

この論文では、Alibaba の電子商取引推奨システムにおける動作シーケンス Transformer の応用について紹介します。

研究者らは、Transformer モデルを使用して、ユーザーの行動シーケンスの背後にある連続的な信号をキャプチャし、パーソナライズされた推奨事項の有効性を高め、クリックスルー率を向上させることを提案しました。実験検証の後、彼らはこのモデルをオンラインの Taobao に展開し、この方法がベースラインと比較してオンラインのクリックスルー率を大幅に向上できることを実証しました。

論文リンク:
https://arxiv.org/abs/1905.06874

パーソナライズされた動画の推奨に関しては、YouTube、Netflix、TikTok の技術的ソリューションがすべて含まれています。

たとえば、YouTube の「YouTube のおすすめ機能のためのディープ ニューラル ネットワーク」は 1,039 回引用されています。

この論文では、ディープラーニングが YouTube の推奨システムにもたらす大幅なパフォーマンスの向上について強調しています。まず、研究者らはディープ候補ジャーニーモデルとディープランキングモデルを詳しく紹介しました。その後、研究者らは、膨大な数のユーザーを抱える大規模な推奨システムの設計、反復、維持から得た実践的な経験と洞察を論文で共有しました。

論文の宛先:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

さらに興味深いのは、この論文/記事のリストには失敗した経験もいくつか含まれていることです。

たとえば、Google フォトはかつて写真にタグを付ける際に重大なミスを犯しました。黒人を「ゴリラ」とラベル付けしたのです。

最近人気の GPT-3 は、その前身である GPT-2 の「バイアス」問題を解決していません。生成されたテキストでは、イスラム教徒は常に暴力と死に関連付けられています。

著者について

このプロジェクトの主な管理者は、Amazon の応用科学者 Eugene Yan です。

彼はシンガポール経営大学で心理学と人材管理の学士号を取得し、ジョージア工科大学でコンピューターサイエンスの修士号を取得しました。

現在の主なタスクは、消費者データを活用して機械学習システムを構築し、ユーザーエクスペリエンスを向上させることです。

ポータル

プロジェクトアドレス:
https://github.com/eugeneyan/applied-ml

<<:  顔認識の応用シナリオは拡大し続けています。顔スキャンは便利で安全である必要があります。

>>:  時間畳み込みネットワーク: 時系列の次の革命?

ブログ    

推薦する

Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ビッグデータと人工知能の分野で初心者から専門家になるためのガイド

私たちは「技術の爆発」と「共有とオープンソース」の時代に生きています。先進技術の更新と反復の速度は、...

ロボットがすべての仕事を奪ったら、人間はどうなるでしょうか?

[51CTO.com クイック翻訳] 過去1年間、人工知能と自動化技術が人間の雇用と労働市場に与え...

シスコが新たな調査レポートを発表:企業はAIの準備に大きなギャップを抱えている

ニュースハイライト:中国企業の98%は、過去6か月間にAI技術導入の緊急性が高まったと回答した。戦略...

データマイニング分野における 10 の古典的なアルゴリズム - ナイーブ ベイズ アルゴリズム (コード付き)

導入ナイーブ ベイズ アルゴリズム (ナイーブ ベイズ アルゴリズムとも呼ばれます)。ナイーブ: 条...

NYU のポスドクが、arXiv に 30 分遅れて論文を提出したというだけで ACL に拒否されたのですか?学者たちは憤慨し、ACLに二度と投票しないと誓う

ACL は国民を怒らせた!今朝、この投稿のせいで AI コミュニティ全体が騒然となった——ニューヨー...

1 つの記事で 26 個のニューラル ネットワーク活性化関数 (ReLU から Sinc まで) を紹介します

ニューラル ネットワークでは、活性化関数によって、指定された入力セットからノードの出力が決定されます...

AIは「技術力」の集中を加速させる。巨大企業によるAIの独占は深刻な結果をもたらすのか?

AI テクノロジーがかなり集中化しており、テクノロジー大手が優位に立っていることにお気づきですか?...

ジェフ・ディーンの長文記事の展望: 2021 年以降の機械学習の 5 つの潜在的トレンド

過去数年間、機械学習 (ML) とコンピュータサイエンスの分野では多くの変化が見られました。この長い...

AI主導のサプライチェーンが業界の変革を加速させる方法

アラブ首長国連邦(UAE)の企業がほぼ全面的にクラウドに移行する前に、政府はすでに大規模なデジタル変...

自動運転AIアルゴリズムとマルチセンサー融合技術

高度な自動運転は、周囲の環境を高いレベルで認識し、人間の介入をほとんどまたはまったく必要とせずに車両...

さらに混沌です!ソラになりすました実在の人物の動画がすでに存在し、ウィル・スミスがパスタを食べながらミームを演じる

今日、「ウィル・スミスがパスタを食べている」というビデオがソーシャルメディアで話題になっている。動画...

...

シングルトランスフォーマー情報検索、Google は微分可能な検索インデックスでデュアルエンコーダーモデルに勝利

情報検索 (IR) は、インターネットの誕生以来、揺るぎない地位を築いてきました。膨大なデータからユ...

...