GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

仕事をうまくやり遂げたいなら、まず道具を研がなければなりません。

仕事で独自の ML プロジェクトを実施する前に、その分野の最先端の進歩を理解し、先人の経験を吸収する必要があります。

しかし、arXiv には毎日何百もの新しい論文が掲載されています。どれを読む価値があるのでしょうか?

この目的のために、Amazon のエンジニアである Eugene Yan 氏らは論文集を作成しました。この GitHub プロジェクトでは、Google、Amazon、Facebook などの大手企業のデータサイエンスや機械学習に関する論文やブログ投稿を継続的に共有しています。

これらの論文/記事は、検索ランキングから NLP や CV まで 24 の異なるカテゴリをカバーしており、こちらからご覧いただけます。

データ品質

データエンジニアリング

データマイニング

分類

戻る

推奨アルゴリズム

検索ランキング

埋め込み

自然言語処理

シーケンスモデリング

予測する

コンピュータビジョン

強化学習

異常検出

グラフィックス

最適化

情報抽出

弱い監督

生成する

効率

検証とA/Bテスト

倫理

練習する

失敗

現在の星評価は2.3kです。

推奨アルゴリズムを例に挙げてみましょう。

業界が異なれば、ビジネスも大きく異なります。アルゴリズムの基本的なフレームワークは似ていますが、正確な推奨モデルをトレーニングするには、細部にはまだ多くの違いがあります。

このリストには、電子商取引、ビデオ、音楽、コースなど、さまざまなビジネス向けの推奨アルゴリズム技術に関するブログ/論文が集められています。

たとえば、Alibaba の「Alibaba における E コマース推奨のための行動シーケンス トランスフォーマー」などです。

この論文では、Alibaba の電子商取引推奨システムにおける動作シーケンス Transformer の応用について紹介します。

研究者らは、Transformer モデルを使用して、ユーザーの行動シーケンスの背後にある連続的な信号をキャプチャし、パーソナライズされた推奨事項の有効性を高め、クリックスルー率を向上させることを提案しました。実験検証の後、彼らはこのモデルをオンラインの Taobao に展開し、この方法がベースラインと比較してオンラインのクリックスルー率を大幅に向上できることを実証しました。

論文リンク:
https://arxiv.org/abs/1905.06874

パーソナライズされた動画の推奨に関しては、YouTube、Netflix、TikTok の技術的ソリューションがすべて含まれています。

たとえば、YouTube の「YouTube のおすすめ機能のためのディープ ニューラル ネットワーク」は 1,039 回引用されています。

この論文では、ディープラーニングが YouTube の推奨システムにもたらす大幅なパフォーマンスの向上について強調しています。まず、研究者らはディープ候補ジャーニーモデルとディープランキングモデルを詳しく紹介しました。その後、研究者らは、膨大な数のユーザーを抱える大規模な推奨システムの設計、反復、維持から得た実践的な経験と洞察を論文で共有しました。

論文の宛先:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

さらに興味深いのは、この論文/記事のリストには失敗した経験もいくつか含まれていることです。

たとえば、Google フォトはかつて写真にタグを付ける際に重大なミスを犯しました。黒人を「ゴリラ」とラベル付けしたのです。

最近人気の GPT-3 は、その前身である GPT-2 の「バイアス」問題を解決していません。生成されたテキストでは、イスラム教徒は常に暴力と死に関連付けられています。

著者について

このプロジェクトの主な管理者は、Amazon の応用科学者 Eugene Yan です。

彼はシンガポール経営大学で心理学と人材管理の学士号を取得し、ジョージア工科大学でコンピューターサイエンスの修士号を取得しました。

現在の主なタスクは、消費者データを活用して機械学習システムを構築し、ユーザーエクスペリエンスを向上させることです。

ポータル

プロジェクトアドレス:
https://github.com/eugeneyan/applied-ml

<<:  顔認識の応用シナリオは拡大し続けています。顔スキャンは便利で安全である必要があります。

>>:  時間畳み込みネットワーク: 時系列の次の革命?

ブログ    
ブログ    

推薦する

生産効率の向上以外に、AI テクノロジーは製造業に何をもたらすのでしょうか?

現代科学技術の発展は製造業の変革と向上に新たな活力をもたらしており、人工知能技術もその一つです。 [...

...

5G+AI:将来的には1+1>2の効果は得られるのか?

情報産業革命以来、人々の生活は大きく変化しました。それぞれの新しいテクノロジーの出現は、さまざまなレ...

北京、宜荘市の111の道路で初の自動運転試験を開始

本日、北京市は有人自動運転試験を正式に開始した。北京経済技術開発区は40平方キロメートルのエリアを自...

画像分類の精度を段階的に向上させるにはどうすればよいでしょうか?

[[205151]] 1. 問題の説明画像認識や画像分類、その他の機械学習タスクを扱う場合、どのよ...

プログラマーが面接でアルゴリズムについて素早く準備する方法

序文短い記事を書こうと決めたので、これがそれです。私がこの記事を書こうと思った理由は、Weibo 上...

EUが「インダストリー5.0」の時代を発表

[[415365]]画像ソース: https://pixabay.com/images/id-358...

2019年の機械学習と人工知能産業の発展動向のレビュー

[[257231]]新年を迎えるにあたり、2019 年を形作る業界のトレンドに注目する時期が来ました...

...

人工知能の10の典型的な応用分野とその技術原理の詳細な説明

この記事では、「アルゴリズム」という単語を非常に簡略化して使用し、単一のアルゴリズム、モデル、または...

なぜアルゴリズムを犬のように飼いならすのか

[[114872]]進化人類学者の間では、子犬などのペットが野生動物から進化したのは、社会的な知性を...

AIとデータセンターの相互依存

2か月前にFacebookのザッカーバーグとテスラのマスクがAIをめぐって口論したことから、ちょうど...

AIのおかげで売上が24%増加しました。このようなAI人材はどこで見つけられるのでしょうか?

[[429444]]この記事はWeChatの公開アカウント「Computer World」から転載...

130年の歴史を持つアメリカのブランド、カーハートがAIを活用して売上を伸ばす方法

戦略的利益のために AI を活用している企業の中に、アメリカの衣料品会社 Carhartt がありま...