GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

仕事をうまくやり遂げたいなら、まず道具を研がなければなりません。

仕事で独自の ML プロジェクトを実施する前に、その分野の最先端の進歩を理解し、先人の経験を吸収する必要があります。

しかし、arXiv には毎日何百もの新しい論文が掲載されています。どれを読む価値があるのでしょうか?

この目的のために、Amazon のエンジニアである Eugene Yan 氏らは論文集を作成しました。この GitHub プロジェクトでは、Google、Amazon、Facebook などの大手企業のデータサイエンスや機械学習に関する論文やブログ投稿を継続的に共有しています。

これらの論文/記事は、検索ランキングから NLP や CV まで 24 の異なるカテゴリをカバーしており、こちらからご覧いただけます。

データ品質

データエンジニアリング

データマイニング

分類

戻る

推奨アルゴリズム

検索ランキング

埋め込み

自然言語処理

シーケンスモデリング

予測する

コンピュータビジョン

強化学習

異常検出

グラフィックス

最適化

情報抽出

弱い監督

生成する

効率

検証とA/Bテスト

倫理

練習する

失敗

現在の星評価は2.3kです。

推奨アルゴリズムを例に挙げてみましょう。

業界が異なれば、ビジネスも大きく異なります。アルゴリズムの基本的なフレームワークは似ていますが、正確な推奨モデルをトレーニングするには、細部にはまだ多くの違いがあります。

このリストには、電子商取引、ビデオ、音楽、コースなど、さまざまなビジネス向けの推奨アルゴリズム技術に関するブログ/論文が集められています。

たとえば、Alibaba の「Alibaba における E コマース推奨のための行動シーケンス トランスフォーマー」などです。

この論文では、Alibaba の電子商取引推奨システムにおける動作シーケンス Transformer の応用について紹介します。

研究者らは、Transformer モデルを使用して、ユーザーの行動シーケンスの背後にある連続的な信号をキャプチャし、パーソナライズされた推奨事項の有効性を高め、クリックスルー率を向上させることを提案しました。実験検証の後、彼らはこのモデルをオンラインの Taobao に展開し、この方法がベースラインと比較してオンラインのクリックスルー率を大幅に向上できることを実証しました。

論文リンク:
https://arxiv.org/abs/1905.06874

パーソナライズされた動画の推奨に関しては、YouTube、Netflix、TikTok の技術的ソリューションがすべて含まれています。

たとえば、YouTube の「YouTube のおすすめ機能のためのディープ ニューラル ネットワーク」は 1,039 回引用されています。

この論文では、ディープラーニングが YouTube の推奨システムにもたらす大幅なパフォーマンスの向上について強調しています。まず、研究者らはディープ候補ジャーニーモデルとディープランキングモデルを詳しく紹介しました。その後、研究者らは、膨大な数のユーザーを抱える大規模な推奨システムの設計、反復、維持から得た実践的な経験と洞察を論文で共有しました。

論文の宛先:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

さらに興味深いのは、この論文/記事のリストには失敗した経験もいくつか含まれていることです。

たとえば、Google フォトはかつて写真にタグを付ける際に重大なミスを犯しました。黒人を「ゴリラ」とラベル付けしたのです。

最近人気の GPT-3 は、その前身である GPT-2 の「バイアス」問題を解決していません。生成されたテキストでは、イスラム教徒は常に暴力と死に関連付けられています。

著者について

このプロジェクトの主な管理者は、Amazon の応用科学者 Eugene Yan です。

彼はシンガポール経営大学で心理学と人材管理の学士号を取得し、ジョージア工科大学でコンピューターサイエンスの修士号を取得しました。

現在の主なタスクは、消費者データを活用して機械学習システムを構築し、ユーザーエクスペリエンスを向上させることです。

ポータル

プロジェクトアドレス:
https://github.com/eugeneyan/applied-ml

<<:  顔認識の応用シナリオは拡大し続けています。顔スキャンは便利で安全である必要があります。

>>:  時間畳み込みネットワーク: 時系列の次の革命?

ブログ    

推薦する

2019年後半、人工知能分野ではどのような変化が起こるのでしょうか?

いずれにしても、2019年もいつの間にか半分が過ぎてしまいました。このニュースを聞いて、何もせずに半...

テスラ モデル3とYが再びハッカーのリレー攻撃の危険に直面、車は10秒で走り去られる可能性も

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

自動運転について話しましょう

自動運転とは何ですか?自動運転とは、さまざまなセンサー、コンピュータービジョン、人工知能、機械学習な...

自動運転トラックの普及が加速しているが、実用化にはどれくらいの時間がかかるのだろうか。

iResearch Instituteが発表したレポートによると、2021年の中国の幹線物流大型ト...

1 つの記事で AI エージェント テクノロジーを理解する

環境と自律的に対話し、収集したデータに基づいて決定を下し、人間の介入を最小限に抑えてシナリオベースの...

マッキンゼーは、2030年までに1億人の中国人が転職に直面し、世界中で8億人がロボットに置き換えられると予測している。

最近、マッキンゼー・グローバル研究所は水曜日に発表した報告書の中で、技術の進歩により、将来世界で約3...

ストーリーを伝えれば、動画が編集されます。AI による動画編集の自動化により、パンダの目を持つ編集者が解放されます。

ビデオ編集は、編集者が適切なフレームを見つけてつなぎ合わせる必要がある、時間と労力を要する作業です。...

ビッグニュース: IBM が 3 つの抗がん AI プロジェクトをオープンソース化しました。

最近、IBM は、がん治療の課題を克服することを目的とした 3 つの AI プロジェクトをオープンソ...

機械学習プロジェクトを管理および組織化する方法

この記事では主に、機械学習プロジェクトの編成と管理に関する実践的な経験をいくつか紹介します。パイソン...

2018 年の 5 つの主要な AI トレンドとそのメリット

[[234392]] [51CTO.com クイック翻訳] 人間は常に、自分たちに似たロボットや人工...

AIはサイバーセキュリティにおいて人間に取って代わるでしょうか?両者は対立していない

近年、サイバーセキュリティ業界では人工知能技術が話題になっています。セキュリティ オーケストレーショ...

...

たった今、アリババが重大な技術的爆弾を発表しました!

人類史上のスーパープロジェクトとは何でしょうか?ピラミッド、万里の長城、ドバイワールドアイランド、三...

2024年のトレンド: 時系列データと人工知能の融合アプリケーション

今日のデータ主導の世界では、競争上の差別化を図ることが成功の鍵となります。この目標を達成するために、...