GitHub上の8,800のオープンソース機械学習プロジェクトを比較し、上位30を選出しました。

GitHub上の8,800のオープンソース機械学習プロジェクトを比較し、上位30を選出しました。

[[218787]]

編集者: Ye Yi、Shan Liu、Aileen

2017 年は機械学習のアプリケーションが開花し、素晴らしいアイデアやプロジェクトが次々と登場した年でした。私たちは過去 1 年間に約 8,800 件のオープンソース機械学習プロジェクトを比較し、ベスト 30 (上位 0.3%) を選択してここにリストしました。

これは、2017 年 1 月から 12 月の間に公開された機械学習ライブラリ、データセット、アプリケーションの質の高いプロジェクトの非常に競争力のあるリストです。人気度、エンゲージメント、最新性によって品質を評価します。フォームの品質について直感的な印象を与えることができるデータがあります。これらのプロジェクトの GitHub での平均スター数は 3558 です。

オープンソース プロジェクトはデータ サイエンティストにとって非常に興味深いものです。ソースコードを読むことで、先人たちの成果に基づいて、より強力なプロジェクトを構築できます。昨年は見逃していたかもしれないこれらの機械学習プロジェクトをぜひ試してみてください。

No.1 - FastText: 高速テキスト表現/分類ライブラリ

GitHub スター: 11786

出典: Facebookリサーチ

リンク: https://github.com/facebookresearch/fastText

そして [Muse: FastText に基づく多言語の教師なし/教師あり単語埋め込み (GitHub スター: 695) https://github.com/facebookresearch/MUSE]

No.2 - Deep-photo-styletransfer: コーネル大学の Fujun Luan による論文「Deep Photo Style Transfer」のコードとデータ

GitHub スター: 9747

リンク: https://github.com/luanfujun/deep-photo-styletransfer

No.3 - 顔認識: Pythonとコマンドライン用の世界で最もシンプルな顔認識API

GitHub スター: 8672

出典: アダム・ガイトゲイ

リンク: https://github.com/ageitgey/face_recognition

[[218790]]

No.4 - マゼンタ: 機械知能の音楽とアートのジェネレーター

GitHub スター: 8113

リンク: https://github.com/tensorflow/magenta

No.5 - Sonnet: TensorFlow ベースのニューラル ネットワーク ライブラリ

GitHub スター: 5731

出典: マルコム・レイノルズ、DeepMind

リンク: https://github.com/deepmind/sonnet

No.6 - deeplearn.js: ウェブ向けハードウェアアクセラレーション機械学習ライブラリ

GitHub スター: 5462

出典: Nikhil Thorat、Google Brain チーム

リンク: https://github.com/PAIR-code/deeplearnjs

No.7 - 高速スタイル転送: TensorFlow 高速スタイル転送

GitHub スター: 4843

出典: Logan Engstrom、MIT

リンク: https://github.com/lengstrom/fast-style-transfer

No.8 - Pysc2: StarCraft II 学習環境

GitHub スター: 3683

出典: DeepMind Timo Ewalds 他

リンク: https://github.com/deepmind/pysc2

No.9 - AirSim: Microsoft AI and Research が開発した Unreal Engine ベースのオープンソース自動運転シミュレーター

GitHub スター: 3681

出典: シタル・シャー、マイクロソフト

リンク: https://github.com/Microsoft/AirSim

No.10 - Facets: 機械学習データセットを視覚化するツール

GitHub スター: 3371

出典: Google Brain

リンク: https://github.com/PAIR-code/facets

No.11 - Style2Paints: AIコミック線画着色ツール

GitHub スター: 3310

リンク: https://github.com/lllyasviel/style2paints

No.12 - Tensor2Tensor: 一般化されたシーケンスツーシーケンスモデル用のツールライブラリ

GitHub スターの数: 3087

出典: Google Brainのライアン・セパシ

リンク: https://github.com/tensorflow/tensor2tensor

No.13 - PyTorch ベースの画像間変換ツール (horse2zebra、edges2cats など)

GitHub スター: 2847

出典: ジュンヤン・チュー博士、カリフォルニア大学バークレー校

リンク: https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

[[218799]]

No.14 - Faiss: 密なベクトルを使用して効率的な類似性検索とクラスタリングを行うツールライブラリ

GitHub スター: 2629

出典: Facebook

リンク: https://github.com/facebookresearch/faiss

No.15 Fashion-mnist: MNISTに似たファッション商品データセット

GitHub スター: 2780

出典: Zalando TechのHan Xiao氏

リンク: https://github.com/zalandoresearch/fashion-mnist

No.16 - ParlAI: さまざまな公開会話データセットで AI モデルをトレーニングおよび評価するためのフレームワーク

GitHub スター: 2578

出典: アレクサンダー・ミラー、Facebook Research

リンク: https://github.com/facebookresearch/ParlAI

No.17 Fairseq: シーケンスツーシーケンスツールキット

GitHub スター: 2571

出典: FAIR

リンク: https://github.com/facebookresearch/fairseq

No.18 Pyro: Python と PyTorch による深層一般確率プログラミング

GitHub スター: 2387

出典: Uber AI Labs

リンク: https://github.com/uber/pyro

No.19 iGAN: GANベースのインタラクティブ画像ジェネレーター

GitHub スター: 2369

リンク: https://github.com/junyanz/iGAN

No.20 Deep-image-prior: 学習プロセスを必要とせずにニューラルネットワークを使用して画像を復元する

GitHub スター: 2188

出典: ドミトリー・ウリヤノフ博士、スコルテック

リンク: https://github.com/DmitryUlyanov/deep-image-prior

No.21 Face_classification: fer2013/imdb データセットでトレーニングされた Keras CNN モデルと OpenCV に基づくリアルタイム顔検出と表情/性別分類

GitHub スター: 1967

リンク: https://github.com/oarriaga/face_classification

No.22 音声テキスト変換 WaveNet: DeepMind の WaveNet と TensorFlow を使用したエンドツーエンドの文レベルの英語音声認識

GitHub スター: 1961

出典: カカオブレインのナムジュ・キム

リンク: https://github.com/buriburisuri/speech-to-text-wavenet

No.23 StarGAN: マルチドメイン画像間変換のための統合型生成敵対ネットワーク

GitHub スター: 1954

出典: ユンジェイ・チェ、高麗大学

リンク: https://github.com/yunjey/StarGAN

No.24 MIエージェント: Unity機械学習エージェント

GitHub スター: 1658

出典: Deep Learning Unity3D の Arthur Juliani

リンク: https://github.com/Unity-Technologies/ml-agents

第25回 ディープビデオ分析:分散ビジュアル検索とビジュアルデータ分析プラットフォーム

GitHub スター: 1494

出典: アクシャイ・バット、コーネル大学

No.26 OpenNMT: Torch 上のオープンソース ニューラル機械翻訳

GitHub スター: 1490

リンク: https://github.com/OpenNMT/OpenNMT

No.27 Pix2PixHD: 条件付きGANを用いた2048×1024解像度画像の合成と処理

GitHub スター: 1283

出典: NVIDIA AI 科学者 Ming-Yu Liu

リンク: https://github.com/NVIDIA/pix2pixHD

[[218810]]

No.28 Horovod: 分散型 TensorFlow トレーニング フレームワーク

GitHub スター: 1188

出典: Uberエンジニアリング

リンク: https://github.com/uber/horovod

No.29 AI-Blocks: 誰でも機械学習モデルを作成できる強力で直感的なWYSIWYGインターフェース

GitHub スター: 899

リンク: https://github.com/MrNothing/AI-Blocks

第30回 非並列データによる音声変換:TensorFlow に基づくディープニューラルネットワーク音声変換(声質変換)

GitHub スター: 845

出典: カカオブレインAI研究チームのダビ・アン

リンク: https://github.com/andabi/deep-voice-conversion

ソース:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  李開復氏はAIバブルが年末までに崩壊すると予測、ルクン氏:それは本当だ

>>:  トポロジカルデータ分析(TDA)は、人工知能のブラックボックスを破ると期待される魔法のアルゴリズムです。

ブログ    

推薦する

人間の生理学的パラメータのモニタリング分野に焦点を当て、Pulse Geekはウェアラブルでこの分野に参入し、AIを活用して心臓の守護者となる

近年、人工知能技術は、医療、金融、小売、教育、その他のサブ産業を含む多くの垂直分野に応用されています...

...

ハッカーがテスラの自動運転システムの「隠しモード」を解除

最近開催されたカオスコンピューティングカンファレンスで、ベルリン工科大学のサイバーセキュリティ研究者...

AIが再生可能エネルギーグリッドの回復力の鍵となる理由

[[393199]]画像提供:ロイター/セルジオ・ペレスエマニュエル・ラガリグシュナイダーエレクトリ...

Python 機械学習の実践: クレジットカード詐欺検出

ストーリーの背景:元のデータは個人の取引記録ですが、データ自体のプライバシーを考慮して、元のデータは...

AIを使用して一般的なビジネスプロセスを最適化する

現代のビジネス環境では、人工知能 (AI) がビジネスの運営方法を変えています。 AI をビジネス ...

毎日のアルゴリズム: 回文部分文字列

[[434467]]文字列が与えられた場合、その文字列に含まれる回文の部分文字列の数を数えることがタ...

中国の大学はいかにして「新世代の人工知能」をリードできるのか?

教育省は最近、「高等教育機関における人工知能イノベーションのための行動計画」を発行しました。計画によ...

...

OpenAI の予測: スーパーインテリジェンスは 10 年以内に到来する!鄭済集落は人類を救い、4年で同盟を完全に征服した

スーパーAIがみんなを殺す!サム・アルトマン氏は、AI の将来について何度も公に懸念を表明しており、...

PaddlePaddle を使い始める: 対話システムにおける感情分析から始める

1. 背景人工知能の時代では、さまざまなディープラーニングフレームワークが普及しており、フレームワー...

...

2020年Qizhi開発者会議が北京で盛大に開幕、第一弾の1000万インセンティブボーナスが発表された

2020年12月2日午前9時、知恵とリソースを集めることを目的とした2日間のOpenI/O 2020...

...

機械学習を簡単にする 5 つのオープンソース Python ライブラリ

機械学習は興味深いものですが、実際に実行するのは難しく複雑です。ワークフローとパイプラインの組み立て...