2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年は人工知能と機械学習にとって「収穫」の年でした。特にヘルスケア、金融、音声認識、拡張現実、より複雑な 3D ビデオ アプリケーションなど、実生活のさまざまな分野に、ますます影響力のある機械学習アプリケーションが開発され、応用されてきました。

さらに、業界ではアプリケーション主導の研究がますます増えており、理論主導の研究を上回っていることもわかりました。この変化には欠点があることは否定できませんが、そのプラス面も見なければなりません。より多くの研究がすぐに商用製品に変換できるようになるため、業界全体に計り知れないプラスの影響があり、これはオープンソースの機械学習の分野で特に顕著です。

***、過去 1 年間で最も実用的な 6 つの機械学習プロジェクトを見てみましょう。これらのプロジェクトは、個人や小規模チームが学習して価値を創造できるようにするためのコードとデータセットを公開しています。これらのプロジェクトは理論的には画期的ではないかもしれませんが、非常に実用的です。

この記事はTowards Data ScienceのGeorge Seif氏によるもので、以下のように翻訳されています。

[[254861]]

1) ファスト.ai

オープンソースアドレス:

https://github.com/fastai/fastai

Fast.ai ライブラリを使用すると、*** ソリューションを通じてニューラル ネットワークのトレーニング プロジェクトを簡素化できます。ディープ ニューラル ネットワークの実際の構築の詳細をすべて抽象化します。設計では、プログラムを構築する実践者の思考モードが十分に考慮されているため、非常に使いやすいです。このライブラリはもともと Fast.ai コースの学生向けに作成されたもので、Pytorch ライブラリをベースに簡潔かつわかりやすい形で書かれています。さらに、ファイルライブラリの整理にも優れています。 (ドキュメントライブラリアドレス:https://docs.fast.ai/)

2) ディテクトロン

オープンソースアドレス:

https://github.com/facebookresearch/Detectron

Detectron は、Facebook がオブジェクト検出とインスタンスのセグメンテーションのために開発した研究プラットフォームです。ディープラーニング フレームワーク Caffe2 で記述されており、次のようなさまざまなオブジェクト検出アルゴリズムの実装が含まれています。

Mask R-CNN: Faster R-CNN アーキテクチャによるオブジェクト検出とインスタンスのセグメンテーション。

(https://arxiv.org/abs/1703.06870)

RetinaNet:独自の焦点損失により困難なケースを処理するためのピラミッド ネットワークを備えています。

(https://arxiv.org/abs/1708.02002)

より高速な R-CNN:オブジェクト検出ネットワークで最も一般的な構造。

(https://arxiv.org/abs/1506.01497)

すべてのネットワークは、次のいずれかの代替分類ネットワークを使用できます。

レスネクスト{50101152}

(https://arxiv.org/abs/1611.05431)

RESNET {50101152}

(https://arxiv.org/abs/1512.03385)

特徴ピラミッドネットワーク(ResNet/ResNeXt を使用)

(https://arxiv.org/abs/1612.03144)

VG16 ...

(https://arxiv.org/abs/1612.03144)

これらのプラットフォーム機能には、COCO データセットで事前トレーニングされたモデルが付属しており、ユーザーがすぐに使用できることも特筆に値します。同時に、これらの機能は、標準評価指標に厳密に従って、Detectron モデル動物園 (https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md) でテストされています。

3) ファストテキスト

オープンソースアドレス:

https://github.com/facebookresearch/fastText

Facebook の研究成果のもう 1 つの成果である fastText ライブラリは、テキスト表現とテキスト分類専用に作成されています。このライブラリには、150 を超える言語をカバーする事前トレーニング済みの単語ベクトル モデルが付属しており、テキストの分類、要約、翻訳などの複数のタスクを完了するために使用できます。

4) オートケラス

Auto-Keras は、テキサス A&M 大学の DATA Lab (http://faculty.cs.tamu.edu/xiahu/index.html) とコミュニティ貢献者によって開発された、自動機械学習 (AutoML) 用のオープンソース ソフトウェア ライブラリです。 AutoML の目標は、データ サイエンスや機械学習のバックグラウンドを持たないドメイン エキスパートがディープラーニング ツールを使いやすくすることです。 Auto-Keras は、ディープラーニング モデルに最適なアーキテクチャとハイパーパラメータを自動的に一致させる機能を提供します。

5) ドーパミン

オープンソースアドレス:

https://github.com/google/dopamine

Dopamine は、強化学習アルゴリズムのプロトタイピングを加速するために Google が特別に作成した研究フレームワークです。RL アルゴリズム、指標、ベンチマークに厳密に準拠しながら、柔軟で使いやすいフレームワークです。

Dopamine が提供した文書によると、同社の製品設計原則には次のものが含まれます。

  • 簡単に実行できる実験: 新規ユーザーがベンチマーク実験を実行できるように支援

  • 柔軟な開発プロセス:より革新的なアイデアの誕生を促進

  • シンプルで信頼性が高い: 古いアルゴリズムや人気のアルゴリズムを実装できる

  • 再現性: 結果が再現可能であることを保証する

6) ビッド2ビッド

オープンソースアドレス:

https://github.com/NVIDIA/vid2vid

vid2vid は、Nvidia の最も高度なビデオ間合成アルゴリズムに基づいた Pytorch 実装プロジェクトです。ビデオ間合成アルゴリズムの目的は、入力ソース ビデオ (一連のセマンティック セグメンテーション マスクなど) から、ソース ビデオの内容を正確に描写するリアルなレンダリングされた出力ビデオへのマッピング関数を学習することです。

このライブラリの優れた点は、選択肢の多様性です。自動運転/都市のシーン、顔、人間のポーズなど、さまざまな vid2vid アプリケーションを提供します。さらに、データセットの読み込み、タスク評価、ネットワークトレーニング、マルチGPUなど、豊富な命令と機能が搭載されています。

特別賞

  • ChatterBot:会話エンジンとチャットボットを作成するための機械学習プロジェクト

オープンソースアドレス:

https://github.com/gunthercox/チャッターボット

  • Kubeflow: Kubernetes 用の機械学習ツールキット

オープンソースアドレス:

出典: kubeflow

  • imgaug:画像強化のためのディープラーニングプロジェクト

オープンソースアドレス:

https://github.com/aleju/imgaug

  • imbalanced-learn:不均衡なデータセットを修復するための scikit ベースの Python フレームワーク

オープンソースアドレス:

https://github.com/scikit-learn-contrib/imbalanced-learn

  • mlflow:実験、再現、展開などのプロセスをカバーする、ML プロジェクトのライフサイクルを管理するためのオープンソース プラットフォーム。

オープンソースアドレス:

出典: github.com

  • AirSim: Microsoft が開発した、Unreal Engine/Unity ベースの自動運転車シミュレーター

オープンソースアドレス:

https://github.com/Microsoft/AirSim

<<:  2018 年の AI にとって重要なマイルストーンは何でしたか? 2019年に何が起こるでしょうか?

>>:  誰も教えてくれないAI大規模導入の効率的なプロセス!

ブログ    
ブログ    

推薦する

人工知能によるデータ管理の変革

企業は人工知能 (AI) を適用する新しい方法を見つけています。 AI プロジェクトの主な障害の 1...

数秒で理解:小売業における画像認識

【51CTO.comオリジナル記事】スーパーマーケットに入ったところを想像してみてください。計量のた...

私の友人はソーシャルメディアのアルゴリズムの推奨に「誘惑」され、過激なグループに参加しました

[[380723]]ビッグデータダイジェスト制作著者: カレブソーシャル メディアにおけるアルゴリズ...

再び攻撃! AI+教育に注力する学百軍は、年間10億元という小さな目標を設定

「今年末までに、学覇君は年間売上高10億元を確保するという小さな目標を達成する予定です」と張凱蕾氏は...

...

AI が加速的な進化を促進 Qualcomm AI & IoT 開発技術オープンデーが間もなく開催

携帯電話からウェアラブルデバイス、翻訳製品まで、人工知能は人々の日常生活に広く浸透しています。 5G...

自動運転技術が盛んに進歩していますが、実際に道路上で実用化されるまでにはどれくらい時間がかかるのでしょうか?

自動運転の概念は、誕生以来、常に資本家や技術起業家が好む分野のひとつでした。新しいインフラと5G商用...

...

人工知能とモノのインターネット - 未来の技術の融合

[[388165]]将来は自動化となり、人工知能 (AI) とモノのインターネット (IoT) が融...

初心者が機械学習をすぐに始められるように、Colabリソースの完全なリストはこちらです。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

生成 AI を構築するか、購入するか?

テキスト、画像、ビデオ、またはおそらく複数のモデルとサービスの組み合わせであっても、生成 AI を活...

AIで生成された出版物の急増により、Amazonは書籍の著者に作品でのAIの使用をプラットフォームに通知することを義務付けている。

9月10日、AP通信は、全米作家組合やその他の団体から何か月にもわたる苦情を受けて、アマゾンのファ...

量子コンピューティングはどのようにして AI の「兄弟技術」になるのでしょうか?

[[254920]]画像出典: Visual China過ぎ去ったばかりの 2018 年を振り返っ...

新しいAIにより、教師はインテリジェントな個別指導システムを迅速に開発できる

インテリジェントな個別指導システムは、代数や文法などの特定の科目の指導に効果的であることが証明されて...