5月にGitHubで最も人気のある機械学習プロジェクトはこちら

5月にGitHubで最も人気のある機械学習プロジェクトはこちら

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

5 月の残高が少なくなっています。今月の最新かつ最も注目されている機械学習プロジェクトをすべて読みましたか?

Mybridge AI ブログは、視覚的な質問回答、オブジェクト検出、自動コメント生成など、複数の側面をカバーする約 250 の機械学習オープンソース プロジェクトから、最も多くの星を獲得した上位 10 件のプロジェクトを見つけました。

見てみましょう〜

第1位:ピュティア

Pythia は、Facebook AI Lab が開発した、視覚と言語のマルチモーダル研究のためのモジュール式フレームワークです(2138 個の星)

Pythia は PyTorch をベースとしており、Model Zoo やマルチタスクをサポートし、VQA や VizWiz などのさまざまな組み込みデータセットを持ち、DataParallel や DistributedDataParallel に基づく分散トレーニングをサポートし、高度なカスタマイズも可能です。

さらに、TextVQA および VQA のエントリーレベルのコード ライブラリとして Pythia を使用するのも良い考えです。

リンク:

https://github.com/facebookresearch/pythia

No. 2: クラウドアノテーション

カスタムオブジェクトの検出と分類のトレーニング、 2014

IBM Cloud Object Storage をベースにした TensorFlow のトレーニングでは、まずオンライン画像注釈が必要です。macOS、Windows、Linux で使用できます。

リンク:

https://github.com/cloud-annotations/training

第3位:PySOT

SenseTime 社が開発したこの製品は、ビデオ内の単一のオブジェクトを追跡し、SiamRPN や SiamMask などのアルゴリズムを実装できます。1703個の星

PySOT は、Python で記述され、PyTorch 上で実行される、SiamRPN や SiamMask などの最先端の単一オブジェクト追跡アルゴリズムを実装します。

リンク:

https://github.com/STVIR/pysot

第4位:PyTorch-BigGraph

大規模グラフ構造データ生成埋め込みソフトウェア「1417 stars」もFacebook社が開発し、主著者はパリのLuca Wehrstedt氏です。

PyTorch-BigGraph は、最大数十億のエンティティと数兆のエッジを持つ大規模なネットワーク相互作用グラフを処理できる分散システムです。

PyTorch-BigGraph を使用する場合は、Python 3.6 以上、および少なくとも PyTorch 1.0 が必要です。GPU にデータを供給する必要はありませんが、CPU の負荷が高くなります。

リンク:

https://github.com/facebookresearch/PyTorch-BigGraph

No. 5: InterpretML - アルファ

Microsoft が制作し、説明可能な機械学習モデルのトレーニングに使用されます。1039 個の星

ここでの「説明可能」とは、モデルのデバッグで遭遇するエラー、モデルが差別的かどうか、モデルを人間に理解させる方法、モデルが合法かどうか、医療や司法などのリスクの高い分野で信頼できるかどうかなどを説明できることを意味します。

リンク:

https://github.com/microsoft/interpret

No. 6: 重みとバイアス

機械学習の実験を視覚化および追跡するためのツール、 1098 個の星

TensorBoard よりも軽量な機械学習実験を分析します。ハイパーパラメータと出力メトリックは実行ごとに保存でき、モデルはトレーニング中に視覚化でき、コードステータス、システムメトリック、構成パラメータは自動的に追跡できます。

リンク:

https://github.com/wandb/クライアント

第7位:MLIR

「マルチレベル中間表現」コンパイラ インフラストラクチャ、 832 個の星

TensorFlow の一部。 MLIR は、統合インフラストラクチャで複数の異なる要件をサポートし、すべての TensorFlow グラフを表現し、TensorFlow グラフで最適化と変換を実行し、TensorFlow グラフまたは TF Lite を使用して量子化とグラフ変換を実行できるハイブリッド IR (中間表現) として設計されています。

リンク:

https://github.com/tensorflow/mlir

第8位: メッシュCNN

PyTorch の 3D グリッド用畳み込みニューラル ネットワーク、 367 個の星

これは、SIGGRAPH 2019 で発表された、3D 形状セグメンテーションに使用できる論文です。著者はテルアビブ大学と Amazon の社員です。

従来の CNN と同様に、MeshCNN はメッシュのエッジで動作する特殊な畳み込み層とプーリング層を組み合わせています。畳み込みはエッジとそれらの入射三角形の 4 つのエッジに適用され、プーリング レイヤーはエッジの縮小操作を使用して表面トポロジを保持し、後続のレイヤーのメッシュ接続を生成します。

リンク:

https://github.com/ranahanocka/MeshCNN

第9位:テンソルウォッチ

Microsoft が制作した、ディープラーニングと強化学習のデバッグ、監視、視覚化用。299個の星

TensorWatch は、ディープラーニングと強化学習向けに設計されたデバッグおよび視覚化ツールです。 Jupyter Notebook を最大限に活用してリアルタイムの視覚化を表示するため、ログをめくり回すことなくトレーニング プロセスをリアルタイムでクエリできます。独自の UI とダッシュボードを構築するためにも使用できます。

さらに、TensorWatch はいくつかの優れたライブラリを活用して、モデル グラフの視覚化、モデル統計の確認、予測の説明などを行います。

リンク:

https://github.com/microsoft/tensorwatch

No. 10: hncynic

記事自体を完全に無視して、タイトルだけを見て、残りは自分で編集するという、ハッカーニュース風のコメントを自動生成する興味深いプロジェクトです。240個の星

ソースは Hacker News のコメント データに基づいており、Transformer エンコーダー/デコーダー モデルのトレーニングに使用され、プロセスでは Wikipedia データも使用されます。

生成されたコメントのほとんどは非常に創造的です。

たとえば、「TensorFlow で魚を検出」というニュースの見出しでは、次のようなコメントが生成されます。

この記事はひどい。

1. コードがブラックボックスのラベルの集まりのように見えるのはなぜですか?見なかったよ。

2. あなたのモデルではなぜこれらの理論を活用しないのですか?ブラックボックス分類器ではダメなのでしょうか?

モデルが赤い箱を取り出さない場合、モデルは赤い箱を明確な色のない黒い箱として認識し始めます (青が何であるかを知っているように見えます) — どのようにして赤い箱を見て、それが黒い箱であると判断できるのでしょうか?

実際の環境で魚を検出するために「ブラック ボックス」と「ブルー ボックス」を使用する方法や、白い紙の箱の代わりにブラック ボックスを使用する方法を理解していない世界では、私たちは皆これを知っています。

意味は通じるようですけど、何を言っているのか全く分かりませんし、完全に議論好きな人のようですね!

リンク:

https://github.com/leod/hncynic

ポータル

オリジナルリンク:

https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b

<<:  海外メディアがFacebookのコンテンツクリーンアップ作業を暴露:AIでも完了できない作業

>>:  5 つのコア コンポーネントで構成される AIoT は、3 つの大きな課題に直面しています。2 つのブレークスルー以外に何があるのでしょうか。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

デジタル変革、人工知能、そして生産性の問題

企業がデジタル変革を進める際に、生成 AI がいかにして企業の生産性を向上させることができるかについ...

人工知能はターミネーターとなるのか?ぜひ見に来てください!

[[253100]]映画「ターミネーター」を見たことがある人は多いでしょう。実は、ターミネーターに似...

人工知能の民主化について

人工知能 (AI) の民主化とは、AI ツール、テクノロジー、知識をより幅広い個人や組織が利用しやす...

プログラマーの芸術: ソートアルゴリズムのダンス

1. バブルソート 2. シェルソート 3. 選択ソート 4. 挿入ソート 5. クイックソート 6...

大規模モデルアプリケーションの探索 - エンタープライズ ナレッジ スチュワード

1. 伝統的なナレッジマネジメントの背景と課題1. 企業知識管理の必要性ナレッジ マネジメントは、あ...

ブースティングとバギング: 堅牢な機械学習アルゴリズムを開発する方法

導入機械学習とデータ サイエンスでは、単にデータを Python ライブラリに投入してその結果を活用...

...

Siriは中国で禁止されるのでしょうか?国内AI企業がアップルを特許侵害で訴え、高等法院は中国の特許を有効と認定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能の基礎技術は成熟し、AIは今後10年間で私の見方を完全に変えた

人工知能の黄金の10年基礎技術は基本的に安定しており、拡大シナリオは流行の10年を迎えています。中国...

人工知能技術が人の流れにおける個々の感染リスクを迅速に特定し、同済は伝染病予防・制御識別システムを開発

[[315277]]校門に設置されたカメラの前に立つと、システムは顔認識技術と現場での体温検知を組み...

...

データマイニングにおけるトップ10の古典的なアルゴリズム

国際的に有名な学術組織である IEEE 国際データマイニング会議 (ICDM) は、データマイニング...

...

この記事ではDiffアルゴリズムの使い方を説明します

[[420540]] 1. 基本Diff アルゴリズムは、仮想 DOM の最小限の更新を実装します。...