開発者が武器をアップグレードするために推奨される 5 つの機械学習フレームワーク

開発者が武器をアップグレードするために推奨される 5 つの機械学習フレームワーク

業界ではよく知られているデータサイエンスのウェブサイトである KDnuggests は昨日、4 月の「無視できない 5 つの機械学習プロジェクト」を選出しました。

聞いたことがないかもしれませんが、今日入手することを検討してみてはいかがでしょうか。異なるエコシステムやプログラミング言語のツールに関しては、専門家にとっては、それらを使用する必要がない場合でも、コード実行を借用することで、独自の製品開発に多くのインスピレーションをもたらすことができます。

1. scikit-plot 関数

芸術的才能に欠けるデータ サイエンティストのグループは、ある日突然、視覚化は単なるおまけではなく、データ サイエンスにおいて最も重要な要素の 1 つであることに気づきました。

これが Scikit-plot の誕生につながりました。

「Reddit で作者の投稿を見て Scikit-plot を知り、すぐに使い始めました」と、KDnuggests の副編集長 Matthew Mayo 氏は語る。

このプロジェクトの目的は、Scikit-learn ユーザー向けに標準的で便利なプロットのセットを提供することです。これには以下が含まれます:

  • エルボープロット
  • 特徴重要度グラフ
  • PCA投影プロット
  • ROC曲線
  • シルエットプロット

Scikit-plot ライブラリには 2 つの API があり、そのうちの 1 つは Scikit-learn と緊密に統合されており、その API (Factory API) への呼び出しを制御します。もう 1 つはより伝統的なもの (Functions API) です。しかし、どちらでも十分なはずです。

クイックスタートガイドはここにあります。

2. Scikit 機能

Scikit-feature は、アリゾナ州立大学のデータマイニング & 機械学習研究所によって開発された、Python 用のオープンソースの特徴選択ライブラリです。これは scikit-learn、Numpy、Scipy に基づいています。 Scikit-feature には、従来のアルゴリズムや、いくつかの構造化およびストリーミングの特徴選択アルゴリズムを含む、約 40 個の一般的な特徴選択アルゴリズムが組み込まれています。

すべての特徴選択スキームには、冗長で無関係な特徴を見つけることという共通の目標があります。これはかなりホットな研究分野であり、そのためのアルゴリズムは無数に存在します。

Scikit-feature は、実用的な特徴選択エンジニアリングとアルゴリズム研究の両方に適しています。サポートされているアルゴリズムのリストについては、ここをクリックしてください。

Rubens Zimbres というデータ サイエンティストはかつてこう言いました。

  • 「経験を積み、スタックニューラルネットワーク、並列ニューラルネットワーク、非対称構成、シンプルニューラルネットワーク、複数レイヤー、ドロップアウト、アクティベーション関数などを試した結果、パフォーマンスの面では優れた特徴選択に勝るものはないという結論に達しました。」

3. 笑顔

Smile (Statistical Machine Intelligence and Learning Engine) は、高速で包括的な機械学習システムです。高度なデータ構造とアルゴリズムを活用し、Smile は最高のパフォーマンスを実現します。

Smile は、分類、回帰、クラスタリング、関連ルールマイニング、特徴選択、多様体学習、多次元尺度法 (MDS)、遺伝的アルゴリズム、欠損値の補完、最近傍検索など、機械学習のあらゆる側面をカバーします。

Java と Scala を使用する開発者にとって、Smile は現在最も適した機械学習ライブラリです。これは JVM Scikit-learn と考えることができます。このプロジェクトには、非常に包括的な公式チュートリアルが http://haifengl.github.io/smile/ にあります。このチュートリアルでは、Smile の使用上のヒントだけでなく、機械学習アルゴリズムに関する質の高い入門資料も提供します。

JVM 上で機械学習を開発している場合、Smile は間違いなく試してみる価値があります。実際、このエコシステムに参加していて、Smile について聞いたことがないとしたら驚きです。

4. ゲンシム

Gensim は、大規模なコーパスにおけるトピック モデリング、ドキュメント インデックス作成、類似性検索のためのアルゴリズムの Python ライブラリです。対象読者は、自然言語処理および情報検索コミュニティです。

Gensim は完全性を追求するジェネラリストです。開発チームによれば、この製品は「潜在的意味解析(LSA/LSI/SVD)、潜在的ディリクレ配分法(LDA)、ランダム射影(RP)、階層的ディリクレ過程(HDP)、word2vecディープラーニングなどの一般的なアルゴリズムを効率的にマルチコアで実行」できるという。

Gensim のドキュメントはここにあります。 KDnuggets は以前、初心者向けに Gensim を使用したトピック モデリングの方法に関するチュートリアルを公開しました。ここをクリックしてください。

5. ソネット

[[188711]]

今月初め、DeepMind は公式ブログでオープンソースの Sonnet を発表しました。 Leifeng.com は *** に次のように報じました: DeepMind は、TensorFlow を使用してニューラル ネットワークを迅速に構築できるように Sonnet をリリースしました。

DeepMindはブログ投稿でこう述べている。

「TensorFlow は 2015 年後半にオープンソース化されて以来、多くの高レベル アルゴリズム ライブラリで構成される多様なエコシステムが急速に発展してきました。これらの高レベル ツールにより、一般的なタスクをよりシンプルかつ迅速に完了できるようになり、開発者の時間と労力を大幅に節約できます。」

このエコシステムの新しいメンバーとして、Sonnet も同様です。既存のニューラル ネットワーク アルゴリズム ライブラリと多くの共通点がありますが、一部の機能は DeepMind の研究ニーズに合わせて特別に設計されています。 ”

Sonnet は TensorFlow をベースにした高レベル アルゴリズム ライブラリです。 DeepMind は、この製品が既存の製品と似ていることを認めていますが、ランダムにクラスター化されたテンソルのグループ上で特定のモジュールを実行できるようにするなど、DeepMind の研究に必要な機能と特徴を統合しています。

「RNN の状態は、異種のテンソルのコレクションとして表現するのが最適です。フラットなリストとして表現すると、エラーが発生しやすくなります。Sonnet はこれらのランダムな階層を処理する機能を提供するため、異なる RNN を使用するように実験を変更しても、コードを大幅に変更する必要はありません。DeepMind は、このユースケースをより適切にサポートするために、コア TensorFlow に変更を加えました。」

***、この記事がお役に立てれば幸いです。これまで聞いたことのないアルゴリズム ライブラリや、実際に必要だとは気づかなかった関数についてお知らせします。

<<:  医療用ロボット:世界第2位のロボットの現状と今後の応用展望

>>:  ニューラルネットワークの動作原理を1つの記事で理解する

ブログ    
ブログ    
ブログ    

推薦する

テクノロジーを活用して伝染病と闘う上で、人工知能はどのような役割を果たすのでしょうか?

業界の需要が変化するにつれて、5G、AI、ビッグデータなどの新しいテクノロジーが登場し、従来の業界に...

アルゴリズムの時間計算量分析: Big O 表記

[[354643]]開発の際、アルゴリズムの品質をどのように評価し、アルゴリズムの効率をどのように説...

人工知能:今優先すべき7つの役割

近年の退職者の急増は、労働力不足が現実であることを示している。セントルイス連邦準備銀行の調査によると...

韓国の通信事業者SKT、通信業界向け大規模AIモデルの開発のためOpenAIの競合企業に1億ドルを投資

大規模な AI モデルのトレンドは通信業界にも浸透しています。米国のAIスタートアップ企業Anthr...

ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

[[214638]]ノイズ除去オートエンコーダー (DAE) は、破損したデータを入力として受け入...

製造バリューチェーンにおいて RPA に真のチャンスはあるのでしょうか?

[[421304]]製造業における自動化の推進力は非常に単純です。自動化は人間の作業をシミュレート...

静的な知識を動的にする: ナレッジグラフからファクトグラフへ

[[392524]]ソーシャル ネットワークには、有名な「6 次の隔たり理論」があります。 「世界中...

AIガバナンスがトップに躍り出るには

人工知能(AI)技術は現在、広く利用されています。 AI ガバナンスが重要なのは、AI はより大きな...

科学者は機械学習を利用して結晶構造の酸化状態の謎を解明する

化学元素は物理世界のほぼすべてを構成しています。 2016 年現在、人類が知っている元素の数は 11...

百度がスマートシティ向け「ACE計画」を発表、ロビン・リーはAI思考でインターネット思考に打ち勝ちたい

11月1日、北京で百度世界博覧会2018が開幕した。百度の創業者で会長兼CEOの李克強(ロビン・リー...

ジェフ・ディーンが2020年の機械学習のトレンドについて語る:マルチタスクとマルチモダリティが大きく進歩する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自動運転シミュレーションテスト技術は実際の街頭シーンをシミュレートできる

[[262014]]自動運転は近年注目されている研究開発プロジェクトです。市場に投入される前にシミュ...

テクノロジー大手が自動運転市場への参入を急いでいる背景に、あなたが知らないことは何でしょうか?

ファーウェイは最近、「自動運転ネットワークソリューション白書」を発表しました。これは、将来のネットワ...

英国はAI大規模モデルの分野で利用するためのスーパーコンピュータの開発に2億2500万ポンドを投資する予定

英国政府は11月2日、国の人工知能能力をさらに強化するため、人工知能研究資源への投資を2023年3月...