ビッグデータ、機械学習、ディープラーニングのためのコマンドラインツールの概要

ビッグデータ、機械学習、ディープラーニングのためのコマンドラインツールの概要

[51CTO.com クイック翻訳] キーボードを握ってください! マウスや GUI がなくても、OS X と Linux で多くの操作を完了できます。さまざまな *N*X システム向けの多数の優れたコマンドライン ツールの人気はテクノロジー業界で常に非常に高く、Python、Go、NodeJS、さらにはさまざまなハイブリッド ツールにまで拡大しています。コマンドラインからデータ処理パイプライン全体を実行する予定がない場合でも、これらのツールは非常に役立ちます。

書籍『Data Science at the Command Line』と GitHub はどちらも、多数の高レベルの前処理および後処理ツール オプションを提供しており、必要に応じて調整することもできます。今日の記事では、私のお気に入りのツールの中から特におすすめのものをいくつか紹介します。

CSVKit は間違いなく試してみる価値があります。カンマ区切りの値を使用して必要な操作をすべて実行します。 cvs cut を使用して列を切り取ったり、cvsgrip を使用して列をフィルター処理したり、sql2csv を使用して PostgreSQL から CSV にデータを抽出したり、cols を使用して列のサブセットを切り取ったり、in2cv を使用して Microsoft Excel を CSV に変換したりできます。

クイックツール推奨リスト

  • Python データ分析 (Agate)。

  • ImageMagick (コマンドラインから画像を編集、作成、変換、反転、変更します)。

  • JSON 2 CSV。

  • NodeJS 経由の XML2JSON。

  • HTML から画像へ。

  • HTML から PDF へ。

  • ウェザーアンダーグラウンド CLI。

  • NIFI シェル。

  • Scala/JVM を使用したテスト用の Gatling。

  • JSON を使用した Kafka プロデューサー。

  • JSON を使用した Kafka Consumer。

  • JSONを作成します。

  • 画像メタデータの抽出。

  • クエリインフラストラクチャ用の OSQuery。

  • コマンドライン OCR 用の Tesseract。

  • Hadoop/HDFS コマンドライン ツール。

  • カール。

  • ゲット。

  • MQTT CLI (NPM.JS)。

短い Python スクリプトを記述して、コマンドラインからデータ処理を実行することもできます。

  1. nltk.sentiment.vader より
  2. SentimentIntensityAnalyzerをインポートする
  3. インポートシステム
  4. sid = 感情強度アナライザー()
  5. ss = sid.polarity_scores(sys.argv[ 1 ])
  6. print( '複合 {0} 負 {1} 中立 {2} 正 {3} ' .format(ss[ 'compound' ], ss[ 'neg' ], ss[ 'neu' ], ss[ 'pos' ]))

感情分析を実装するには、5 行の Python スクリプトだけが必要です。

コマンドラインから TensorFlow をデバッグすることもできます (ただし、まだベータ版なので、いくつか問題がある可能性があります)。

元のタイトル:ビッグデータ、機械学習、ディープラーニングのコマンドラインツール

原作者:ティム・スパン

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  機械翻訳から読心術まで、AIは人類のバベルの塔を再建できるのか?

>>:  2017 年に注目すべき人工知能の 7 つのホットなトレンド

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

[文字列処理アルゴリズム] 入力文字列の各単語の順序を逆にするアルゴリズム設計とCコード実装

1. 要件の説明文字列を入力し、文字列内の単語を逆順に組み立てて出力するプログラムを作成します。たと...

フィンテックの台頭:アルゴリズムが決済業界をどう変えるかデータセットの分析は最初のステップに過ぎない

[[224951]]つい最近まで、CEO や大手銀行は、顧客にサービスを提供する上で銀行の所在地は考...

...

人工知能を使って手作業を置き換え、コストを削減し、効率を高めることは、まさに賢いことだ

「大丈夫ですよ。」 15年間工場で働いてきた「古い」労働者として、今日は人工知能についての私の見解を...

Google の研究者が発狂: AI に人格があると信じ、有給休暇を取得し、チャットログが恐ろしい

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AI顧客サービス指標について話す

インテリジェントな顧客サービスの評価基準は何かというビジネス上の問い合わせを頻繁に受けます。これは答...

DeepSpeed ZeRO++: ネットワーク通信を4倍削減し、大規模モデルやChatGPTのようなモデルのトレーニング効率を大幅に向上

大規模な AI モデルがデジタルの世界を変えています。大規模言語モデル (LLM) に基づく Tur...

4Dミリ波レーダーSLAMソリューション研究

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

機械学習に必要な確率論の基礎

この記事を読んでいただければ、確率の基本原理を機械学習に応用できる可能性が 100% あります。機械...

テキストマイニングからの分類、クラスタリング、情報抽出などのアルゴリズムのレビュー

テキストマイニングは、推奨システム、検索システム、その他の広範なアプリケーションなど、テキストマイニ...

システムと機械学習を接続するための MLOps の課題は何ですか?この記事は明らかにしている

[[418732]]機械学習は、人々がデータを利用し、データとやり取りする方法に革命をもたらし、ビジ...

...