Keras よりも優れた機械学習「モデル パッケージ」: コード 0 個でモデルの作成を開始

Keras よりも優れた機械学習「モデル パッケージ」: コード 0 個でモデルの作成を開始

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習モデルを作るとき、さまざまなアルゴリズムを統合するだけで脳細胞を使い果たしてしまったことはありませんか?

それとも、データの前処理は「時間の無駄」だとお考えですか?

ゲッティンゲン大学を卒業し、機械学習に取り組んでいる男性もこの問題を発見しました。彼は当初、モデルを設計したいだけだったのですが、「実装の方が設計よりも面倒」であることが判明しました。

そこで彼は、 igel (ドイツ語で「ハリネズミ」を意味しますが、Init、Generate、Evaluate Machine Learning の略でもあります) というプロジェクトを作成しました。これにより、追加のコードを記述せずに目的のモデルを設計できるようになりました。

[[344828]]

つまり、ユーザーはさまざまな機械学習モデルの原理を知っておくだけでよく、自分でコードを書く必要はありません。

Keras と比較すると、このプロジェクトでは前処理、入力、出力の作業がさらに簡素化され、「モデル パッケージ」と同じくらいシンプルになっています。

作者はプロジェクトのバージョン 1.0 の制作に 2 週間を費やしましたが、このバージョンは 1 日で 842 個のスターを獲得し、現在も急速に人気が高まっています。

まだバージョン 1.0 なので、このプロジェクトにはまだ改善の余地がたくさんあると作者は述べています。

しかし、現時点では、基本的な機械学習モデリングには十分です。

「機械学習の制作を自動化する」

このプロジェクトを立ち上げた著者の当初の意図は、機械学習モデルをすべての人に提供することでした。

技術エンジニアであっても、他の業界の非技術ユーザーであっても、機械モデルを使用すると作業が容易になります。

簡単に言えば、機械学習を「自動化」プロセスに変えるということであり、彼はそれをそのように設計しました。

igel プロジェクトには最新の機械学習モデル (回帰、分類、クラスタリング) がすべて含まれており、作者によるとプロジェクトは現在も更新中とのことです。

つまり、将来的に新しい機械学習モデルが登場すれば、それがプロジェクトに追加されることになります。

このモデルは現在、次の機能をサポートしています。

最新の機械学習モデルをすべてサポート(プレビューモデルも含む)

さまざまなデータ前処理方法をサポート

構成を記述する際に柔軟性とデータ制御を提供します

クロス検証をサポート

yaml および json 形式をサポート

回帰、分類、クラスタリングのためのさまざまなsklearnメトリックのサポート

マルチ出力/マルチターゲット回帰と分類をサポート

マルチ処理並列モデル構築をサポート

作者は怠けるために機械学習の制作をシンプルにすることに多大な労力を費やしたことがわかります。

始めるのはとても簡単です。

「モデルパック」を使い始めるための6つのステップ

他のプログラムと同様に、このプログラムには「ヘルプ」メニューが用意されています。使用方法を知るには、「igel -h」(または igel -help) と入力するだけです。

使い方を学んだら、yaml 形式または json 形式の設定ファイルの作成を開始できます。

怠け者(著者のような)の場合は、「igel init」を使用して初期化できます。

例えば、病気かどうかを判定する機能の設定ファイルを作りたい場合:

最初のステップは、関数、モデル、ターゲットを選択することです: igel init -type "classification" -model "NeuralNetwork" -target "sick"

2番目のステップは初期化です: igel init

次に、プログラムは構成ファイルを生成し、必要に応じて変更します。

その後は、特定のアルゴリズム パラメータを選択し、選択したデータセットを提供するだけです。

たとえば、ランダム フォレストを使用してデータを処理する場合は、システムにパラメーター (およびデータセットと構成ファイルのパス) を提供するだけで、次のトレーニングが可能になります。

さらに、モデル/事前トレーニング済みモデルを評価することもできます。

気分はいいですか?予測モデルを生成します。

直接使用します:

わずか 6 つの簡単な手順で、マシン モデル (プレビュー モデル) が生成されるので、非常に便利です。

ネットユーザー:素晴らしい、もっと新しい機能が欲しい

また、著者はネットユーザーの意見を採用することにも非常に満足しています。

たとえば、あるユーザーは、クロスバリデーションをハイパーパラメータの検索/チューニングに使用できれば大きな改善になると指摘し、著者はすぐにこの提案を採用しました。

しかし、ネットユーザーの中には「すべての手続きを自動化する」のは無意味だとの声も上がっている。

結局のところ、作者はプロジェクトが scikit-learn 上に構築されていると述べています。しかし、後者はわずか数行のコードで機械学習を行うこともできます。では、scikit-learn とこのプロジェクトの違いは何でしょうか?

著者は、最大の違いは、コードを書くことと比較して、このプロジェクトでは、望ましいモデルをより「読みやすい」方法で設計することを目指している点であると答えました。

一部のネットユーザーはこの見解に同意しています。結局のところ、生産現場で働く多くの機械学習エンジニアにとって、「行う必要のないプログラミング作業」は無意味であり、「時間とお金の無駄」なのです。

より多くのネットユーザーがこのプロジェクトへの支持を表明し、その新機能を期待している。

この機械学習プロジェクトに興味のある方は、以下のポータルからチェックしてみてください〜

著者について

[[344830]]

Nidhal Baccouri 氏は今年 4 月にドイツのゲッティンゲン大学で修士号を取得し、ソフトウェア、制御工学、人工知能を研究対象としています。

現在、Nidhal Baccouri は自動車業界で働いており、人工知能とモノのインターネットの知識を応用したデジタルツイン技術に重点を置いています。彼は余暇には、特に AI と Python に関連するプロジェクトに取り組むのが好きです。

ポータル

プロジェクトアドレス:
https://github.com/nidhaloff/igel

<<:  絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

>>:  人工知能は第4世代に入り、人工直感が開発の次のステップとなる

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

自動車の自動運転産業チェーンに関する詳細な調査レポート: 自動運転はどこに向かっているのか?

(レポート制作者/執筆者:国金証券、翟偉)レポートの概要産業チェーンと市場空間:中国の自動運転は現...

AIの発展が遺伝子工学を推進している

CRISPRは遺伝子編集技術の専門用語です。簡単に言えば、ウイルスは細菌に自身の遺伝子を組み込み、細...

RLHF にはもう人間は必要ありません! Googleチームの研究により、AIによる注釈が人間のレベルに達したことが証明される

たとえば、RLHF の「人間」が入れ替わった場合、それは実現可能でしょうか? Google チームの...

...

教育業界における自動問題解決と適応学習AIの応用

[51CTO.comより引用] 近年、人工知能が大流行し、多くの大企業、中堅企業、中小企業が動き始め...

...

再びH800を去勢しますか?米国商務省の新しい政策はGPU輸出に対する規制を強化し、今週発表される予定である。

ロイター通信は今週、米国が中国へのGPU輸出をさらに制限する新たな規制を導入すると独占的に報じた。制...

...

人工知能が建設業界の様相を変えている

建設業は最も長い歴史を持つ産業の一つであると言えます。結局のところ、人々は数千年前から様々なタイプの...

300 万行から 100 行へ: 機械学習により開発エクスペリエンスが向上

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

純粋なテキスト モデルは「視覚的な」表現をトレーニングします。 MITの最新研究:言語モデルはコードで絵を描くことができる

「本を読む」ことしかできない大規模な言語モデルは、現実世界の視覚的認識を備えているのでしょうか?文字...

...

中国の「データブリックス」:AIインフラの構築に真剣に取り組む

AI導入の最大の推進要因はインフラのアップグレードです。近年、ビッグデータ分析やAIなどの分野が注目...

Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

ゲスト:石淑明執筆者: Mo Qi校正:趙雲「ほとんどの研究は一つの点を中心に展開する傾向があるが、...