人工知能の発展の歴史の中で、さまざまなアルゴリズムが際限なく登場してきました。過去 10 年間で、ディープ ニューラル ネットワークの開発により、機械学習の分野で目覚ましい進歩が遂げられました。階層的または「深い」構造を構築することにより、モデルは教師あり設定または教師なし設定のいずれにおいても生データから適切な表現を学習することができ、これが成功の重要な要因であると考えられています。 ディープフォレストは、AI 分野における重要な研究方向の 1 つです。 2017年、周志華氏、馮吉氏らはディープフォレストフレームワークを提案しました。これは、ツリーアンサンブルを使用して多層モデルを構築する最初の試みでした。 2018 年、Zhou Zhihua らは「多層勾配ブースティング決定木」という研究で多層決定木を調査しました。今年2月、周志華氏のチームはディープフォレストソフトウェアパッケージDF21をオープンソース化した。このパッケージはトレーニング効率が高く、ハイパーパラメータが少なく、一般的なデバイスでも実行できる。 つい最近、TensorFlow は TensorFlow Decision Forest (TF-DF) をオープンソース化しました。 TF-DF は、決定フォレスト モデル (ランダム フォレストや勾配ブースティング ツリーを含む) をトレーニング、提供、解釈するための、実稼働環境で実証済みの SOTA アルゴリズムのコレクションです。 TensorFlow と Keras の柔軟性と構成可能性を活かして、これらのモデルを分類、回帰、ランキングのタスクに使用できるようになりました。 Google Brain の研究者であり、Keras の開発者でもある François Chollet 氏は、「Keras API を使用して TensorFlow 決定フォレストをトレーニングすることが可能になりました」と述べています。 このオープンソース プロジェクトについて、ネットユーザーは「これはとてもクールです。ランダム フォレストは私のお気に入りのモデルです」と述べています。 決定フォレストデシジョン フォレストは、品質と速度の点でニューラル ネットワークと競合する (より使いやすく、同様に強力) 機械学習アルゴリズムのファミリーであり、実際には特定の種類のデータ、特に表形式のデータでより効果的に機能します。 ランダム フォレストは、一般的な決定フォレスト モデルです。ここでは、例を分類するために投票するツリーのグループを見ることができます。 決定フォレストは、ランダム フォレストや勾配ブースティング ツリーなど、多くの決定ツリーから構築されます。これにより、使いやすく理解しやすくなり、既存のさまざまな解釈ツールやテクニックを使用して操作できるようになります。 決定木は、動物を鶏、猫、カンガルーに分類するために使用できる一連の「はい/いいえ」の質問です。 TF-DF は、TensorFlow ユーザーにモデルとカスタム ツールのセットを提供します。
上の図に示すように、モデルは 1 行のコードのみを使用して構築できます。対照的に、アニメーションの下のコードは、ニューラル ネットワークの構築に使用されるコードです。 TensorFlow では、決定木とニューラル ネットワークの両方で Keras が使用されます。同じ API を使用してさまざまな種類のモデルを試すことができます。さらに重要なことは、TensorFlow Serving などの同じツールを使用して両方のモデルをデプロイできることです。 TF-DF が提供する機能の一部を以下に示します。
コードサンプル次の例は、ユーザーにとってシンプルでわかりやすい例を示しています。 プロジェクトアドレス: https://github.com/tensorflow/decision-forests
モデルトレーニングPalmer's Penguins データセットでランダム フォレスト モデルをトレーニングします。目標は、動物の特性に基づいてその種を予測することです。データセットには数値的特徴とカテゴリ的特徴の両方が含まれており、csv ファイルとして保存されます。 Palmer のペンギン データセットの例。 モデルトレーニングコード:
コードには入力機能やハイパーパラメータが提供されていないことに注意してください。これは、TensorFlow Decision Forest がこのデータセット内の入力機能を自動的に検出し、すべてのハイパーパラメータにデフォルト値を使用することを意味します。 モデルの評価 それでは、モデルの品質を評価してみましょう。
デフォルトのハイパーパラメータを持つランダム フォレスト モデルは、ほとんどの問題に対して高速で適切なベースラインを提供します。決定フォレストは、一般的に小規模から中規模の問題のトレーニングが速く、他の多くの種類のモデルよりもハイパーパラメータの調整が少なくて済み、一般的に強力な結果をもたらします。 モデルの解釈トレーニング済みのモデルの精度がわかったので、次はその解釈可能性について検討します。モデル化される現象を理解して解釈したり、モデルをデバッグしたり、モデルの決定を信頼したりしたい場合、解釈可能性は非常に重要になります。上で述べたように、トレーニング済みのモデルを解釈するために利用できるツールは数多くあります。まずはあらすじから始めましょう:
決定木の 1 つの構造。 ツリー構造を直感的に確認できます。さらに、モデル統計補完プロット、統計例には以下が含まれます。
これらの質問とその他の類似のクエリに対する回答はモデルの概要に含まれており、モデル チェッカーでアクセスできます。
上記の例では、モデルはデフォルトのハイパーパラメータ値を使用してトレーニングされています。これは最初の解決策としては優れていますが、ハイパーパラメータを調整することでモデルの品質をさらに向上させることができます。これは次のように実行できます。
|
<<: 人工知能は日常のビジネス業務をどのように変えるのでしょうか?
みなさんこんにちは、ピーターです〜最近、reddit で非常に鮮明な mó xìng の写真を見まし...
Google は最新のブログ投稿で、テキスト分類タスクで BERT レベルのパフォーマンスを達成でき...
[[443263]]人工知能の将来の発展の方向性を真に理解するには、まだ長い道のりが残っています。 ...
多くの企業が、データの取得から洞察の獲得まで、スムーズに実行されるパイプラインの構築に依然として苦労...
アメリカのデジタルテクノロジー大手は、流行病の打撃を受けた後、軌道に戻った。数日前、Alphabet...
効果的なプロンプトを書くことは、AI とのやり取りを成功させるための鍵となります。優れたプロンプトは...
[[259612]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
セキュリティ分野では、アカウント取引の異常や異なるイベント間の相関関係など、さまざまなシナリオで「グ...
多くの SF 映画では、このようなシーンがよく見られます。未来の車は完全に自動化されており、必要なと...
今日、ますます多くの消費財 (CPG) 企業が、日用消費財 (FMCG) 事業に AI テクノロジー...