順序保存回帰: リソース利用を最大化するアルゴリズム

順序保存回帰: リソース利用を最大化するアルゴリズム

[[205069]]

1. 数学的な定義

順序保存回帰は回帰アルゴリズムの一種です。基本的な考え方は、有限の実数集合が与えられた場合に、次の方程式を最小化するようにモデルをトレーニングすることです。

そして、次の制約が満たされます。

2. アルゴリズムプロセスの説明

シーケンスの最初の要素から逆方向に観察します。無秩序が発生したら、観察のラウンドを停止し、シーケンス内のすべての要素の平均値が次に吸収される要素の値以下になるまで、無秩序な要素から要素を 1 つずつ吸収してシーケンスを形成します。

例:

元のシーケンス: <9、10、14>

結果の順序: <9, 10, 14>

分析: 9 以降は最後の要素 14 まで乱れが見られないため、処理は必要ありません。

元のシーケンス: <9、14、10>

結果のシーケンス: <9, 12, 12>

分析: 9 以降を観察し、14 を観察すると無秩序が発生します (14>10)。この観察ラウンドを停止し、要素の吸収を開始します。要素 10 を吸収した後、サブシーケンスは <14、10> です。シーケンス内のすべての要素の平均値は 12 なので、シーケンス <14、10> の代わりに <12、12> が使用されます。 10を吸収すると***要素に到達し、処理操作が完了します。

元のシーケンス: <14、9、10、15>

結果のシーケンス: <11、11、11、15>

分析: 14 以降を観察し、9 が観察されるとシーケンスが乱れます (14>9)。このラウンドの観察を中止し、吸収要素に切り替えます。吸収要素 9 の後、サブシーケンスは <14,9> になります。シーケンス内のすべての要素の平均値は 12.5 です。12.5 は吸収される次の要素よりも大きいため、10、10 が再び吸収され、シーケンスは <14、9、10> になります。シーケンス内のすべての要素の平均値は 11 です。11 は吸収される次の要素 15 より小さいため、吸収操作は停止され、シーケンス <14、9、10> は <11、11、11> に置き換えられます。

3. 次の実験の原理を説明する例を挙げなさい。

ある薬の投与量を例に挙げてみましょう。

薬物使用が配列 X=0,1,2,3,4….99 で、患者の薬物に対する反応が Y=y1,y2,y3…..y99 であるとします。個々の理由により、Y は単調関数ではありません (つまり、変動があります)。薬物反応で並べ替えると、対応する X の順序が崩れ、研究が無意味になります。私たちの研究の目的は、使用される薬剤の量が増えるにつれて患者の平均的な反応を観察することです。この場合、順位保存回帰が使用されます。つまり、X の順序は変更されず、Y の平均値が得られます。次の図に示すように:

図からわかるように、最も長い緑色の線 x の値はおよそ 30 ~ 60 です。この範囲内では、Y の平均値は同じです。したがって、経済性や患者の抵抗などの要素を考慮すると、理想的な投与量は 30 単位です。

現在、IT業界では仮想化が普及しています。この方法を使用し、適切な判断パラメータを見つけることで、このアルゴリズムを使用してリソースを最も合理的に使用できます。

4. 実験コード

  1. numpyをnpとしてインポートする
  2. matplotlib.pyplot をpltとしてインポートします。
  3. matplotlib.collectionsからLineCollectionをインポートします
  4. sklearn.isotonicからIsotonicRegression をインポートします
  5. sklearn.utilsからcheck_random_state をインポートします
  6.  
  7. 100 個
  8. ##0~99のリストを生成する
  9. x = np.arange(n)
  10. ##np.random.RandomStateのインスタンスをインスタンス化して、毎回取得されるランダムな値が同じになるようにします
  11. rs = チェックランダム状態(0)
  12. ##randint(-50, 50): -50から50までの整数を生成します
  13. ##np.log eを下限値とする対数を求める
  14. y = rs.randint(-50, 50,サイズ= (n,)) + 50. * np.log(1 + np.arange(n))
  15.  
  16. ##順序保存回帰関数を設定する
  17. ir = アイソトニック回帰()
  18. ##トレーニングデータ
  19. y_ = ir.fit_transform(x, y)
  20.  
  21. ## 描画
  22. セグメント = [[[i, y[i]], [i, y_[i]]] i範囲(n)]
  23. ##plt.gca().add_collection(lc)、これらの2つのステップは、点と平均線を結ぶ線を描くことです。
  24. lc = ラインコレクション(セグメント)
  25.  
  26. 図 = plt.figure()
  27. plt.plot(x, y, 'r.' , マーカーサイズ=12)
  28. plt.plot(x, y_, 'g.-' , マーカーサイズ=12)
  29. plt.gca().add_collection(lc)
  30. plt.legend(( 'データ' , 'アイソトニックフィット' ), loc= '右下' )
  31. plt.title( '等張回帰' )
  32. plt.show()

<<:  「機械学習には数学は必要なく、多くのアルゴリズムがパッケージ化されており、パッケージを調整するだけでよい」という主張についてどう思いますか?

>>:  国内AI企業500社のビッグデータ分析:業界レイアウトと資金調達・投資動向

推薦する

PageRank、最小全域木: ML 開発者が知っておくべき 5 つのグラフ アルゴリズム

接続された世界では、ユーザーを独立したエンティティとして考えることはできません。機械学習モデルを構築...

AIOps の歴史、用途、そして将来

[[413083]]今日のテクノロジー システムの管理と運用は人間だけでは管理するには複雑すぎるため...

...

Nature: 機械視覚による行動理解と脳神経の間には本質的なつながりがあるのでしょうか?上海交通大学のLu Cewu氏のチームはマッピングモデルを構築した

被験者が特定の行動をとったとき、その脳はそれに対応する安定した脳神経パターンのマッピングを生成するで...

...

...

人工知能は医療の未来をどう変えるのか

この病気の症状の多くは心配なものであり、めまいや不安感から始まることもあります。心臓のあたりがバクバ...

無人RV、全電動、未来は明るい

科学技術の急速な発展は、自動車産業の技術進歩を直接的に推進してきました。自動運転は自動車と技術の結晶...

2020 年に注目すべき 4 つのエンタープライズ AR トレンド

AR テクノロジーは消費者向け分野ではそれほど優れた成果を上げていませんが、ビジネス界では好まれてい...

AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

AIにはさまざまな手法があります。私たちがよく知っている「5大流派」に加え、この記事の著者はAIのさ...

人工知能の分野でデータの機密性をどのように保護するか?

進化するインテリジェントな世界では、データの機密性と AI 倫理の融合が企業と社会にとって大きな懸念...

HKU などが GraphGPT をリリース: パラメータを 1/50 に微調整し、精度を 10 倍向上! LLMは長いトークンなしでグラフ構造を理解できる

グラフニューラルネットワークは、グラフ構造のデータを分析および学習するための強力なフレームワークとな...

...

LSTM の父が LLaMA 2 を激しく非難: 私のアイデアをコピーして私を辱めた!ネットユーザー:それをしたのはLeCunですか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...