順序保存回帰: リソース利用を最大化するアルゴリズム

順序保存回帰: リソース利用を最大化するアルゴリズム

[[205069]]

1. 数学的な定義

順序保存回帰は回帰アルゴリズムの一種です。基本的な考え方は、有限の実数集合が与えられた場合に、次の方程式を最小化するようにモデルをトレーニングすることです。

そして、次の制約が満たされます。

2. アルゴリズムプロセスの説明

シーケンスの最初の要素から逆方向に観察します。無秩序が発生したら、観察のラウンドを停止し、シーケンス内のすべての要素の平均値が次に吸収される要素の値以下になるまで、無秩序な要素から要素を 1 つずつ吸収してシーケンスを形成します。

例:

元のシーケンス: <9、10、14>

結果の順序: <9, 10, 14>

分析: 9 以降は最後の要素 14 まで乱れが見られないため、処理は必要ありません。

元のシーケンス: <9、14、10>

結果のシーケンス: <9, 12, 12>

分析: 9 以降を観察し、14 を観察すると無秩序が発生します (14>10)。この観察ラウンドを停止し、要素の吸収を開始します。要素 10 を吸収した後、サブシーケンスは <14、10> です。シーケンス内のすべての要素の平均値は 12 なので、シーケンス <14、10> の代わりに <12、12> が使用されます。 10を吸収すると***要素に到達し、処理操作が完了します。

元のシーケンス: <14、9、10、15>

結果のシーケンス: <11、11、11、15>

分析: 14 以降を観察し、9 が観察されるとシーケンスが乱れます (14>9)。このラウンドの観察を中止し、吸収要素に切り替えます。吸収要素 9 の後、サブシーケンスは <14,9> になります。シーケンス内のすべての要素の平均値は 12.5 です。12.5 は吸収される次の要素よりも大きいため、10、10 が再び吸収され、シーケンスは <14、9、10> になります。シーケンス内のすべての要素の平均値は 11 です。11 は吸収される次の要素 15 より小さいため、吸収操作は停止され、シーケンス <14、9、10> は <11、11、11> に置き換えられます。

3. 次の実験の原理を説明する例を挙げなさい。

ある薬の投与量を例に挙げてみましょう。

薬物使用が配列 X=0,1,2,3,4….99 で、患者の薬物に対する反応が Y=y1,y2,y3…..y99 であるとします。個々の理由により、Y は単調関数ではありません (つまり、変動があります)。薬物反応で並べ替えると、対応する X の順序が崩れ、研究が無意味になります。私たちの研究の目的は、使用される薬剤の量が増えるにつれて患者の平均的な反応を観察することです。この場合、順位保存回帰が使用されます。つまり、X の順序は変更されず、Y の平均値が得られます。次の図に示すように:

図からわかるように、最も長い緑色の線 x の値はおよそ 30 ~ 60 です。この範囲内では、Y の平均値は同じです。したがって、経済性や患者の抵抗などの要素を考慮すると、理想的な投与量は 30 単位です。

現在、IT業界では仮想化が普及しています。この方法を使用し、適切な判断パラメータを見つけることで、このアルゴリズムを使用してリソースを最も合理的に使用できます。

4. 実験コード

  1. numpyをnpとしてインポートする
  2. matplotlib.pyplot をpltとしてインポートします。
  3. matplotlib.collectionsからLineCollectionをインポートします
  4. sklearn.isotonicからIsotonicRegression をインポートします
  5. sklearn.utilsからcheck_random_state をインポートします
  6.  
  7. 100 個
  8. ##0~99のリストを生成する
  9. x = np.arange(n)
  10. ##np.random.RandomStateのインスタンスをインスタンス化して、毎回取得されるランダムな値が同じになるようにします
  11. rs = チェックランダム状態(0)
  12. ##randint(-50, 50): -50から50までの整数を生成します
  13. ##np.log eを下限値とする対数を求める
  14. y = rs.randint(-50, 50,サイズ= (n,)) + 50. * np.log(1 + np.arange(n))
  15.  
  16. ##順序保存回帰関数を設定する
  17. ir = アイソトニック回帰()
  18. ##トレーニングデータ
  19. y_ = ir.fit_transform(x, y)
  20.  
  21. ## 描画
  22. セグメント = [[[i, y[i]], [i, y_[i]]] i範囲(n)]
  23. ##plt.gca().add_collection(lc)、これらの2つのステップは、点と平均線を結ぶ線を描くことです。
  24. lc = ラインコレクション(セグメント)
  25.  
  26. 図 = plt.figure()
  27. plt.plot(x, y, 'r.' , マーカーサイズ=12)
  28. plt.plot(x, y_, 'g.-' , マーカーサイズ=12)
  29. plt.gca().add_collection(lc)
  30. plt.legend(( 'データ' , 'アイソトニックフィット' ), loc= '右下' )
  31. plt.title( '等張回帰' )
  32. plt.show()

<<:  「機械学習には数学は必要なく、多くのアルゴリズムがパッケージ化されており、パッケージを調整するだけでよい」という主張についてどう思いますか?

>>:  国内AI企業500社のビッグデータ分析:業界レイアウトと資金調達・投資動向

ブログ    

推薦する

...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

機械学習ガバナンスの5つの課題

ML モデル ガバナンスは、組織がアクセスを制御し、ポリシーを実装し、モデル アクティビティを追跡す...

OpenAI は大規模なモデル ストアを立ち上げる予定で、開発者は製品を棚に置くことができます。

最近、OpenAIの人気が高まっています。GPTモデル機能のアップデートからセキュリティ問題まで、世...

AI バイアス: なぜ起こるのか、そして企業はどのように修正できるのか

ビジネスや社会で AI の利用が広まるにつれ、企業は機械モデルに現れる人間の偏見に注意を払う必要があ...

...

量子コンピュータの公開:まだ多くのボトルネックがあり、最初の課題は機械学習の加速です

編集者注: 量子コンピューティングと機械学習の融合は、急成長している研究分野となっています。人々の期...

ソラを解剖:技術的な詳細を推測するための37ページのリバースエンジニアリング、マイクロソフトも参加、中国チームが制作

ソラは発売後すぐにリバースエンジニアリングによって「解剖」されたのでしょうか? !リーハイ大学とマイ...

視覚化: 画像のテーマカラーを抽出するアルゴリズムは高度すぎませんか?

この論文は浙江大学CAD&CG国家重点実験室の視覚化と視覚分析グループが特別にまとめたもので...

比類のない美しさ! AIが90年前の梅蘭芳を復元:目と眉毛が感情を伝え、生きているかのよう

[[407844]]約 100 年前の白黒画像にカラーを施すと、歴史的な意味がさらに増すのでしょうか...

...

AI「メンター」がハーバード大学に入学! CS コースの 7x24 時間の個別指導、RAG は AI 教育のパズルの最後のピースになるかもしれない

昨年、ハーバード大学は大きなことを成し遂げました。彼らは CS50 コースに AI ツールの完全なセ...

...

創造性がデジタル変革を推進する

人工知能はビジネス環境を一新し、競争環境を変え、仕事の本質を変革しています。しかし、人間の創造性も ...