統計コンサルの議事メモ

統計や機械学習の話題を中心に、思うがままに

決定木

FindBestSplitを書いてみる

背景 実装 1. データ、説明変数を与えると閾値の候補を返す関数 2. データ、目的変数、説明変数、閾値を与えるとGini係数を返す関数 3. 現在のGini係数との差分が最大となる(最良な)閾値を返す関数 終わりに 背景 前回、前々回の記事でrandomForestを使っ…