統計コンサルの議事メモ

統計や機械学習の話題を中心に、思うがままに

glm

過小分散なカウントデータを扱いたい

背景 doublepoissonを触ってみる 切片を推定してみる glmで推定してみる dglmで推定してみる 回帰係数を推定してみる glm、dglmで推定してみる optimで推定してみる 終わりに 背景 カウントデータをモデリングしようと思ったとき、まず思い浮かべる分布とい…

GLMをもう少し理解したい④

R glm

前回の記事では、結局GLMというのは以下の方程式: を用いて、を反復的に求めることであると説明しました(IRLS)。 ushi-goroshi.hatenablog.com そのために必要なパーツとしてはとであり、これらは(を除けば)、とそれらのそれぞれに対する微分です。 で…

GLMをもう少し理解したい③

R glm

前回の記事において、GLMでは以下の方程式を用いてパラメータベクトルを推定するという話をしました:ushi-goroshi.hatenablog.com 今回はその続きです。※ 1/25 記事を修正しました 最尤推定 上の式には情報行列の逆行列が入っているので、前から情報行列を…

GLMをもう少し理解したい②

R glm

前回の記事からだいぶ間が空いてしまいましたが続きを書いてみます。なおこの記事は主にDobsonの「一般化線形モデル入門」の第3・4章を参考にしていますので、そちらも合わせてご確認ください。良書です。 ushi-goroshi.hatenablog.com 一般化線形モデル入門…

GLMをもう少し理解したい①

R glm

背景 glm glm.fit C_Cdqrls F77_CALL 背景 一般化線形モデル(GLM)は、一般に線形回帰モデルを正規分布を含む指数分布族に拡張したものだと捉えられています。アイディアとしてはシンプルである割に非常に有用で、GLMによって 整数値(ポアソン回帰) 二値(…

ロジスティック回帰の小ネタ

小ネタ①:ロジスティック回帰は集計値を用いても同じ結果となる tmp <- epitools::expand.table(Titanic) library(tidyverse) dat_table <- tmp %>% group_by(Class, Sex, Age) %>% summarise("Yes" = sum(Survived == "Yes"), "No" = sum(Survived == "No")…