読者です 読者をやめる 読者になる 読者になる

ushi-goroshiの雑記帳

統計や機械学習の話題を中心に、思うがままに

母数の意味

母数という言葉は誤用が多々あるように思います。例えばデータの大きさの話をしている際に「このデータは母数が小さいから~」「十分な母数を確保して~」みたいな言い方をする人をよく見かけるのですが、統計学において「母数」とは「パラメータ」と訳し、…

決定係数についての諸注意

決定係数は線形回帰分析においてモデルの精度を表す指標の一つで、1に近いほど良いモデルであるとされます。またこのは相関係数の二乗で求めることがあります。 しかしこれらの説明は必ずしも正しいとは言えないため、注意が必要です。

データ分析にあたっての参考書籍

データ分析に興味を持ち始めた方から、参考となる書籍についての質問を受けることがあります。統計や機械学習、データ分析に関する本は世に溢れているので、どれを読めばよいか困りますよね。そんな時にいつもお薦めしている本が2冊あります。 ①統計学入門 …

統計モデルに思うこと

機械学習や人工知能が認知されるにつれ、従来のデータ分析者が使用していたモデルという言葉の意味が変わってきたように思います。今日は自分なりに、統計モデルの意味について考えてみます。

無作為抽出と無作為割り当て

こんにちは、ushi-goroshiです。 今日は(も)統計のお話。 有名なオンライン講座のcourseraでは統計学の講義もいくつかあります。 そのうちの一つ、Duke Universityの「Data Analysis and Statistical Inference」はRを使いながら統計の勉強ができる非常に…

SAS + R

ushi-goroshiです。 あけましておめでとうございます。 最近知ってとても衝撃だったのですが、統計解析ソフトとして有名なSASがなんと無料で使えます。 SAS University Edition 無償の統計ソフトウェア SAS University Edition | SAS インストールなどを解説…

21世紀の相関係数

こんにちは、ushi-goroshiです。 相関係数と言えばPearsonの積率相関係数(Excelの関数ではCorrel)が有名ですが、この値は2つの変数間の「直線的関係」しか見れないため、数値をそのまま信用すると痛い目にあったりします(非線形の関係を見逃してしまうの…

平均の影響を考慮した分散の比の検定

こんにちは、ushi-goroshiです。 最近、家のベランダからすぐの所にクモの巣ができたので、巣のメンテナンスをしているクモを日々微笑ましく見ています。 我が家のベランダに接近しない限り。。。 さてタイトルの件ですが、以前に友人から相談を受けた際の回…

最小二乗法と解の特性

こんばんは、ushi-goroshiです。この名前の由来はそのうちに。 今日は最小二乗法によって得られる解の特性について書いておきます。 先日、とあるWebページを見ていると、以下のような文章が目に入りました。 「残差分散が不均一であるときに最小二乗法を使…