« 羅臼~知床五湖 | トップページ | Schoenerの類似度 »

複数の説明変数を組み込んだ時の係数

複数の説明変数を組み込んだモデルだと、自分のデータを取った時の感触と全く予期しない係数が得られる場合がある。
先輩がこの前、この問題にぶちあたりいろいろ相談した。

5月27日の記事で使った例を見てみると。

まずは、numberに対する散布図を描いてみると、
Sanpuz

areaとfoodは正の効果がり、foxは負の効果があるように見える。

実際、これでモデルを作ると、

mod<- glm(number~area+food+fox,family=poisson)
summary(mod)

Call:
glm(formula = number ~ area + food + fox, family = poisson)

Deviance Residuals:
     Min        1Q    Median        3Q       Max 
-1.95257  -0.78108  -0.03689   0.65138   2.01692 

Coefficients:
             Estimate Std. Error z value Pr(>|z|)   
(Intercept)  2.033526   0.182762  11.127   <2e-16 ***
area         0.056394   0.030366   1.857   0.0633 . 
food        -0.009294   0.021357  -0.435   0.6634   
fox         -0.035674   0.025068  -1.423   0.1547 

となり、foodが見た目とは裏腹に負の効果になっているように見える。
数学的なものはよくわからんが、より強い変数であるareaに喰われて、foodの係数が負になってしまうのだろう。

ちなみに交互作用も考慮して、モデル選択すると、

mod2<- glm(number~area*food*fox,family=poisson)
step(mod2)
Call:  glm(formula = number ~ area + food + area:food, family = poisson)

Coefficients:
(Intercept)         area         food    area:food 
   0.859480     0.035852     0.080408    -0.001642 

となり、交互作用項が選択され、areaとfoodが正になり、その交互作用項が負になる結果になった。

|

« 羅臼~知床五湖 | トップページ | Schoenerの類似度 »

統計/R」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 複数の説明変数を組み込んだ時の係数:

« 羅臼~知床五湖 | トップページ | Schoenerの類似度 »