医療データ奮闘記

公衆衛生大学院に入った内科系専門医が医師として培った現場感と大学院で培った統計の知識を交えながら、医療や疫学や統計に関する素朴な疑問や本音をつらつら書いています。

2019-05-07から1日間の記事一覧

lasso回帰をする時に二値変数と連続変数を同時に扱うにはどうすれば良いのか?

R

と思って調べた。 英語ではいくつかあるが、日本語ではなかなか見当たらなかったし、周りの人1に聞いても意外と誰も答えられなかった。 英語では例えば https://stats.stackexchange.com/questions/69568/whether-to-rescale-indicator-binary-dummy-predict…

SPSSで年度別データをまとめる方法

筆者はSPSSはあまり使わないが、仕事上どうしても必要になった事がある。 SPSSで各年度のデータをひとまとめにする(unionの方法に相当)方法を記載しておく。 まずはデータセットを3つ用意する データセットの説明 id :個人特定番号 va1 :個人の情報(その…

対数変換(log変換)して有意差がなくなる事もある??

R

stepwise法で(AICでなく)p値を使って変数選択をする際に対数変換するとしないのとで有意差が変わってしまうのは問題ではないかとカンファレンスで指摘した事がある。 指摘しておいて不安になったので実際やってみた。 height <- c(158,162,177,173,166,168) …