医療データ奮闘記

公衆衛生大学院に入った内科系専門医が医師として培った現場感と大学院で培った統計の知識を交えながら、医療や疫学や統計に関する素朴な疑問や本音をつらつら書いています。

後輩レクチャー

一般化線形モデルの仕上げ

後輩向けの最後のlectureをファシリテートした。 linear predictor, link function, probability density functionの話の後半二つの内容だった。 x <- c(1:100) par(mfrow=c(1,3)) plot(x,type='l',xlab = "x",ylab = "sum of linear predictor") plot(1/1/(…

なんでもかんでも交絡因子を調整してはいけない

なんでもかんでもいれてはいけない 医学分野の論文で、「これが代替の説明変数かな、とか、とりあえず多めに調整しておけば良いか、と思って説明変数を多数入れる」事がよく行われている。1 collider bias (日本語では、合流点バイアス?)というが、あまり…

二項定理を使って「発生頻度(連続変数)を二値変数に変換する」

線形予測子の和は連続変数であり、それがなぜbinary(二値変数)にできるのかはなかなかイメージがつきにくい。しかし自分でやってみるとイメージが湧くようになる。 発生頻度を1%から100%まで動かして、その発生頻度に従って二項定理を使用して乱数を発生させ…

二次関数に直線を引くとどうなる?

データベース(DB)作成 まずは年齢だけで説明できる血圧が入ったDB(random errorなし)を作成 num <- 40 age <- sample(65:85, num, replace=TRUE) XX <- data.frame(age) XX$sbp <- 130 + (XX$age-65)*1.2 XX$sbp2 <- 100 + (XX$age-72)^2*0.5 head(XX) ## ag…

公衆衛生大学院後輩指導論文作成解析用資料(疫学)

Rで解析するための夏休み強化学習50本ノックというものを作った。 自己学習用の資料で、このままやれば50本ノックした際には理解も深まって論文ができている1というものである。答えもR Markdownで作っているのだが、使用したデータベースは公表できないため…