医療データ奮闘記

公衆衛生大学院に入った内科系専門医が医師として培った現場感と大学院で培った統計の知識を交えながら、医療や疫学や統計に関する素朴な疑問や本音をつらつら書いています。

二項定理を使って「発生頻度(連続変数)を二値変数に変換する」

線形予測子の和は連続変数であり、それがなぜbinary(二値変数)にできるのかはなかなかイメージがつきにくい。しかし自分でやってみるとイメージが湧くようになる。

発生頻度を1%から100%まで動かして、その発生頻度に従って二項定理を使用して乱数を発生させる。

bino <- 100
plot(1:bino,rbinom(bino,1,1:bino/bino))

f:id:yiliaojingji:20190706170558p:plain
二項定理1

線形予測子を求める(-∞~∞)

-> probability(発生割合)の値を推測する(0-1)

-> 二項定理で{0,1}に変更する

事で自作データベースを作成できる。