医療データ奮闘記

公衆衛生大学院に入った内科系専門医が医師として培った現場感と大学院で培った統計の知識を交えながら、医療や疫学や統計に関する素朴な疑問や本音をつらつら書いています。

2019-01-01から1年間の記事一覧

明視域とは、その計算の仕方

今回は全く関係がない、眼の話。自分で実験してみると結構計算通りになるし、老眼鏡が必要になりそうとかを予想してみる。正直、眼科のランドルト環(Cをみて右とか言うやつ)検査よりも自分でやってみる方が実際の見え方に繋がる気がする (眼科の先生に確認と…

傾向スコアと多変量ロジスティック回帰の違い

傾向スコア解析というと、医学分野ではちょくちょく使われているが大学院に来てすぐだと何がどうなっているのかわからず、とりあえずパッケージ使ってやってみた、という感じになってしまうため、lectureを準備することになった。 本質的にはある暴露をみた…

測定誤差があると真の関係はわからない

医学系の研究で、検査が毎回変わりうる検査(信頼性が低い)をoutcomeにするとなかなか結果が安定しない事を説明するためにグラフを描いた num <- 40 age <- sample(65:85, num, replace=TRUE) XX1 <- data.frame(age) XX1$sbp <- 130 + (XX1$age-72)^2*0.5 re…

一般化線形モデルの仕上げ

後輩向けの最後のlectureをファシリテートした。 linear predictor, link function, probability density functionの話の後半二つの内容だった。 x <- c(1:100) par(mfrow=c(1,3)) plot(x,type='l',xlab = "x",ylab = "sum of linear predictor") plot(1/1/(…

なんでもかんでも交絡因子を調整してはいけない

なんでもかんでもいれてはいけない 医学分野の論文で、「これが代替の説明変数かな、とか、とりあえず多めに調整しておけば良いか、と思って説明変数を多数入れる」事がよく行われている。1 collider bias (日本語では、合流点バイアス?)というが、あまり…

二項定理を使って「発生頻度(連続変数)を二値変数に変換する」

線形予測子の和は連続変数であり、それがなぜbinary(二値変数)にできるのかはなかなかイメージがつきにくい。しかし自分でやってみるとイメージが湧くようになる。 発生頻度を1%から100%まで動かして、その発生頻度に従って二項定理を使用して乱数を発生させ…

二次関数に直線を引くとどうなる?

データベース(DB)作成 まずは年齢だけで説明できる血圧が入ったDB(random errorなし)を作成 num <- 40 age <- sample(65:85, num, replace=TRUE) XX <- data.frame(age) XX$sbp <- 130 + (XX$age-65)*1.2 XX$sbp2 <- 100 + (XX$age-72)^2*0.5 head(XX) ## ag…

table.1がいかに重要か

※ この記事はマメに追記・訂正していつか完成する予定です。 カンファレンスなどで「この人賢いなあ」と思う事がよくあるが、一貫してそう言う人たちに共通する性質を見つけた。 それはResultでは「Figure.1とtable.1を半端なく見ている」という所である(医…

コレスポ(corresponding author)になる時の注意点

case reportなど単著でもそうでなくても自分がコレスポンディングオーサーになる事がある。 一度corresponding author1に自分のgmailのアドレスを書いてしまった。 迷惑メールと学会参加のお誘いやよくわからない雑誌に投稿しないかとかpeer reviewどうです…

医療統計と疫学の雰囲気の違い

今回はいつも以上に独りよがりな意見ですが。。 公衆衛生大学院に入ると、疫学の教室と医療統計の教室で全く考え方が違う印象を受けた。 違い 医療統計 「統計学的な正しさ」にかなり価値がある(主眼を置く)イメージ。「誰にも文句を言われないデザイン」(RC…

問診をする時何か忘れる、というのは普通の事らしい。

患者に問診に行く時、「あー、喫煙聞くの忘れてたー」とか、「そういや子供いるんやっけ」などとなる事が多い。 専門領域に関しては特に「そういえばアミロイドーシスの可能性ってないの?」とか指摘されて何も答えられないとなると自分の信頼に関わる問題に…

マルチレベル分析がなぜ必要かの説明をRで簡単に実装して行う

臨床をやっている時には意識していなかったが、施設差を解析に入れないと解析結果が明らかにmisleadingとなる事があるので、Rで実装しておく 個人的には、「その治療法は施設によってやり方が全然違うんちゃうん?」もしくは「その病気の予後は地域によって…

Reviewerが10人ついた!!?

この間投稿した医学系の論文だが、最終的にアクセプトされたのだが、はじめにreviewerが10人ついて驚いた。 周りの割と偉い人たちに聞いても誰一人そんな事経験した事がないと言っていた。1 今となってはおそらくEditorが通したかったのだろうという結論に至…

ベイズの考え方をRで簡単に実験してみよう。

ベイズの勉強をしたいと思ったが、何をみてもいまいち実感が湧かなかったため、Rで実験したくなった。(初めの段階の理解は以下の記事参照) yiliaojingji.hatenablog.com 頻度論とベイズは同じ式の形をしてても(同じ確率密度関数の形)解釈が違う。例えば以…

公衆衛生大学院後輩指導論文作成解析用資料(疫学)

Rで解析するための夏休み強化学習50本ノックというものを作った。 自己学習用の資料で、このままやれば50本ノックした際には理解も深まって論文ができている1というものである。答えもR Markdownで作っているのだが、使用したデータベースは公表できないため…

lasso回帰をする時に二値変数と連続変数を同時に扱うにはどうすれば良いのか?

R

と思って調べた。 英語ではいくつかあるが、日本語ではなかなか見当たらなかったし、周りの人1に聞いても意外と誰も答えられなかった。 英語では例えば https://stats.stackexchange.com/questions/69568/whether-to-rescale-indicator-binary-dummy-predict…

SPSSで年度別データをまとめる方法

筆者はSPSSはあまり使わないが、仕事上どうしても必要になった事がある。 SPSSで各年度のデータをひとまとめにする(unionの方法に相当)方法を記載しておく。 まずはデータセットを3つ用意する データセットの説明 id :個人特定番号 va1 :個人の情報(その…

対数変換(log変換)して有意差がなくなる事もある??

R

stepwise法で(AICでなく)p値を使って変数選択をする際に対数変換するとしないのとで有意差が変わってしまうのは問題ではないかとカンファレンスで指摘した事がある。 指摘しておいて不安になったので実際やってみた。 height <- c(158,162,177,173,166,168) …

心臓マッサージ(胸骨圧迫)をするべきかどうかで困るのでは? (心肺停止の判断基準)

今日は平和かなーと思っていたが、そう思った日に限って突然心肺停止などが起こるものである1。 私は目の前での心肺停止を結構対応しているので、皮肉を込めて「名探偵コナンみたいやな」と言われた事もある。 院外(駅)で1回、院内では5回くらいfirstで急変…

高血圧はどのくらいまで下げるべきか?

この記事のエッセンス 高血圧ガイドライン2019から降圧目標値が130/80となったようである SPRINT試験というアメリカが国を挙げて調べたかなり信頼性の高いRCTが背景となっており、おそらく向こう20年くらいは同じような研究さえされない(覆らない)のではない…

ifelse()関数とfactor型が合わさると恐ろしい事が起こりうる

R

最近論文を書いていて大ダメージを受けたので、共有しておく(reviseの際に気づいたから良いものの、ギリギリで危なかった。) エラーが出ないミスは本当に怖い。 R使っている人はコピペで全部確認できます。 <目的> スポーツ習慣とマラソンでゴールできる…

自己紹介 備忘録始めました。色々教えてください

※改定中