奈良県立医科大学大学院医学研究科 医の共通科目(分担:研究におけるデータ収集と統計処理について)
(博士課程,修士課程)

本講義について

https://medbb.net/education/nmucsmed2024
nmucsmed2024-00.png(2796 byte)
大学院進学おめでとうございます.自分の明るい未来に向けて夢と希望を持ち合わせている方,そのまま突っ走ってください.何となく流れでという方.人生そんなものだと思います.流れに乗り続けるためにはこの世界楽しく過ごしてください.
この世界は実直に取り組む方を大切にする文化があるように感じています.「新たな知見」は産み出す苦しみも感じるかもしれませんが楽しさもそれなりにあると思います.私は二度と経験したくないと思う一方,その後の人生を歩むにあたりこの時代の経験は(いろんな意味で)人生を強く生きていく上で役に立っているように思います.

概要

 人々は日常生活において経験や伝聞に基づいた知見に基づき,状況を判断し意思決定を行っている.
一方研究における「新たな知見」の獲得は日常のプロセスと異なり,科学的な検証が求められる.
 本講義では研究を進めるにあたって,日常生活と科学における知の違いを示したうえで,データの取得から統計処理まで,手法を中心に整理していく.

ねらい

 博士課程の方,修士課程の方と対象が幅広いことや限られた時間でありますので,これまで学生に抗議講義してきた中で感じたことや伝えきれていないようなこと,またデータを取り扱っていく上で私が気になった,もしくは周囲の人が気になって相談してきたことをまとめることにしました
 この時間を通して日常生活と学術研究の違いについて考える機会になればと思っております

学部学生を見ていて大学院生になった皆様に対して思うところ

中等教育まで・・・日常生活の延長線上での取り組み方が多いように思う・・・結果が支配的・・・故に結果をゴールとして逆算してなんとか辿り着く
高等教育以降・・・徐々に学術視点・・・結果では不十分,結論が大切・・・まだ誰も想定していない未来を描くのでゴールの無い世界

積み重ね

知の積み重ねとは → 丸暗記型の学生はしんどくなっていく
 → 知識の積み上げになっていない→情報を貯めているだけ(試験のために必要な事柄という情報として取り扱っているから知識になりにくい)
nmuhlthstat1_2024-0101.png(354113 byte)
大学院では
大学院では自分なりな知の積み上げ → 新たな知見へ
修了(学位取得)は新たな知見のアウトプットに基づき判断 → 公聴会

生活者として目指している事,研究者として目指している事

纏めてみると技術者はどちらも鑑みないといけないのでその中間に位置しているのだなと思いました.
医療技術者を含む様々な技術者のように思います
生活者の視点 研究者の視点
限られた中で工夫を凝らしながら周囲を含めた幸せな人生を 限られた中で工夫を凝らしながら新たな知見を
日常生活では都合の良い奇跡が起こることを心待ちにしている 研究生活では(仮説)想定が(事実)仮説に沿った研究結果として出てくることを心待ちにしている
事実が全ての世界 真実が全ての世界
結果良ければすべてよし.故に途中で路線変更もあり.達成すればよい いずれは社会実装され課題解決につながるといいな
願望が100%叶う能力を手に入れたい 事実は大切だが偶然なことなのかもしれない と 捉えている(ハズ)
科学は正しい 科学は間違えていることもある

科学

科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
<引用>
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm
【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf

実証性

「考えられた仮説」が無いことには始まらない→仮説検証型
それでは「考えられていない仮説」とは?
→まだ十分に確固たる仮説として成立していない仮説

仮説検証型と仮説探索型

仮説探索型とは「考えられた仮説」が存在せず(関心ある事象など),得られた結果は「考えられた仮説」になる可能性を有するので「まだ考えられたと言い切れない仮説」

再現性

仮説を実証するために得られたデータから複数回,同一の検証結果になること
「常に」同一の検証結果になることを求めていないが,それは求められないから

再現性の限界

再現性の条件は「仮説の実証を複数回行っても同一の結果が得られる」ことですが,その回数が無限であるならばその条件は永遠に満たされません.
故に有限となりますが,それはある回数(x回)まで同一の結果としても,x+1回目以降同一の結果にならない可能性を含んだものになります.
これは未来において,その仮説が覆される可能性があることを示すもので,反証可能性といわれるものです.
再現性の限界を超える方法
「仮説の実証を∞回行っても同一の結果が得られる」
実証で得られたデータについてどのようなものであっても同一な結果が出るように判定基準を定める
問1 再現性の限界を超える(同一の結果が100%出るような判定基準を定める)ことがよろしくない理由
判定基準
同一の結果が100%出るような判定基準を定めた場合,その結果は「科学を超越した何か」に基づくものになります
問2 「科学を超越した何か」に基づく話にどのようなものがあるのでしょうか
<お時間あるときにどうぞ>科学と疑似科学を分ける2つの基準(森田 邦久 科学哲学/42 巻 (2009) 1 号)
https://www.jstage.jst.go.jp/article/jpssj/42/1/42_1_1_1/_article/-char/ja

「同一の結果」が100%の確率で出現しないことを示しておく必要が出てきます 例えば仮説の実証を行うにあたって検証データに対する判定基準を具体的な効果量とした場合,達成してもその判定基準が「『同一の結果』が100%の確率で出現しない」ものか分かりません.
例えばその目標値が医学的に妥当なものであったとしても,ここでは関係ない話になります
そうなると,確率に基づく基準で判定しないことには,再現性を満たすことが出来ません
故に仮説検定では効果量などで判定せずに確率に基づいて行わない限り科学の枠組みに収まっていることを主張できません

統計的有意差と臨床的有意差

確率的な点から得られたデータに基づき計算した量を統計的有意差と呼びます.
知見は社会実装することで社会に貢献できますが,医療現場においては臨床的に効果があるとされる量のを指す臨床的有意差が結果として求められます
無論臨床で役立てていく知見で重要なのは,統計的有意差よりも臨床的有意差が重要になりますが,残念なことに「科学的」な観点では前者が支配的になります.(科学的な話なので)

確率の違いを量で示すと,サンプルサイズにより変化します.
各群サンプルサイズ10の場合で検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
各群サンプルサイズ1000の場合検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
 nmubiostat2016-0901.png(37095 byte)
例えば臨床的有意差が統計的有意差(に基づく効果量)よりも大きい場合は再現性については確認できたものの臨床的な観点で確認していません.統計的には良いが,医科学的には?という結果になります
故に臨床的有意差に基づきサンプルサイズを決定することで二つの違いを解消できます
一般にはサンプルサイズが大きいほど精度の高い結果が得られるので好ましいという感覚に思いますが,それは区間推定の話で仮説検定においては少し状況が異なります

統計的有意性とp値に関するASA(アメリカ統計協会)声明

<参考>統計的有意性とP値に関するASA声明(日本計量生物学会)
http://biometrics.gr.jp/news/all/ASA.pdf
以下の内容が指摘されています
1. p値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
2. p値は、調べている仮説が正しい確率を測るものではない
3. 科学的な結論は、p値がある値を超えたかどうかにのみ基づくべきではない
4. 適正な推測のためには、すべてを報告する透明性が必要
5. p値は、効果の大きさや結果の重要性を意味しない
6. p値は、それだけでは仮説に関するエビデンスのよい指標とはならない

データで示す事実と真実の不一致

事実がどのような事実から構成されているのか
研究は,現象を確認できる事実に基づく客観的な真実を追求する取組 ということになります
データを用いた研究はデータそのものは事実であるが,たとえ研究のために取得したデータでも想定していない事柄が含まれる可能性を否定できない.
その中でも客観的な真実に向けてデータを分析を目指すことになります.

分散と不偏分散の話

事実とは実際の出来事・・・記述統計
真実とは実際の出来事に加えて一連の事柄にする・・・推測統計
事実と真実が異なる例として「分散」の話が挙げられます.
記述統計(事実)の世界では偏差平方和をサンプルサイズnで除するという,非常にわかりやすい定義
推測統計(真実)の世界では偏差平方和をサンプルサイズn-1で除するという,事実側から眺めると理解し難い定義(?)
この部分で推測統計を受けいれない方もおられるように思いますが,よーく考えると前提をどこに置くのかだと思います.
「分散の話は手持ちの標本で求めた平均値が母平均の不偏推定量だから母平均は標本で求めた平均と同じと見なしてよい なぜなら事実なんだから」と事実主義で前提を置き換えているからのように思います.
ちなみにですが,母集団からサンプルサイズ10の標本を2000ほど抽出した平均値のヒストグラム
母集団の平均は125.0なのですが,ピッタシは1%程度 事実から外れているものの外れっぷりは程があります.推定は当たらないけど程がある(不偏)のがよいというところです
medbbstat2022-0202.png(96791 byte)
さて分散ですが,母集団の平均(本来知る由もない事実125.0)を用いて2000の標本それぞれの分散を求めたヒストグラムです(ちなみに母分散も本来知る由もない事実81.0)
medbbstat2022-0204.png(137439 byte)
もし母平均を事実として知っていたならば,上記のように標本から求めた分散は標本平均の時と同じように母分散ピッタシは期待できないものの外れっぷりに程があります
残念ながら母平均は知らないので,標本平均を用いるしかない(事実から算出しているものですが母平均そのものではない)のですが,以下のようになります
medbbstat2022-0203.png(135831 byte)
ピッタシは期待できないどころか,外れっぷりも値の低い方に偏っているのが確認できると思います
そこで同じ標本の平均を用いて事実とは異なる分母(サンプルサイズ-1)で偏差平方和を除すると以下のように(本人は知る由もないが)外れっぷりに程がある結果となります
medbbstat2022-0205.png(146106 byte)
事実は正しいが客観的な真実に辿り着くには,事実に重きを置きすぎるとその先を見誤ることもあるということを示している例に思います

平均よお前もか

平均値を使うと新たな関係が産まれることもある

こちらはX軸は1~10の乱数(整数)をY軸は1~100の乱数(整数)を発生させそれぞれプロットしたものです.
nmucsmed2024-01.png(220895 byte)
コチラはY軸のデータをそれぞれ平均を求めてプロットしたものです.
nmucsmed2024-02.png(146700 byte)
相関係数はオリジナルのものは0.06,平均をしたものは0.616という恰好で謎な法則が出来てしまうことがあります.
乱数を発生させているだけなので,何回か繰り返し行うことでこのような結果が出てくることがあります
XYそれぞれの平均で区切った4つの象限にどの程度プロットされているかで決まってしまうので,平均で丸めてしまうと偶発的に相関関係が出来上がってしまうことがあるという話です.
問3 なぜ平均値を用いると相関関係があるようなものが見られるのでしょうか

平均値は万能ではない

2群の比較をするとき,平均値で行うこと(すなわちt検定)が多いかと思います.それは中心極限定理があるから・・・という話でしたが
中心極限定理
サンプル数が多ければ標本平均の分布は正規分布になる

あまりにも分布が違う場合は平均値で解釈するとおかしなことになることがあります
nmucsmed2024-03.png(332403 byte)

間違えないと進めない世界

人が直接データを入力すると間違いがあっても当然と思います
そこで,入力するカラムに入れる数値を制限する方法もありますが,設定によっては入力できないなどの弊害もあります
また,データが欠損している場合ルールを決めていないと,例えば体重を入力する場合,数値しか入力できない制限があると
【】【0】【0.0】【999.9】などなど,ルールがないと入力者がそれぞれ知恵を絞って入力されます,なにか入力しないとならない設定ならば謎数値が入ります
あとは一列ズレたまま入力とか,被験者IDがズレて入力など・・・
データクリーニングすること前提ですが,例えばID以外の本人の属性情報も入力するなど他のデータと突合できるような設計にすることが必要かと思います.
地道なクリーニングになりますが,出来ないものもあるので(デジタルデータのみの場合など)悩ましいところです

測定機器の利用

この手の話はちょっと文字に起こしにくいので,ファンタジーな世界での出来事を紹介します.
あと他言は無用です.ポイントのみ記憶に留めあとは綺麗に忘れてください
結局データの振る舞いで判断するしかないので,誰かが気がつくかそのような仕掛けを作ってコンピュータに処理させるか・・・

測定機器の特性による話

測定装置からダイレクトにデータをサーバーに送ってもらう等,人の手を介さない形で取得できるケースも多くなってきました.
しかしながら,測定装置の特性について技術者側と研究者側で理解に相違があると困った事態になります
無論,転んでもただでは起きないよう取り組むのが研究に向き合う正しい態度に思います(のでエラーの話もどこかで昇華しています)
RF-IDタグを用いた研究に参画していたのですが,いろいろ経験しました
想定していなかったエラーデータが山のように出現し・・・
huhmacollab2018-10.png(357084 byte)
huhmacollab2018-11.png(213654 byte)
huhmacollab2018-12.png(185389 byte)
産学官連携マネジメント論2018(分担:地域医療と産学官連携) より
この時はエリア間の移動を把握しようとするのですが,建物には鉄筋が入っているので電波が乱反射
出てきたデータを見て呆然としつつデータクリーニング
このエラーは「仕様の範疇」であるからエラーではないとしているが,利用者側としてはエラーとして処理しないと実態を示すところまで辿り着かない
よくわかる研究論文のクリティーク第2版 クリティーク・チェックシート
に本件に関する論文の情報が出ています

実態は事実だが私たちの想定を超える事実が含まれているのかもしれない

人口動態に関する指標 出生であったり死亡などは年間の集計値を教えてもらった時,12や365で除することで月平均,一日平均を計算するのではないかと思います
例えば,年間を通してデータを取っているものに出生数があります
nmucsmed2022-02.png(158279 byte)
一日の平均値よりも多かった日は青,少なかった日は赤で色の濃さは平均から離れるほど濃く表記されています
問4 この事実(出生数は一様ではない)となるといくつかの事実が含まれたものになりますがどのようなことが考えられるでしょうか

終わりに

生活の場においては意思決定をする際は,帰納法により判断しているケースが多いのではないでしょうか.
自分の生活が上手くいけばいいので,実際に上手くいけばそのまま,上手くいかなければまた考えるという恰好だと思います
日常生活の場は検証の場では無いので当然と言えば当然ですが,研究の場においても帰納法に基づく知見(根拠のある仮説になりうる)は有用に思います.
発生するデータが増大していますので,いわゆるデータマイニングといわれる手法になりますが,頭の中を整理しながらあれこれ考えることができるように思います.
無論,事実ではあるが色々な事実が含まれているデータであることに気がつかなければ,謎めいた方向に思考が向かっていくかもしれません.
事実を自身の都合の良い解釈をすることで真実に辿り着かないことが無いために,様々な領域に関心を持つことを忘れたらいけないような気がしています.
これから楽しいことはありますが,呆然と立ち尽くすこともあるかもしれません.是非良かったと振り返ることのできる学生生活をお過ごしください.
ちなみに私は振り返ると良かったと思っていますが,経験は一度で十分というところです