奈良県立医科大学 生物統計学2025
(医学部医学科)

【講義後記】視聴はこちらをクリックしてください

2025年度開講にあたって
https://medbb.net/education/2025init/

なお,例年例題について回答が欲しいという声があるのですが,授業中に示しておりますのであらためて掲載はしておりません.

課題提出の実状より課題の評価を授業後の提出物によるものから変更します(2025年5月16日追記)

課題をオンライン端末をから提出する形態で実施してきましたが,本科目が担っている目標の達成にあたって変更が必要になりました
詳細は口頭にてお伝えします.
以下のようにシラバスの課題に関する部分を変更します
《》内は評価するアウトカムのコンピテンス番号になります

変更前

評価方法において
■提出課題(20%)《Ⅰ》
(授業毎に提出.教員が示した課題への回答を以て評価する)
■小テスト(30%)《Ⅵ》
■定期試験(50%)《Ⅰ,Ⅱ,Ⅵ》

変更後

評価方法において
■提出課題(10%)《Ⅰ》
(5/17以前については授業毎に提出.教員が示した課題への回答を以て評価する)
(5/18以降については授業毎の提出は必要としない.授業内容に関する不明点など自身が能動的に提出する.提出は評価に反映させるのではなく授業に反映させる)
■小テスト(30%)《Ⅵ》
■定期試験(60%)《Ⅰ,Ⅱ,Ⅵ》
(5/18以降における授業の中で教員が示した例題等(授業内容に関するフォローの内容含む)に関係する問題を定期試験で10%分配点する.その結果を以て目標《Ⅰ》に対する評価の一部とする)
授業内容に関する不明点は 「2025年度開講にあたって」のページに用意している「授業に関して困った時,以下からご連絡ください」よりご連絡ください
https://medbb.net/education/2025init/

授業の進め方

授業中は課題について廻りに相談せず各自で取り組んでください.不明点は私に質問してください.その内容をみなさんでシェア出来たらと思っています.

なぜ統計が必要なのか?

私たちはデータを取得して物事を判断し次の行動につなげている.
nmuhlthstat1_2024-0101.png(303517 byte)

授業メニュー



第01回【オンデマンド講義】科学と統計

第02回【オンデマンド講義】記述統計

第03回 推測統計(1)点推定(平均と分散)

第04回 推測統計(2)区間推定(正規分布)

第05回 推測統計(3)区間推定(t分布)

第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定

第07-08回 推測統計(5)パラメトリック検定(t検定)

第09回 中間まとめ(小テスト)

第08+2回 推測統計(6)パラメトリック検定(ANOVA,有意確率補正法)

第10+1回 推測統計(7)ノンパラメトリック検定,カイ二乗検定

第11+1回 相対リスク

第12+1回 ROC解析

第13+1回 相関係数,回帰分析

第14+1回 生存時間分析

第15回 まとめ

第01回 科学と統計

【GE-01-04-01】根拠に基づいた医療(EBM)の 5 つのステップを列挙できる
【GE-01-04-02】PICO(PECO)を用いた問題の定式化かができる。
(教科書1章1,2)

科学

科学が日常生活を豊かにしていることは明らかであるものの,科学者の想いによらない使い方もされたり,世の中全てを科学で説明できない
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm
【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf
実証性
検討することのできる仮説が無いことには始まらない
再現性
同一の実験条件では同一の結果が得られる
客観性
多くの人々に承認される
chatGPTによる実証性に関する質問
「検討することのできる仮説とは」
ChatGPT3.5
検討することのできる仮説は、研究や分析の目的に基づいて多岐にわたります。仮説とは、観測された現象を説明するための仮定や推測であり、実験やデータ分析を通じて検証可能でなければなりません。(以下略)
「検討することが出来ない仮説とは」
ChatGPT3.5(纏めると)
検討することができない仮説にはいくつかの特徴があります。科学的な文脈で、仮説は観察や実験を通じて検証可能でなければなりません。
検討が難しい仮説の特徴
検証不可能,曖昧な定義,超自然的な要素,因果関係の証明が不可能,非現実的な条件

EBM

Evidence-Based Medicine
根拠に基づいた医療
「根拠」・・・科学的根拠と表現されているケースも多い・・・(経験則だけに基づかないようにという意味合いを込めてというところかな)

医療提供における「根拠」以外の要素

意思決定における3要素・・・根拠,価値観,資源
価値観は人によってさまざま
現有(もしくは調達可能な)資源で出来ることしかできない
医療資源
joho20140730-01.png(104237 byte)
不足の観点からみる医療2.0β より)
「根拠に基づく医療」(EBM)を理解しよう(厚生労働省eJIM(イージム「統合医療」情報発信サイト))
https://www.ejim.ncgg.go.jp/public/hint2/c03.html
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)
https://www.niph.go.jp/journal/data-49-4-j49-4/
1.問題の定式化
PICO
P(Patient)どのような患者さん(対象)なのか
I(Intervention)どのような介入を適用しようとしているのか
C(Comparison)介入しない場合(もしくは他の介入)と比較して
O(Outcome)どのような結果になるのだろうか
2.問題についての情報収集
掲げた問題に相当するような情報(世の中にある研究論文など)を探す
3.情報の批判的吟味
情報そのものがどの程度信頼出来るのか,効果があるのか.
4.情報の患者への適用
今回の患者さんと情報で得られた患者像を同じと見做し適用して良いか,問題あるのか
5.1~4 のstepの振り返り
研究の場合もPICO/PECO(E(Exposure) 治療などの介入ではなく曝露)で整理し目的を明確化します.
EBMはある患者さんに医療を適用するために情報を検索という流れですが,研究はある仮説を明らかにするために目的を明確化してデータ収集・分析となります.
南郷栄秀,Evidence-based medicine:診療現場でのプロブレムの解決法 日内会誌 106:2545~2551,2017
https://www.jstage.jst.go.jp/article/naika/106/12/106_2545/_article/-char/ja/
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)

EBMの5ステップと意思決定の3要素

EBM1~3ステップが根拠の部分
根拠とする情報に実証性と再現性と客観性があったほうが良いというところは理解できるかと(つまり科学としての基本的な条件を満たしている方が良いだろう)
研究の方法によって,グレードが変わるのはそれらの要素が方法によって異なってくるので
ステップ4においては価値観と資源を含めた形となる
提出課題
1:根拠に基づかない医療とはどのようなものかお考えを示してください(短文で)

第02回 記述統計(1)尺度,度数,代表値

【SO-02-03-01】尺度(間隔、比、順序、名義)について説明できる。
(教科書2章1)
nmubiostat202102-02.png(396280 byte)

統計に用いるデータ

基本どのようなデータでも統計処理は出来る
出来ないのは,どのようなデータであっても一つしか存在しない時

データについて

レコード
症例,個体,被験者単位でまとめられたデータの塊.表の場合一行にその症例のすべてのデータを記していたらそれがレコード
変数(変量)
データの項目名のこと
データ
観測値や測定値のこと(数値)だけでなく性別など文字の場合もある.
コンピュータ処理するとき,文字だと扱いにくい時があるのでその時は数字に置き換える(→コード変換)
例えば都道府県名であれば 北海道→01 青森県→02 奈良県→29
全国地方公共団体コードの上二桁=都道府県番号
<参考>全国地方公共団体コード(総務省)
https://www.soumu.go.jp/denshijiti/code.html
都道府県番号の順序を用いて説明する事柄は存在しない.一方,文字で順列の存在するもの(松 竹 梅)はその法則にしたがった番号を振ることがあるので注意

変量(データ)の分類

変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)(比率)

1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
nmuhlthstat1_2024-0103.png(363067 byte)

記述統計量(度数)

取りまとめたものを「量で」示したもの.質的変数であっても度数(個数,人数など数えるもの)については「量」として示すことが出来る
どのようなデータでも度数を示すことは可能

度数分布表

この授業では量的変量の度数分布表を作成する場合 A~B は A以上B未満として取り扱う
  それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
店名 度数 相対度数 累積度数 累積相対度数
 
 
 
 
  1.00
1.00 ----- -----

量的変数の度数分布表

量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.
血圧 163.5mmHg 164.2mmHg 162.5mmHg・・・どれも度数を積み上げられない → 区間を設定する
「A~B」は「A以上B未満」と読む格好と思っていたが,分野などによって違うようです
「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように.
本授業(ミニテスト試験など全て含む)においては,「A~B」は「A以上B未満」として取り扱う
階級 階級値 度数 相対度数 累積度数 累積相対度数
130~140 135
140~150 145
150~160 155
160~170 165
170~180 175
----- -----

度数分布図

質的変数・・・縦棒グラフ
nmuhimstat2021-01.png(3771 byte)
量的変数・・・ヒストグラム
nmuhimstat2021-02.png(3656 byte)
棒の間隔が無いのは値が連続している状態であるが故
普通の棒グラフは棒の長さが度数を示すが,ヒストグラムは棒の面積が度数を示す
「階級の幅を等しくすること」と説明している場合があるが,それは幅が変わると高さが変わる故で,実際にはそのような区間設定はよくある
以下の参考資料に区間幅の異なるヒストグラムについても説明なされているのでよろしければごらんください
ヒストグラムーなるほど統計学園(総務省統計局)
https://www.stat.go.jp/naruhodo/4_graph/shokyu/histogram.html

記述統計量(代表値)

その集団を代表する値
代表値と散布度からなる.←駅伝やマラソンの実況中継はこれらを利用しているから状況がわかる

平均(Mean)

算術平均
いわゆる割り勘.xbar=1/n(x1+x2+・・・+xn)
欠点:外れ値があると平均値は分布の中心位置を示さない(←それって代表的な値??)
 → 対処法:外れ値を取り除くか中央値を使うか
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる
加重平均
重みづけ平均
例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの?
度数分布表を用いて算術平均を求めることもできる(個票データの算術平均とほぼ同じ)・・・Σ(階級値×階級の度数)/n

中央値

昇順に並べたときに,真ん中の順番のデータ(変数)の値
データの数が偶数だと真ん中のデータは二つになるのでそれらの平均値

最頻値

最も個数が多いデータの値
最頻値は複数存在する場合がある→二峰性

最大値,最小値

例えばある期間のピークの値を扱うケースもある

記述統計量(散布度(範囲))

範囲

最大値と最小値の差

四分位範囲

順序尺度の性質を用いた散布度
小さい順(昇順)に並べて集団を4等分
分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3)
また第1四分位数は25%タイル値,第2四分位数=中央値=50%タイル値,第3四分位数=75%タイル値とも呼ばれます
大きい方が第3四分位数なのですが,間違える方も一定数いますが100%タイル値=最大値ということを理解していたら大丈夫でしょう
四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の算出方法は数多くあります
高校数学で習われたものは文部科学省が推奨した方式で,高校数学以外では見掛けない方法です.
一番わかりやすい四分位数の出し方はヒンジ値
nmubiostat2024-0301.png(438054 byte)
以下のブログを見ていただくと数種類出来てしまうのも頷けるかと思います
ダンゴ包丁理論(tukeyのヒンジ)(Medbb's blog)
https://medbb.hatenablog.com/entry/2020/12/12/091240
考え方としては理解しやすいと思いますがtukeyのヒンジとは少し値が異なるケースもでてくるのでご注意ください

<参考>四分位数の定義(奥村 晴彦 (Haruhiko Okumura))
https://okumuralab.org/~okumura/stat/quartile.html
<参考>■四分位数の定義-教科書の内容に関するQ&A(数研通信(78号)数研出版)
https://www.chart.co.jp/subject/sugaku/suken_tsushin/78/78-10.pdf

箱ひげ図
四分位範囲をグラフ化
nmuhimstat2021-09.png(8898 byte)

記述統計量(散布度(偏差))

「偏差」とはある点と基準点とのズレをさす
「偏差」とだけ記述されてると基準点は平均値として捉えられるケースが多い

四分位偏差

順序尺度の性質を用いた散布度
QD(quartile deviation)=IQR/2=(Q3-Q1)/2
四分位範囲を2で割ると求められるが,意味的には第3四分位数と第2四分位数の偏差と第2四分位数と第1四分位数の偏差の算術平均
QD=((Q3-Q2)+(Q2-Q1))/2=(Q3-Q1)/2

(平均値との)偏差

集団の平均値と個々の値の偏差を求めその平均をとることでその集団のバラツキ具合を算出

分散

量的変量の性質を用いた散布度
平均値から求めた偏差の平均は常に0になってしまう
平均値から求めた偏差の絶対値平均を求めるのは面倒.(近年PCを使えば簡単だが)
分散は偏差平方の算術平均
nmubiostat2016-0302.png(3064 byte)
利点は,偏差を基にした散布度を算出できること
欠点は,求めた散布度の単位が二乗した格好になっている

標準偏差

分散の正の平方根を求めたもの
利点:対象とする集団のデータや平均値と同じ単位になっている.
欠点:あくまでも平方根を用いて求めているので注意する点がある
(分散と標準偏差は線形の関係に無い)
nmubiostat2024-0302.png(144702 byte)
提出課題
1:度数分布表から求めた平均値と個票データから求めた平均は最大どの程度異なるのか.「量的変数の度数分布表」で示した血圧の度数分布表を用いた場合最大どの程度異なるのか求めよ(±〇mmHg の○の数値のみ記せ)
2:平均値が中央値よりも大きくなる集団がある.値の分布はどのようになっているか簡潔に説明せよ

第03回 推測統計(1)点推定(平均と分散)

(教科書2章1)
偏った推定はよろしくない(あたらないから)
特に,計算の過程で偏ってしまうとかなりよろしくない

推定することについて

記述統計では,対象とする集団そのものの可視化が目的
推測統計では,対象とする集団は全体の中の一部(サンプル)という捉え方で,サンプルから全体像を推し測ることを目的
世の中で全てを把握するというのはかなり難しい

国勢調査

日本全国に住んでいられる方を対象にした静態調査
かなりコストをかけているが,それでも100%の回収率は難しい
<参考>
令和2年国勢調査の概要(総務省統計局)
https://www.stat.go.jp/data/kokusei/2020/gaiyou.html
2020年国勢調査の回答状況における都市-農村格差(*山本 涼子, 埴淵 知哉, 山内 昌和 2021年度日本地理学会春季学術大会要旨集)
https://www.jstage.jst.go.jp/article/ajg/2021s/0/2021s_30/_article/-char/ja/

点推定はあたらない

針の穴に糸をとおすような話

記号について

推定の話になると記号の取り扱いで混乱するのでここで整理しておきます.
分かりやすさを優先して整理したので,皆さんの使っている教科書などの表記は<参考>の論文を確認し読み替えください
μ・・・集団全体(母集団)の算術平均=母平均
σ^2・・・集団全体(母集団)の分散=母分散
σ・・・集団全体(母集団)の標準偏差=母標準偏差

xbar・・・集団の一部(標本)の算術平均=標本平均=母平均の不偏推定量
s^2・・・集団の一部(標本)より求めた母集団の分散の推定量=不偏分散(母分散の不偏推定量)
s・・・集団の一部(標本)より求めた不偏分散よりもとめた標準偏差=母標準偏差の推定量
medbbstat2023-0302.png(435647 byte)

参考
統計学テキストの「分散」の表記に関する調査(札幌学院大学総合研究所紀要 巻 1, p. 1-10, 発行日 2014-03-31)
https://sgul.repo.nii.ac.jp/records/1807

母集団と標本

母集団

対象としている集団の全体のこと
無限母集団と有限母集団がある

標本

対象としている集団の一部
偏ってしまうことに注意
例)森で取れた昆虫の標本を作成する際、どうしても森全体の昆虫の分布から偏ってしまう

取り扱う標本について

母集団は20000人の収縮期血圧データ(整数)

母集団のヒストグラム

medbbstat2022-0207.png(5259 byte)
その集団の一部を抽出したものが標本
<注意>上記のデータはサイコロの目が均等にでるのと同様に以下のように収縮期血圧データは110から140まで均等に出現しています.
実際にある集団に対して収縮期血圧を測定するとその血圧データの分布はそのような形になりません
諸々の事情(説明を理解しやすく)を含めて設定したのですが実際とは異なる振る舞いをしているであろうことだけ承知しておいてください.
medbbstat2022-0208.png(122886 byte)
日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)(https://mhlw-grants.niph.go.jp/project/23935)を加工して作成

<参考>日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)
https://mhlw-grants.niph.go.jp/project/23935
の平成24年度~26年度 総合研究報告書のP108図1の部分を取り出して加工したものが上記になります
https://mhlw-grants.niph.go.jp/system/files/2014/143031/201412017B/201412017B0006.pdf

母平均の点推定

得られた標本より求めた平均をそのまま母集団の推定値とする
例題3-1)
以下の標本より母集団の平均値(母平均)を推定せよ
ocrotstat2023-0501.png(3372 byte)
利点
計算が容易
平均値の場合,計算式が母集団全体の値を求める時と標本から推定する時と同じで良い
欠点
必ずしも推定値が実際と一致するわけではない・・・むしろ外れて当然
サンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム
medbbstat2022-0202.png(96791 byte)
ピッタシ一致するのはサンプルサイズ10の時で1.1%(98.9%はハズレ)
推定の精度を上げるためには
ohsustat2016-01a.png(206456 byte)
標本数を大きくすればよい・・・測定を繰り返して行いその平均をとると精度は上がる
サンプルサイズを100にした時の(母集団から200の標本が作成できる)のヒストグラム
medbbstat2023-0301.png(103401 byte)
精度は上がるものの,ピッタシ一致する確率も上がるとは限らない
例題3-2
結局一つの値で示す点推定はなかなかピッタシ一致しない.ならば幅を持たせた区間推定は最大何パーセントまであてることが可能か?

母分散の点推定

母分散の推定は一味違う
例題3-3)
例題3-1)のデータと例題3-1)で求めた母平均の推定値との偏差を求め,偏差和(全て足し合わすこと)を求めよ.そして偏差平方和も求めよ
例題3-1)のデータと私だけが知っている母平均(125.0)との偏差を求め,偏差和を求めよ.そして偏差平方和も求め,それぞれ比較せよ

標本の平均を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

medbbstat2022-0203.png(135831 byte)
低めの値が多くなる傾向で偏っている.

母集団の平均(本来知る由もない)を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

medbbstat2022-0204.png(137439 byte)
偏った推定にならないものの,本来知る由もない母平均を使えるわけがない(そもそも母数知っているなら推定は不要でしょう)

不偏分散

標本の平均を用いて母分散の推定を行う.
母平均と標本平均は(ほぼ)異なるので,母平均と標本平均の差も考慮して分散を求めたもの
(無論母平均は分からないが母平均と標本平均の差を考慮している)
s^2=Σ(Xi-Xbar)^2/(n-1)
nで除するよりn-1で除したほうが,値が大きくなるのは当然なので,低めの値が出るのなら少し分母を小さくした方が大きくなるのは理解できるが(ケーキを3人で分けるのか4人で分けるのか)なぜ1引くだけ??となると思います
medbbstat2022-0205.png(146106 byte)
<参考> 不偏分散は何故nではなく(n-1)で除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#VAR

例題3-4
例題3-1)のデータより母集団全体の平均値および分散と標準偏差の推定値を求めよ

不偏分散より求めた標準偏差は不偏推定量なのだろうか?

上記の不偏分散のヒストグラムを標準偏差にして作成したもの
medbbstat2023-b05.png(160341 byte)
<参考>不偏分散の正の平方根は不偏標準偏差でよろしいのか(よろしくない)(Medbb's blog)
https://medbb.hatenablog.com/entry/2024/01/09/232914

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

課題のフォロー

標本の平均との偏差より求めた偏差平方和が一番小さくなる話(故に分散の値も一番小さくなる)
nmuhlthstat1_2024-0402.png(306611 byte)
nmuhlthstat1_2024-0403.png(210072 byte)

第04回 推測統計(2)区間推定(正規分布)

【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。
(教科書2章1,2,3)

母集団の平均値の区間推定に向けて点推定により分かったこと

1)母集団の平均値の点推定値はほぼ一致しない(あたらない)
2)母集団の平均値の点推定値は標本数(サンプルサイズ)が大きいほど母集団の平均との外れ方が小さくなる
3)母集団の平均値を区間で推定する際に基準となる値は,標本から求めた点推定値しか見当たらない
4)母集団の平均値の区間推定では点推定と異なり100%一致させることが可能である

追加して

5)母集団の分散の点推定値は標本数(サンプルサイズ)が大きいほど母集団の分散との外れ方が小さくなる
nmuhlthstat1_2024-0401.png(113744 byte)

母集団の平均値の区間推定の考え方

区間を推定するにあたっての基準を点推定値を基準とし,区間を推定するにあたってどのような確率で標本方求めた平均値が出現するのか仮定したうえで行う
この授業回では出現する確率の分布に正規分布を用いる

正規分布

偶然誤差の分布と呼ばれる(精度の善し悪し→偶然誤差大きいか小さいか)
精度を向上させるには測定回数を増やしその平均をとれば良い(誤差は小さくなる)

標準正規分布

平均値が0標準偏差=1(分散も1)になるように値を変換したもの
それをZ値という・・・標準正規分布表の行と列から求める値の事
偏差値は平均値を50、標準偏差=10になるように値を変換したもの
それを偏差値という
例題4-1
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.その時のZ値および偏差値を求めよ
標準正規分布表
正規分布を平均値が0標準偏差=1(分散も1)になるように値を変換したもの
それをZ値という・・・標準正規分布表の行と列から求める値の事
kuswepi2021-01.png(339177 byte)
標準正規分布表のPDF版はコチラから
例題4-2
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.点数の分布が正規分布に従うと仮定して受験者が10000人だった場合上位何番目に相当するか求めよ

中心極限定理

サンプル数が多ければその標本の平均の分布は正規分布になる
 →正しく測定されているのであれば偶然誤差の発生は正規分布に従う
 →測定回数を増やせば増やすほど

注) 普段の実験などでは,数回測定を行いその平均値を結果とするだけ(のはずなので)ピンとこない
以下は100面体のサイコロを作り1回試行した値を結果とし1万回行ったものから,試行回数を2回,3回と増やしその平均値を結果としたヒストグラムの変化を示したものである

標準誤差

・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
ここでは,なぜ√nになるのか説明しないが,少なくともサンプルサイズが大きいほど標本平均のバラツキ具合が小さくなっていくことは理解できると思う
どうしても という方は以下のリンクご覧ください.
<参考>標準誤差SEはなぜ標準偏差σを√nで除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#SE

平均値の区間推定のイメージ

nmuhlthstat1_2024-0501.png(335658 byte)
medbbstat2022-0212.png(178634 byte)

標本を基に母集団の平均(母平均)を95%信頼区間で求める

ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=18点であることがわかっている.
受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ
medbbstat2023-0401.png(429461 byte)
例題4-3
全国で8000人を対象に模試を実施した.本学(115人)の平均値は424点,不偏分散より求めた標準偏差は20点だった.
全国の模試の平均点を本学の点を元に95%信頼区間で推定せよ

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

第05回 推測統計(3)区間推定(t分布)

【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。
(教科書3章2標本平均の理論分布と標準誤差(SE),教科書4章1正規分布とt分布の違い,2)
例題5-1
以下のデータは20000人の血圧データからサンプルサイズ16で抽出したグループ(20)よりそれぞれ母平均の区間推定を行ったものである
標準正規分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ
nmubiostat2025-0501.png(54338 byte)
個票データは以下からダウンロード可能です
nmubiostat2025-0501utf8.csv
<参考>
ohsustat2020-0108.png(321674 byte)

t分布による区間推定

母集団の平均値を推定するにおいて,標準正規分布を使うと上手くいかないケースがある・・・特に標本数が少ないと
困っていたゴセットさんが標本数によって平均値の出現する確率が変化する分布を示しました.
諸々の理由でt分布と呼ばれています.
<参考> 酒井 弘憲,ギネスビールと統計家ペンネーム スチューデント,ファルマシア51巻12号,2015
https://www.jstage.jst.go.jp/article/faruawpsj/51/12/51_1168/_article/-char/ja

t分布

t分布は標準正規分布と同様に,標本より求めた母標準偏差の推定値(不偏分散に基づく標準偏差)を用いるが,標本の自由度(サンプルサイズより求める)によって変化する.
サンプルサイズが大きくなるとt分布は正規分布に近似されていく.
nmuhims2022-01.png(169858 byte)
t分布のPDF版はコチラから

「自由度」νが出てきますが,以下考え方

標本の中で自由に振る舞うことが許されている値の数
例えば標本から統計量を求めたとき,母数の推定値とするなど確定すると自由に振る舞えない値が出てくる(つじつま合わせ)
t分布は抽出した標本数を基にしたものなので,正規分布のように一義的なものでは無く,標本数(自由度)によって確率分布が変わる
統計の話をするときに「t」という話が良く出てくるわけですが,正規分布との関係は良く整理しておいてください
なお大文字の「T」とみると某ポイントカードを思い浮かべる方が多いのかな(今は別のアルファベットになりましたが)
関西において「T」は「浪速の轟砲」を指すのでご注意ください

例題5-2
例題5-1のデータを用いてt分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ
例題5-1の結果と5-2の結果を比較せよ
nmubiostat2025-0502.png(55414 byte)

例題5-3
5-1のデータを用いてt分布を用いて不偏分散ではなく標本自身の分散を用いて95%信頼区間で推定し,し,私しか知らない母平均と比較が含まれているか確認せよ
nmubiostat2025-0503.png(73308 byte)

例題5-4 自由度が∞の時のt分布の95%信頼区間は正規分布と同じであるが自由度νが13の時,正規分布の何パーセント信頼区間に相当するのか?

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

課題のフォロー

tの由来

t検定(調査・統計用語集 日経リサーチ)
https://service.nikkei-r.co.jp/glossary/t-test

第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定

【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。
【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
(教科書7章1母比率の信頼区間の推定,3章検定の原理)

比と率と割合

疫学分野は集団の数を数える(頻度)ことがベースとなる分野
無論比と率と割合は頻度以外のものでも使っている

割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比
変化を表す指標
死亡率
ある集団において期間中に罹患した人数をその時間で割る

二項分布

ある事象が起こる確率が既知の時,試行回数に対して出現度数別の確率を求めたもの
出現度数r=試行回数n×事象の起こる確率p
n回施行すると出現度数rは期待値になることが期待されるが,期待以外の度数になることもある(むしろ当たらない方が多いのでは?)
PrnCr×pr×(1-p)n-r
P(r)=nCr*p^r*(1-p)^(n-r)
例題6-1
2/3の確率でタコが入っているたこ・ラジオ焼きセットがあったとする(タコの入手が困難なので不足を牛スジ肉で代用している)
12個入りのたこ・ラジオ焼きセットを買った場合たこ入りたこ焼きが10個以上になる確率を求めよ
nmubiostat2024-0501.png(253039 byte)
nmubiostat2024-0502.png(102653 byte)

<参考>
たこ焼きのはじまり(大阪たこ焼マーケット)
https://takoyakimarket.com/history.html

例題6-1では10個以上(10,11,12個)の確率を累積したもので累積確率と呼ばれます.
例題6-2
例題6-1の計算結果を用いて95%信頼区間を求めよ

二項分布と正規分布

二項分布のnが大きければ正規分布に近似する(μ=np σ^2=np(1-p))
nmubiostat2024-0503.png(223051 byte)
nmubiostat2024-0504.png(117802 byte)

μ=np

σ^2=np(1-p)

<参考>
二項分布と母比率の区間推定【中学の数学からはじめる統計検定2級講座第10回】(とけたろうブログ)
https://toketarou.com/binomial/

例題6-3
船員保険加入者の特定健康診査の対象者と受診者はそれぞれ42903人,22413人だった.
正規分布を用いて全国の特定健康診査の受診率を95%信頼区間で推定せよ.

<参考>
2022年度 特定健康診査・特定保健指導の実施状況(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/newpage_00045.html
第2期奈良県医療費適正化計画の実績に関する評価(奈良県)
https://www.pref.nara.jp/secure/224873/第2期奈良県医療費適正化計画の実績に関する評価.pdf
奈良県のすがた2024-グラフと解説で見る統計ガイド-(奈良県政策推進課)
https://www.pref.nara.jp/26049.htm
https://www.pref.nara.jp/dd.aspx?moduleid=19736&pfromid=4

仮説検定

仮説検定はなぜ必要なのだろうか?

その仮説が科学に基づいたものであることを統計手法を用いて証明したいから
例題6-4
科学的に証明されたものは100%正しいと言ってよいのだろうか?

検定(有意差検定)と推定の違い

推定
orcstat2020-0602.png(11589 byte)
検定
orcstat2020-0603.png(12754 byte)

科学と統計(一部再掲)

初回の講義をを思い出していただいたら良いかなと思いますが,以下抜粋
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)より
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。

実証性

「考えられた仮説」が無いことには始まらない→仮説検証型
それでは「考えられていない仮説」とは?
→まだ十分に確固たる仮説として成立していない仮説
仮説検証型と仮説探索型
仮説探索型とは「考えられた仮説」が存在せず(関心ある事象など),得られた結果は「考えられた仮説」になる可能性を有するが,その段階では「考えられたと言えない仮説」

再現性

仮説を実証するために得られたデータから複数回,同一の検証結果になること
例題6-4
再現性は本来「未来永劫」だと思うが,なぜ「複数回」同一の検証結果になることとしているのか

判定基準

「同一の結果」が100%の確率で出現しないことを示しておく必要が出てくる
→そうなると,確率に基づく基準で判定しないことには,再現性を満たすことが出来ない
故に仮説検定は確率に基づいて行う

「確率」⇔「実空間での違い」

区間推定では,ある確率分布による確率(例えば95%)を統計指標(標準正規分布ならz値)に置き換えてから,実空間での対象とする事柄に置き換えて信頼区間を求めている
仮説検定では,実空間で対象とする事柄の違いを求めてから,確率分布における統計指標に置き換えて確率を求めている
違いを評価するために効果量(どの程度の違いを違うと判定するか)で決定しても,その確率は変わってしまう→区間推定で経験してみましょう
例題6-5
ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=10点であることがわかっている.
受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ(以前の授業での説明用の問題の数値を変えたもの)

区間推定と仮説検定の相反する部分

区間推定は区間内に求めているものがある(含まれている ことを祈っている)
仮説検定は区間外に求めているものがある(含まれていないことを祈っている)

背理法

命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法
違いがあることを証明するにあたって「違いが無いことを」を証明できないことを根拠にする
仮説検定を背理法に基づいて行う理由
仮説検定を行う動機は,これまでの世界の科学的な常識とは異なる新たな知見を証明することにある
これまでの世界の科学的な常識は繰り返し用いられてきた.
新たな知見はこれまでの科学的な常識を否定しなくてはならない
つまり,従来の手技,薬剤と同じように新しい手技,薬剤を用いた時に再現性がみられなかったら,それは従来の常識を覆すものであると判定して証明する論法
無論,前提として「考えられた仮説があること」(ぼくのかんがえたさいきょうの説だとダメ)

例題6-6
「ぼくのかんがえたさいきょうの説」に基づき仮説検定を行い,その説が従来の常識を覆すものと仮説検定の結果判定された場合,なにがいけないのか述べよ

例題6-7
「考えられた仮説があること」に基づき仮説検定を行い,その説が従来の常識と変わらないものと仮説検定の結果判定された場合,不都合なことがあるのか述べよ

統計的有意差と臨床的有意差

得られたデータに基づき計算した確率が判定基準を下回った時に統計的有意差があると言います.
知見は社会実装することで人類に貢献できますが,医療現場においては臨床的に意味があるとされる量を基準とする臨床的有意差が結果として求められます
無論社会で役立てていく知見としては,統計的有意差よりも臨床的有意差が重要になりますが,「科学的」な観点からは前者が支配的になります.
確率の違いを量で示すとき,その量はサンプルサイズにより変化します.故に臨床的有意差に基づきサンプルサイズを決定することで二つの違いを解消できます
例えば臨床的有意差が統計的有意差よりも大きい場合は再現性については確認できたものの臨床的な観点から確認はできません.統計科学的に良いが,医科学的には?という結果になります
一般にはサンプルサイズが大きいほど,精度の高い結果が得られるので良いという感覚のはすですが,それは区間推定の話で仮説検定において効果量の差を検証する場合は少し状況が異なります
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

授業フォロー

標準偏差と標準誤差

度数の話を確率の世界に変換する時点で,度数の時の標準偏差は確率の世界では標準誤差となります.度数→確率は平均を求めていることになるので
nmubiostat2025-0601.png(215897 byte)

第07回 推測統計(5)パラメトリック検定(t検定)

(教科書4章1,5章1,教科書8章1,3,10章1Q7)
【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。

パラメトリックとノンパラメトリック

教科書P44

分布の形状に依存する(量的)統計量(平均値 標準偏差)
分布の形状に依存しない(質的)統計量(最頻値 中央値 四分位範囲,偏差 パーセント値)
nmuhlthstat1_2025-0201.png(401678 byte)

教科書P4-7,204

パラメトリック検定・・・計測値の分布が何かしらの確率分布であることを仮定
正規分布であることの確認
Q-Qプロットは縦軸が期待値 横軸は実際の値
期待値はデータを順序尺度の取り扱いをしてその順位を確率に置き換えて、値を確率分布(正規分布)に代入することで期待値を算出する。
P11複雑な調査データTGを用いて
nmubiostat2017-0901.png(44808 byte)
<参考>Excelによる正規確率プロットの作り方(統計WEB SSRI)
https://bellcurve.jp/statistics/blog/15362.html
例題7-1
以下の標本よりQ-Qプロットを作成するための表を完成させよ
ocrotstat2023-0501.png(3372 byte)
実際の血圧 期待値
112
112
113
117
119
124
125
126
127
135
例題の回答をグラフ化すると以下になります
nmubiostat2025-0701.png(137234 byte)

仮説

以降は「新たな知見」に対する話で仮説検定を用いるケースが重要になりますので,これまでの常識を覆す仮説を証明するパターンになります
新たな知見を見いださない=通常通り(いつもと一緒)の仮説の証明にも用いられる 例えば等分散の検定(F検定)・・・標本Aも標本Bも同じように抽出したから分散も同じだろうという仮説にも意味がある(ことになる)

仮説検定では判断基準を違いそのものに閾値を設けるのではなく確率で示してそれを有意水準として示す

差がある仮説の判定(有意差検定)

事象としては「同一の結果が得られる」「同一の結果が得られない」の二つにいずれかになります.
同一の結果が得られる仮説を帰無仮説(これまでと違いが無い仮説)H0,同一の結果が得られない仮説を対立仮説(これまでと違いがある仮説)H1と示します.有意水準は対立仮説H1の確率を示します
有意水準は通例5%とされることが多く,両側検定(効果量に違いがあるのか無いか)と片側検定(違いがが正の方向のものなのか,負の方向のものなのか)の二種類がある
背理法の考え方に基づく論理で証明.もともと証明したい仮説(差がある)を偽であるとして,矛盾を導く出すことで判定する方法
現在はコンピュータにより確率を直接求めることは可能ですし,まどろっこしい流れに映りますが,違い(差)を直接判断しているのではなく「同一の結果が得られる」確率に基づき判定基準を定めているところが科学として重要であるから故と捉えています.
ですので確率そのものは,判定のためのものであって求めた値(統計量や確率)そのものに重きを置く必要はありません.効果量そのものに重きをおく方が知見の社会実装の観点から重要になります

仮説検定(有意差検定 両側検定)のフォーマット例

手順1 帰無仮説,対立仮説をたてる
帰無仮説H:μ=150 対立仮説H:μ≠150
手順2 母集団が従うと見做す確率分布を定め,有意水準を決める
(例えば)正規分布に従うと見做し,有意水準両側5%とする
手順3 今回取得したデータをもとに,母集団が従うと見做す確率分布における統計量を求める

帰無仮説H0がある集団の収縮期血圧μ=150mmhgとしたときに,これまでにない高血圧防止体操を行った集団から得られたデータ(サンプルサイズn=36 標本平均xbar=147.3 不偏分散s^2=81)で検定を行う

1)手順1 帰無仮説,対立仮説をたてる
帰無仮説H:μ=150 対立仮説H:μ≠150
手順2 母集団が従うと見做す確率分布を定め,有意水準を決める
正規分布に従うと見做し,有意水準両側5%とする
手順3 今回取得したデータをもとに,母集団が従うと見做す確率分布における統計量を求める
-2.7異なる,これを(標準正規分布の)検定統計量に変換すると-1.8
手順4
検定統計量を用いて有意水準との比較,今回の標本が棄却域にあるのか否か(受容域なのか)判定する.
1)(ケースX) |z|=1.8 p=0.0359×2(両側検定なので2倍)>0.05
帰無仮説を棄却できないので判定を保留する
2)(ケース1)有意水準よりも小さい場合 |z|=2.96 p=0.015×2(両側検定なので2倍)<0.05
帰無仮説を棄却し対立仮説を採択する 有意差がある
3)(ケース2)有意水準よりも大きい場合 |z|=1.45 p=0.0735×2(両側検定なので2倍)>0.05
帰無仮説を棄却できないので判定を保留する
注)標準正規分布表の場合確率まで求めることが可能だが,t分布表は統計量から確率を求めることはできないので統計量で比較する
例題7-2 有意差検定において背理法を使わなければならない理由を考えよ(何故,違いがあるという仮説を直接証明しないのか?)

第7回の授業ここまで(授業に関する内容での説明に20分程度使ったため)以降第8回

1標本(1群)t検定

世の中(母集団)の基準値など,既に明らかになっている事柄と比較することで世の中の一般的な状況と対象とする集団が異なっていることを明らかにすることを目的
例題7-3
物騒な話ですが,ある自動販売機に偽造通貨が使われているのではないかという話が私のところに舞い込んできた.
話を聞くともっともらしい仮説が既にあるので検証することにした.
そこで,自販機に入っていた硬貨10円玉10枚を用いてこの仮説について仮説検定を行う
10円玉の硬貨μ=4.50gと比較して異なることが期待される検定になります
ここでは,とりあえず標準正規分布で検定してみましょう(よくないけど)
計算した結果ですが
標本の平均は4.42g
不偏分散より求めた標準偏差は0.119
をお使いください.
10円玉ID 重量(g)
1 4.55
2 4.53
3 4.23
4 4.50
5 4.51
6 4.31
7 4.38
8 4.54
9 4.35
10 4.30

例題7-4
例題7-3の結果を先方にお伝えしたところ,適切な統計手法を用いていないとご指摘を受けました.
そこで改めてt分布を用いて検定を行ってください

1標本(関連2群)t検定

関連する2群・・・一つの対象集団を2回測定して標本を二つ作る.それぞれの標本から同一IDを確定できるのでその前後の差をとって検定する
標本は対象集団のことを指すので1標本から2回データを抽出しているので,そのように書いた方が適切にも思うが世の中で2標本とするケースが多いので当初そのような表記にしていました.よく考えて昨年度と同様な一標本の表記に戻しています
例題7-5
新開発のシューズを2種類開発した.それぞれ同一被験者に従来型と新型を履いて5km走のタイムを計測し比較を行った.
有意水準5%両側検定を行い効果があるのか検証せよ
orcstat2020-0601.png(44900 byte)

<<以下の部分は中間試験の範囲外とします>>

2標本(独立2群)t検定

関連の無い2群・・・二つの条件が異なる集団を1回測定し標本を二つ作る.それぞれの標本が同じ分散であることが前提となる(等分散・・証明できない場合でも行える手法はある(というより最初からその手法使ったらよいという考え方もある)) 分散も合成する必要が出てくる
例題7-6
バセドウ患者12人に協力いただきそれぞれ6人ずつ従来の薬剤を当投与した群と新薬を投与した群に分けて脈拍数を測定した.
新薬に効果があるのか検証せよ
ID 対照群(従来群) 比較群(新薬群)
1 98 86
2 88 73
3 100 95
4 96 92
5 107 99
6 114 116

<<以上の部分まで中間試験の範囲外とします>>

検定で注意する点

両側検定と片側検定の注意点

教科書P207
一緒な有意水準で比較した場合 片側は棄却域が存在しないことと,他方は棄却域が大きくなってしまう → 帰無仮説が棄却されやすくなる状況

有意水準は常に0.05?

教科書P208
有意差は有意水準が一緒でもn=が大きくなると少ない差でも優位と判定されてしまう.
統計的有意差≠臨床的有意差
効果量を目的としているわけで,統計的な差(違い)が現実社会の中において意味がある差なのか

各群サンプルサイズ10の場合で検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
各群サンプルサイズ1000の場合検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
 nmubiostat2016-0901.png(37095 byte)
 

αエラー βエラー

教科書P215
第一種の過誤
(αエラー)・・・誤って差があると判定する確率
αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤
(βエラー)・・・誤って差が無いと判定(=判定保留)する確率
βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1-検出力(Power)=β
検出力=1-β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8~0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.

統計的有意性とp値に関するASA声明

<参考>統計的有意性とP値に関するASA声明(日本計量生物学会)
http://biometrics.gr.jp/news/all/ASA.pdf
以下の内容が指摘されています
1. p値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
2. p値は、調べている仮説が正しい確率を測るものではない
3. 科学的な結論は、p値がある値を超えたかどうかにのみ基づくべきではない
4. 適正な推測のためには、すべてを報告する透明性が必要
5. p値は、効果の大きさや結果の重要性を意味しない
6. p値は、それだけでは仮説に関するエビデンスのよい指標とはならない
例題7-7 特に小標本の場合仮説検定においてt分布(t検定)ではなく標準正規分布を用いた検定(Z検定)を行った場合どのような過誤が起こりやすくなるか

講義後記

例題7-5回答例

nmubiostat2025-0702.png(267988 byte)
nmubiostat2025-0703.png(257016 byte)

第09回 中間まとめ(小テスト)

テストの採点終わりました.30点中13点以下(45%未満)の方についてはどのようにしたらよいのか,皆さんのご意見お聞かせください

第08+2回 推測統計(6)パラメトリック検定(ANOVA,有意確率補正法)

教科書5章3,8章1-2,第10章Q7

多群の比較の話

F分布

二群の分散に関する確率分布
分散の比・・・F値(FはフィッシャーのF)
nmubiostat2025-0801.png(241744 byte)
例題8-1
なぜF分布図においての自由度df1=df2の場合α=0.5になるのか簡潔に説明せよ

F分布に従う確率変数の逆数

自由度(k1,k2)を入れ替えた分布に従う
例) F0.05(4,9)=6.00
1/F0.05(4,9)=F0.95(9,4)=0.1667=1/6.00)
nmubiostat202108-01.png(951165 byte)

等分散の検定(F検定)(P94)

等分散性の検定・・・分散比を求めてF値より判定
「2群の分散は異なるとは言えない」・・・帰無仮説を棄却できない(保留)
 

一元配置分散分析

3つ以上の標本 群間分散と群内分散の分散比
群内分散とは3つ以上の標本を一つの群としたときに求める分散
群間分散とはそのぞれの標本をそれぞれの群としたときの,それぞれの平均の分散
群間分散と群内分散の比を求めたときに,大きな値(群間分散が群内分散よりも大きい)のであれば群の違いによる影響(つまり同じ母集団から抽出したとみなせない)があると判定する考え方

群間分散

群別の平均と群別の平均から求める.自由度は群数k-1
(平均値のバラツキ具合)

群内分散

全て同じ群に属するとして標本の値そのものを使って求める.自由度は総標本数n-群数k
(各々の群内における値のバラツキ具合)
群間のバラツキ具合と群内のバラツキ具合が異なるということは群によって値が異なっているということを示すことが出来る.
色々整理すると
群間で平均値を比較した時にバラツキが発生しているならば,それはそれぞれの群の平均値はは同じ母集団から抽出したものとならない.
しかしながら群内でも発生するバラツキがあるわけでが,それは偶然発生する誤差として考える
ohsustat2016-01a.png(206456 byte)
故に帰無仮説は全ての群の平均は等しい(同じ母集団から抽出した標本)
例題8-2-1
A群 8,12,16
B群 8,14,20
C群 8,16,20,28
保留 群による違いは見られなかった
例題8-2-2
A群 10,12,14
B群 12,14,16
C群 15,17,19,21
帰無仮説を棄却 群による違いはある
例題8-2-3
A群 11,12,13
B群 13,14,15
C群 16.5,17.5,18.5,19.5
帰無仮説を棄却 群による違いはある
左から例題8-2-1,2,3の箱ひげ図
nmubiostat2023-0901.png(31463 byte)

多重検定

ポイントとしては、それぞれの検定が独立した仮説にもとづいたものと考えて良いか否か。良いのであれば多重検定にならない
一連のものであれば対立仮説を考えたときに有意水準が5%と言いながら5%になっていないのでは?
多重に検定することでどれかあたれば帰無仮説は棄却できるので例えば3群総当たりだと有意水準0.05で多重検定(6通り)すると有意水準が0.265になってしまう。(からよくない)

有意確率補正法

Bonferroniの場合は6通り検定するのであれば、一検定あたりの有意水準だと0.05/6=0.0083となる。全体では1-(1-0.00833)^6=1-0.95103=0.0490
Sidak補正の場合は同様に1-(1-0.05)^(1/6)=0.008512 1-(1-0.008512)^6=1-0.95=0.0500
多群になるほど検定あたりの有意水準が下がる→差が出にくい

多重比較法

パラメトリック法
Tukey法・・・各ペアに対する平均値の差の検定
Dunnett検定・・・一つの対象群との対比

ノンパラメトリック法
Dunn法
例題8-3
曜日別に検査の管理用資料を測定した。
曜日別に検査の管理用資料を測定した。それぞれ総当たりで二標本t検定を行った。有意確率をBonferroni補正法を用いて有意水準5%で判定し有意な組み合わせをすべて記せ
nmubiostat2023-0904.png(3229 byte)

講義後記

例題回答例

例題8-2-1
分散比0.74
F(2,7:0.05)=4.74
判定保留 群による違いは見られなかった

例題8-2-2
分散比6.42
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある

例題8-2-3
分散比25.6
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある

第10+1回 推測統計(7)ノンパラメトリック検定,カイ二乗検定

教科書4章3,教科書5章4,教科書7章1,2

質的変量の性質(順序,名義)を用いた検定

(関連2群ノンパラメトリック)一標本Wilcoxon検定

2群の差が無いと見做せるか否かを,質的変量の性質を用いて検定する
正と負の差分それぞれより求めた順位和に偏りがあると,2群の差が無いと言えないという考え方
検定統計量Tは正と負それぞれの順位和を求め最小の値とする
nmubiostat2025-1001.png(344824 byte)
例題10-1
WilcoxonT検定表でN=7の時に有意水準α=0.01(両側)未満の統計量Tが存在していないことを証明せよ

例題10-2
例題7-5のランニングシューズ2種類についてそれぞれWilcoxonT検定(α=0.05,0.01)を行い違いがみられるか検証せよ

(独立2群ノンパラメトリック)二標本Mann-Whitny検定

2群の違いを,それぞれの値を比較する群の中でどのような順位に位置するのか求め順位和に違いが無いと見做せるか否かあることを利用
例題10-3
以下の非妊娠群と妊娠群のホルモン値について妊娠による影響があるか二標本Mann-Whitny検定(α=0.05,0.01)をせよ
非妊娠群 妊娠群
4.0 4.7
3.1 3.8
2.2 3.5
1.4 1.3
1.2 1.1

カイ二乗検定

計数値(度数)に関する検定

計量値と計数値

計量値・・・量を測定
計数値・・・頻度を測定(名義尺度)

カイ二乗分布

教科書P142
χ2乗分布・・・偏差平方和に関する確率分布
χ=ΣZ
平均からのズレの平方をとったものを足し合わせていく→偏差平方和
標準正規分布に従う独立した確率変数が1つの場合
χ=Z
<参考>独立した確率変数が二つの場合
χ=Z+Z

カイ二乗分布表(教科書P273)

t分布と同じく自由度により確率分布は変化する
カイ二乗分布(ν=1)の時のそれぞれの上側確率に相当する正規分布の確率(両側5%(片側2.5%ずつ)は全て上側に集約されてしまう
nmubiostat2016-1101.png(14151 byte)
χ=((X-μ)/σ)
χ0.05=((1.96-0)/1)
例)標準正規分布で有意水準両側5%の場合の境界値はz=1.96.カイ二乗分布表より優位水準上側5%の時のカイ二乗値=3.84

ピアソンのカイ二乗

カイ二乗分布の話(X-μ)を(実際に出現した度数-出現が期待される度数(期待値))に置き換え
分散で除することで分子の差分を標準正規分布のN(0,1)にしていたものを,期待値で除して求めたものである.
(ポアソン分布であるとすると平均値=期待値=分散)
カイ二乗値=Σ(観察度数-期待値)/期待値

F分布とカイ二乗分布の関係

それぞれの独立している群のカイ二乗値の比=分散の比・・・F値
U,Kはそれぞれカイ二乗分布に従う(自由度k) F(k1,k2)=U/k1/V/k2
F(ν,∞)=χ^2(ν)/ν/χ^2(∞)/∞
     =χ^2(ν)/ν
χ^2(ν)=ν×F(ν,∞)
nmubiostat2017-1201.png(13289 byte)

検定

適合度の検定

P140例題28で説明
1行n列
事象の起こる確率に基づく頻度(=n×p)期待値(度数))と実際に観測された度数(観察度数)の差異について検定.帰無仮説(測定した分布は想定されている分布と等しい)H:P=(1/6,1/6,1/6,1/6,1/6,1/6)・・・サイコロの場合

独立性の検定

m行n列
こちらはそれぞれが独立しているか(関係があるか無いか)を検定
考え方は一緒
事象の起こる確率は実際に観測された度数を基に算出して全体の度数を乗じることで期待値(度数)とする.

Fisherの直接確率法

期待値が低い場合、.wilcoxonの統計量T理論分布と同様だが計算大変
故に教科書では2×2表以外出てこない(考え方は一緒)
例えばP146例題より直接確率を求めたものが以下
nmubiostat2022-0701.png(66291 byte)
例題10-4
以下のサイコロについて通常のサイコロと異なる可能性である可能性が高いので検定を行った
サイコロ
観察度数 8 7 4 10 14 11

例題10-5
以下の薬剤と尿糖の関係について検定を行ってください
観察度数 薬剤A 薬剤B 薬剤C
尿糖+ 14 22 44
尿糖- 28 40 52

講義後記

例題回答例

例題10-2
ランニングシューズA T=7
有意水準5%で差がある
ランニングシューズB T=9
有意水準5%で差がみられない(判定保留)

例題10-3
検定投棄料U=11
帰無仮説を棄却できない(判定保留)

例題10-4
検定統計量χ^2=6.67
帰無仮説を棄却できない(判定保留)

例題10-5
検定統計量χ^2=2.67
帰無仮説を棄却できない(判定保留)

第11+1回 相対リスク

【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。
この授業では相対リスク=Relative Risk は一般的な用語であり、その算出指標の一つにリスク比(Risk Ratio)があるのですがそれを相対危険としているケースもあり,言葉の整理が出来ていないところでもあります。

検定の話はここまでになります.
ここからは指標の話になっていきますが,検定ではなく95%CI(信頼区間)で,その指標の意味合い(効果があると言えるのか)を確認する格好になります

観察研究における研究法と相対リスク

被験者個人を特定して追跡する形態のものとしては以下の方法がある
nmubiostat2025-1101.png(328054 byte)

コホート研究(Cohort study)

対象に曝露している人々と非曝露群を設定、追跡調査していくスタイル
実空間内では無理だが,データが揃っている場合は回顧的コホート研究という方法も使える。(近年はデータが蓄積されているのでその範囲内で成立するのであれば)
nmubiostat2025-1102.png(332432 byte)

症例対照研究(Case-control study)

ある状態(例えば病気に罹患している)群と、罹患していない群を設定、時間を遡って調査していくスタイル
後ろ向きにしか行えない(前向きだと曝露→疾患の順がおかしくなる)
nmubiostat2025-1103.png(331759 byte)

実験的研究(介入研究)(intervention study)

曝露群(介入群)を研究者が割り付ける → 被験者に対する倫理的配慮が肝要
無作為に割り付けることが出来る場合は交絡因子を制御できる(ことが期待される)
倫理的に考えると非介入群の方が不利益になってしまう可能性が高いので、配慮した研究デザインが求められる
nmubiostat2025-1104.png(336686 byte)

説明用データ
罹患有 罹患無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A~D:指標(頻度以外に罹患率やら有病率・・・)

曝露有群の罹患リスク=A/(A+B)
曝露無群の罹患リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、罹患頻度が低ければA+B≒B C+D≒D
 リスク比≒A/B/C/D=AD/BC

オッズ比

Odds Ratio(OR)
オッズの比

オッズとは

相反する事象の有無についての指標(確率)の比
曝露オッズ
曝露(介入)の有無毎に求めた指標(確率)の比
罹患オッズ
罹患の有無毎に求めた指標(確率)の比

オッズ比とリスク比の関係

曝露オッズの場合

罹患有群の曝露オッズ=A/(A+C)/C/(A+C)=A/C
罹患無群の曝露オッズ=B/(B+D)/D/(B+D)=B/D
オッズ比=A/C/B/D
    =AD/BC

罹患オッズの場合

曝露有群の罹患オッズ=A/(A+B)/B/(A+B)=A/B
曝露無群の罹患オッズ=C/(C+D)/D/(C+D)=C/D
オッズ比=A/B/C/D
    =AD/BC
上記のように罹患の頻度が低ければオッズ比とリスク比の近似値となる

リスク比,オッズ比をp=A/(A+B) q=C/(C+D)で示すと

リスク比=A/(A+B)/C/(C+D)=p/q
オッズ比=A/C/B/D=A/B/C/D=p/(1-p)/q/(1-q)

例題11-1
適切な相対リスクの指標を算出せよ
以下はコホート研究のデータである
不整脈あり 不整脈なし
曝露群 100 1900 2000
非曝露群 50 1950 2000
150 3850 4000
例題11-2
適切な相対リスクの指標を算出せよ
以下は症例対照研究のデータである
不整脈あり 不整脈なし
曝露歴あり 100 65 165
曝露歴なし 100 135 235
200 200 400
例題11-3 コホート研究でそれぞれリスク比とオッズ比を求めた場合,それぞれの値が乖離する場合がある.どのような状況の時に起こるのか簡潔に説明せよ

例題11-4 症例対照研究ではリスク比とオッズ比は乖離する.どのような理由によるものか簡潔に説明せよ

講義後記

リスクとオッズの近似の度合い

リスクが大きくなるとオッズはリスクから離れていく
nmubiostat2025-1105.png(214031 byte)

リスク比とオッズ比の近似の度合い

比較するリスクが大きいとオッズ比もリスク比から離れていく
nmubiostat2025-1106.png(217306 byte)

第12+1回 ROC解析

(教科書6章1,2,3)
教科書P115-
検査法の診断的有用性を評価する話
ocrotstat2022-0301.png(344953 byte)
疾患あり 疾患なし 指標
検査陽性 真陽性
a
偽陽性
b
陽性的中率
a/(a+b)
検査陰性 偽陰性
c
真陰性
d
陰性的中率
d/(c+d)
指標 感度
a/(a+c)
特異度
d/(b+d)
有病率
(a+c)/(a+b+c+d)

予測値

有病率の影響を受ける
陽性的中率=P(D|陽性)
陰性的中率=P(Dc|陰性)

感度と特異度

感度=P(陽性|D)  疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1-偽陽性率 非疾患群における真陰性の割合
ocrotstat2022-0302.png(394121 byte)
ocrotstat2022-0303.png(266829 byte)

検査法の評価指標

AUC=ROC曲線を描いて算出 検査の分別能

ROC曲線

教科書(P119)
判別度の分析
感度と偽陽性率(1-特異度)を用いて曲線を描く
ocrotstat2022-0304.png(355176 byte)
カーブが左上に行くほど検査特性が優れている.(=AUCが大きくなる)
判断基準は諸々の要素が入るが1,0と0,1の対角線と曲線の交わる部分が目安.あとは検査の目的などによって変わってくる

尤度比

教科書で尤度比としているのは陽性尤度比=感度/偽陽性率
ocrotstat2022-0305.png(364354 byte)
ocrotstat2022-0306.png(368301 byte)
ocrotstat2022-0307.png(364823 byte)
例題12-1
2種類の検査法A,Bを施行したところ以下の結果を得た.
A法のROC曲線を描きAUCを求めよ
疾患群 14.3 15.2 13.8 14.1 13.9 12.6 14.2 14.6 13.1 13.7
非疾患群 13.2 14.1 13.8 13.6 12.9 12.4 12.1 12.3 12.3 12.8
並び変えると以下の通り
疾患群 非疾患群
15.2
14.6
14.3
14.2
14.1 14.1
13.9
13.8 13.8
13.7
13.6
13.2
13.1
12.9
12.8
12.6
12.4
12.3
12.3
12.1

例題12-2
2種類の検査法A,Bを施行したところ以下の結果を得た.
B法のROC曲線を描きAUCを求めよ
AUCを求めどちらの検査が優れているか評価せよ
B法
疾患群 14.3 15.2 13.8 14.1 13.9 12.6 14.2 14.6 13.1 13.7
非疾患群 13.2 14.3 13.8 12.9 14.4 14.4 12.1 15.3 12.3 12.8

カットオフ値

感度・特異度のみを用いたカットオフ値はROC曲線のy=1-xの交点の時の値になる
ROC曲線は交点を求めてから値については別途求める必要があるので,感度・特異度曲線を用いれば簡単に求められる

有病率による調整

疾患群と非疾患群の比による調整

偽陽性,偽陰性の重要性による調整

対象とする疾患によっては偽陰性率を出来るだけ低くする
例題12-3
A法およびB法の感度・特異度曲線を作成し,その結果に基づくカットオフ値を求めよ

講義後記

例題12-1

AUC(A法)0.85

例題12-2

AUC(B法)0.59

例題12-3

カットオフ値(A法)13.7
カットオフ値(B法)13.9

第13+1回 相関係数,回帰分析

【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
【SO-02-03-05】多変量解析の意義を理解している。
(教科書9章1,2,3)

相関

correlative
相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか

因果

cause and effect
原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない

普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)

たばこを吸う-肺がん・・・・相関関係○

コーヒーを飲む-肺がん・・・相関関係○

コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関

交絡因子について

教科書P220-

散布図

X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)
とりあえず図にすると関係が直感的にわかる(場合がある)
nmuhlthstat1202107-02.png(9572 byte)

相関係数

-1から1までの値をとる
Xが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0

X軸で見たときのバラツキ具合とY軸で見たときのバラツキ具合を元に計算してる
バラツキ=散布度・・・分散・・・偏差の二乗の平均
共分散=ある対象のX軸の偏差とY軸の偏差を乗じたものがベース
  
Xの偏差 Yの偏差 乗じた結果
乗じた結果の平均が共分散
共分散はX軸Y軸のバラツキ具合が混ざっているのでそのままの数字だと解釈しにくい→XとYの標準偏差で除する(正規化)→相関係数

平均値で相関係数を求める際にはご注意を

nmucsmed2025-01.png(279223 byte)
nmucsmed2025-02.png(346265 byte)
医の共通科目(分担:研究におけるデータ収集と統計処理について))より

単相関係数の検定

P180-
問13-1 例題7-4のデータより介入前と介入後の相関係数を求めよ(検定も行うこと)

回帰直線

X軸の値とY軸の値を数式(y=ax+b)で示す
直線を引いたときにそれぞれの点からの差(残差)の2乗して足したもの(平方和)が最も小さい時の数式が回帰直線

単回帰分析

教科書P195
回帰係数・・・Y=a+bXのb
決定係数・・・1に近いほど良好なモデル

決定係数

相関係数を二乗したもの
数式によって説明できる割合を示す。(寄与率とも)
高ければ高いほど数式で説明出来る

傾きの推定

傾きの推定値が0を含まないと,その項の変数(独立変数)はy(従属変数)にどのような影響を与えているのか説明できる
推定は計算機に
単回帰分析(t検定と信頼区間)作者: tonagai さん(ke!san)
https://keisan.casio.jp/exec/user/1491997364

重回帰分析

教科書P223
(回帰直線の話を思い出す→単回帰分析)
回帰・・・元に戻る・・・何らか(定理や関係)に基づき戻っていく
変数ごとに有意差検定を行っても他の変数の影響が含まれてしまう
予測モデル式としての話とどのような変数が影響を与えているのか

重回帰分析

Y=a+b1X1+b2x2+・・・ 目的変数・・・Y
説明変数・・・Xi
偏回帰係数・・・bi
標準偏回帰係数 β* 目的変数と説明変数の関係を標準化したときの偏回帰係数・・・
目的変数は量的
説明変数は量的でも質的(0,1)でも
単回帰と同じく最小二乗法で求める
決定係数・・・説明変数を増やすと値は上昇 自由度調整済み決定係数・・・1-(1-R2)(n-1)/(n-k-1) n=標本数 k=独立変数

VIF 分散拡大要因
多重共線性を見つける指標
多重共線性・・・独立変数が他の独立変数と相関がある・・・偏回帰係数の標準誤差増大
VIF=(1-Ri2)-1
Ri2:他の独立変数で重回帰させたときの決定係数
許容度:1-Ri2 目安としてVIFは10以下であること=許容度が0.10を超えていること
分散分析
回帰式による変動と残差(回帰式と実測の差)の変動が異なるのか示している
異なると言えなければその回帰式は統計的に・・・

ロジスティック回帰モデル

目的変数を質的変量で重回帰分析できないのかな?という話
(あり・なし)の結果を確率で

ロジット変換

事象の起こる確率をpとしたときその取るべき値は0~1のいずれか.
nmubiostat202112-01a.png(5255 byte)
nmubiostat202112-01.png(9219 byte)
ロジット関数は,その確率の範囲を-∞~∞に拡張するもので logit(p)=ln(p)-ln(1-p)=ln(p/(1-p))で示される. nmubiostat202112-02a.png(9408 byte)
nmubiostat202112-02.png(7911 byte)

オッズを確率pで示すと
A/C=A/(A+C)/C/(A+C)=p/(1-p)
p=A/(A+C)であるが,その取りうる値は0~1.

pをロジット変換するとln(p)-ln(1-p)=ln(p/(1-p))

ln(p/(1-p))=a+b1X1+b2x2+・・・

exp(b)がオッズ比になる件

ln(p/(1-p))=a+b1x1+b2x2
とした場合
上記は
(p/(1-p))=exp(a+b1x1+b2x2+・・・)
=exp(a)*exp(b1x1)*exp(b2x2)*・・・

exp(b2)が1よりも大きい場合オッズは上昇し,1未満であれば低下する
式を整理すると
exp(b2x2)=(p/(1-p))/exp(a+b1x1+・・・)
となりexp(b2)はオッズ比を示す
問13 以下の分析結果よりどのような因子が影響を受けているのか分析をした,どのような結果なのか示せ
データは以下のとおりである nmubiostat2025-1301.png(294771 byte)
nmubiostat2025-1302.png(226652 byte)
<出典>
非制限公開擬似データの提供(東京大学社会科学研究所附属社会調査・データアーカイブ研究センター)
https://csrda.iss.u-tokyo.ac.jp/infrastructure/urd/

問13-1 重回帰分析
パネル調査(ダミー)のデータより,自身の年収(ZQ47Aの回答を年収に変換)がどのような因子(普段の生活)によって影響を受けるのか分析した
nmubiostat2023-1301.png(50275 byte)

問13-2 ロジスティック回帰分析
パネル調査(ダミー)のデータより,自身の健康状態(ZQ25が1と2を良好と定義)がどのような因子(普段の生活)によって影響を受けるのか分析した
nmubiostat2023-1302.png(46436 byte)