奈良県立医科大学 生物統計学2025
(医学部医学科)
2025年度開講にあたって
https://medbb.net/education/2025init/
なお,例年例題について回答が欲しいという声があるのですが,授業中に示しておりますのであらためて掲載はしておりません.
課題提出の実状より課題の評価を授業後の提出物によるものから変更します(2025年5月16日追記)
課題をオンライン端末をから提出する形態で実施してきましたが,本科目が担っている目標の達成にあたって変更が必要になりました詳細は口頭にてお伝えします.
以下のようにシラバスの課題に関する部分を変更します
《》内は評価するアウトカムのコンピテンス番号になります
変更前
評価方法において■提出課題(20%)《Ⅰ》
(授業毎に提出.教員が示した課題への回答を以て評価する)
■小テスト(30%)《Ⅵ》
■定期試験(50%)《Ⅰ,Ⅱ,Ⅵ》
変更後
評価方法において■提出課題(10%)《Ⅰ》
(5/17以前については授業毎に提出.教員が示した課題への回答を以て評価する)
(5/18以降については授業毎の提出は必要としない.授業内容に関する不明点など自身が能動的に提出する.提出は評価に反映させるのではなく授業に反映させる)
■小テスト(30%)《Ⅵ》
■定期試験(60%)《Ⅰ,Ⅱ,Ⅵ》
(5/18以降における授業の中で教員が示した例題等(授業内容に関するフォローの内容含む)に関係する問題を定期試験で10%分配点する.その結果を以て目標《Ⅰ》に対する評価の一部とする)
授業内容に関する不明点は 「2025年度開講にあたって」のページに用意している「授業に関して困った時,以下からご連絡ください」よりご連絡ください
https://medbb.net/education/2025init/
授業の進め方
授業中は課題について廻りに相談せず各自で取り組んでください.不明点は私に質問してください.その内容をみなさんでシェア出来たらと思っています.なぜ統計が必要なのか?
私たちはデータを取得して物事を判断し次の行動につなげている.
授業メニュー
第01回【オンデマンド講義】科学と統計
第02回【オンデマンド講義】記述統計
第03回 推測統計(1)点推定(平均と分散)
第04回 推測統計(2)区間推定(正規分布)
第05回 推測統計(3)区間推定(t分布)
第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定
第07-08回 推測統計(5)パラメトリック検定(t検定)
第09回 中間まとめ(小テスト)
第08+2回 推測統計(6)パラメトリック検定(ANOVA,有意確率補正法)
第10+1回 推測統計(7)ノンパラメトリック検定,カイ二乗検定
第11+1回 相対リスク
第12+1回 ROC解析
第13+1回 相関係数,回帰分析
第14+1回 生存時間分析
第15回 まとめ
第01回 科学と統計
【GE-01-04-01】根拠に基づいた医療(EBM)の 5 つのステップを列挙できる【GE-01-04-02】PICO(PECO)を用いた問題の定式化かができる。
(教科書1章1,2)
科学
科学が日常生活を豊かにしていることは明らかであるものの,科学者の想いによらない使い方もされたり,世の中全てを科学で説明できない小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf実証性
検討することのできる仮説が無いことには始まらない再現性
同一の実験条件では同一の結果が得られる客観性
多くの人々に承認されるchatGPTによる実証性に関する質問
「検討することのできる仮説とは」
ChatGPT3.5検討することのできる仮説は、研究や分析の目的に基づいて多岐にわたります。仮説とは、観測された現象を説明するための仮定や推測であり、実験やデータ分析を通じて検証可能でなければなりません。(以下略)
「検討することが出来ない仮説とは」
ChatGPT3.5(纏めると)検討することができない仮説にはいくつかの特徴があります。科学的な文脈で、仮説は観察や実験を通じて検証可能でなければなりません。
検討が難しい仮説の特徴
検証不可能,曖昧な定義,超自然的な要素,因果関係の証明が不可能,非現実的な条件
EBM
Evidence-Based Medicine根拠に基づいた医療
「根拠」・・・科学的根拠と表現されているケースも多い・・・(経験則だけに基づかないようにという意味合いを込めてというところかな)
医療提供における「根拠」以外の要素
意思決定における3要素・・・根拠,価値観,資源価値観は人によってさまざま
現有(もしくは調達可能な)資源で出来ることしかできない
医療資源

(不足の観点からみる医療2.0β より)
「根拠に基づく医療」(EBM)を理解しよう(厚生労働省eJIM(イージム「統合医療」情報発信サイト))
https://www.ejim.ncgg.go.jp/public/hint2/c03.html特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)
https://www.niph.go.jp/journal/data-49-4-j49-4/1.問題の定式化
PICOP(Patient)どのような患者さん(対象)なのか
I(Intervention)どのような介入を適用しようとしているのか
C(Comparison)介入しない場合(もしくは他の介入)と比較して
O(Outcome)どのような結果になるのだろうか
2.問題についての情報収集
掲げた問題に相当するような情報(世の中にある研究論文など)を探す3.情報の批判的吟味
情報そのものがどの程度信頼出来るのか,効果があるのか.4.情報の患者への適用
今回の患者さんと情報で得られた患者像を同じと見做し適用して良いか,問題あるのか5.1~4 のstepの振り返り
研究の場合もPICO/PECO(E(Exposure) 治療などの介入ではなく曝露)で整理し目的を明確化します.EBMはある患者さんに医療を適用するために情報を検索という流れですが,研究はある仮説を明らかにするために目的を明確化してデータ収集・分析となります.
南郷栄秀,Evidence-based medicine:診療現場でのプロブレムの解決法 日内会誌 106:2545~2551,2017
https://www.jstage.jst.go.jp/article/naika/106/12/106_2545/_article/-char/ja/特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)
EBMの5ステップと意思決定の3要素
EBM1~3ステップが根拠の部分根拠とする情報に実証性と再現性と客観性があったほうが良いというところは理解できるかと(つまり科学としての基本的な条件を満たしている方が良いだろう)
研究の方法によって,グレードが変わるのはそれらの要素が方法によって異なってくるので
ステップ4においては価値観と資源を含めた形となる
提出課題
1:根拠に基づかない医療とはどのようなものかお考えを示してください(短文で)第02回 記述統計(1)尺度,度数,代表値
【SO-02-03-01】尺度(間隔、比、順序、名義)について説明できる。(教科書2章1)

統計に用いるデータ
基本どのようなデータでも統計処理は出来る出来ないのは,どのようなデータであっても一つしか存在しない時
データについて
レコード
症例,個体,被験者単位でまとめられたデータの塊.表の場合一行にその症例のすべてのデータを記していたらそれがレコード変数(変量)
データの項目名のことデータ
観測値や測定値のこと(数値)だけでなく性別など文字の場合もある.コンピュータ処理するとき,文字だと扱いにくい時があるのでその時は数字に置き換える(→コード変換)
例えば都道府県名であれば 北海道→01 青森県→02 奈良県→29
全国地方公共団体コードの上二桁=都道府県番号
<参考>全国地方公共団体コード(総務省) https://www.soumu.go.jp/denshijiti/code.html |
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)(比率)
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1

記述統計量(度数)
取りまとめたものを「量で」示したもの.質的変数であっても度数(個数,人数など数えるもの)については「量」として示すことが出来るどのようなデータでも度数を示すことは可能
度数分布表
この授業では量的変量の度数分布表を作成する場合 A~B は A以上B未満として取り扱うそれぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
店名 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|
1.00 | ||||
計 | 1.00 | ----- | ----- |
量的変数の度数分布表
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.血圧 163.5mmHg 164.2mmHg 162.5mmHg・・・どれも度数を積み上げられない → 区間を設定する
「A~B」は「A以上B未満」と読む格好と思っていたが,分野などによって違うようです 「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように. 本授業(ミニテスト試験など全て含む)においては,「A~B」は「A以上B未満」として取り扱う |
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
130~140 | 135 | ||||
140~150 | 145 | ||||
150~160 | 155 | ||||
160~170 | 165 | ||||
170~180 | 175 | ||||
計 | ----- | ----- |
度数分布図
質的変数・・・縦棒グラフ
量的変数・・・ヒストグラム

棒の間隔が無いのは値が連続している状態であるが故
普通の棒グラフは棒の長さが度数を示すが,ヒストグラムは棒の面積が度数を示す
「階級の幅を等しくすること」と説明している場合があるが,それは幅が変わると高さが変わる故で,実際にはそのような区間設定はよくある |
ヒストグラムーなるほど統計学園(総務省統計局) https://www.stat.go.jp/naruhodo/4_graph/shokyu/histogram.html |
記述統計量(代表値)
その集団を代表する値代表値と散布度からなる.←駅伝やマラソンの実況中継はこれらを利用しているから状況がわかる
平均(Mean)
算術平均
いわゆる割り勘.xbar=1/n(x1+x2+・・・+xn)欠点:外れ値があると平均値は分布の中心位置を示さない(←それって代表的な値??)
→ 対処法:外れ値を取り除くか中央値を使うか
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる
加重平均
重みづけ平均例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの?
度数分布表を用いて算術平均を求めることもできる(個票データの算術平均とほぼ同じ)・・・Σ(階級値×階級の度数)/n
中央値
昇順に並べたときに,真ん中の順番のデータ(変数)の値データの数が偶数だと真ん中のデータは二つになるのでそれらの平均値
最頻値
最も個数が多いデータの値最頻値は複数存在する場合がある→二峰性
最大値,最小値
例えばある期間のピークの値を扱うケースもある記述統計量(散布度(範囲))
範囲
最大値と最小値の差四分位範囲
順序尺度の性質を用いた散布度小さい順(昇順)に並べて集団を4等分
分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3)
また第1四分位数は25%タイル値,第2四分位数=中央値=50%タイル値,第3四分位数=75%タイル値とも呼ばれます
大きい方が第3四分位数なのですが,間違える方も一定数いますが100%タイル値=最大値ということを理解していたら大丈夫でしょう
四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の算出方法は数多くあります
高校数学で習われたものは文部科学省が推奨した方式で,高校数学以外では見掛けない方法です.
一番わかりやすい四分位数の出し方はヒンジ値

以下のブログを見ていただくと数種類出来てしまうのも頷けるかと思います
ダンゴ包丁理論(tukeyのヒンジ)(Medbb's blog)
https://medbb.hatenablog.com/entry/2020/12/12/091240
考え方としては理解しやすいと思いますがtukeyのヒンジとは少し値が異なるケースもでてくるのでご注意ください
<参考>四分位数の定義(奥村 晴彦 (Haruhiko Okumura))
https://okumuralab.org/~okumura/stat/quartile.html
<参考>■四分位数の定義-教科書の内容に関するQ&A(数研通信(78号)数研出版)
https://www.chart.co.jp/subject/sugaku/suken_tsushin/78/78-10.pdf
箱ひげ図
四分位範囲をグラフ化
記述統計量(散布度(偏差))
「偏差」とはある点と基準点とのズレをさす「偏差」とだけ記述されてると基準点は平均値として捉えられるケースが多い
四分位偏差
順序尺度の性質を用いた散布度QD(quartile deviation)=IQR/2=(Q3-Q1)/2
四分位範囲を2で割ると求められるが,意味的には第3四分位数と第2四分位数の偏差と第2四分位数と第1四分位数の偏差の算術平均
QD=((Q3-Q2)+(Q2-Q1))/2=(Q3-Q1)/2
(平均値との)偏差
集団の平均値と個々の値の偏差を求めその平均をとることでその集団のバラツキ具合を算出分散
量的変量の性質を用いた散布度平均値から求めた偏差の平均は常に0になってしまう
平均値から求めた偏差の絶対値平均を求めるのは面倒.(近年PCを使えば簡単だが)
分散は偏差平方の算術平均

利点は,偏差を基にした散布度を算出できること
欠点は,求めた散布度の単位が二乗した格好になっている
標準偏差
分散の正の平方根を求めたもの利点:対象とする集団のデータや平均値と同じ単位になっている.
欠点:あくまでも平方根を用いて求めているので注意する点がある
(分散と標準偏差は線形の関係に無い)

提出課題
1:度数分布表から求めた平均値と個票データから求めた平均は最大どの程度異なるのか.「量的変数の度数分布表」で示した血圧の度数分布表を用いた場合最大どの程度異なるのか求めよ(±〇mmHg の○の数値のみ記せ)2:平均値が中央値よりも大きくなる集団がある.値の分布はどのようになっているか簡潔に説明せよ
第03回 推測統計(1)点推定(平均と分散)
(教科書2章1)偏った推定はよろしくない(あたらないから)
特に,計算の過程で偏ってしまうとかなりよろしくない
推定することについて
記述統計では,対象とする集団そのものの可視化が目的推測統計では,対象とする集団は全体の中の一部(サンプル)という捉え方で,サンプルから全体像を推し測ることを目的
世の中で全てを把握するというのはかなり難しい
国勢調査
日本全国に住んでいられる方を対象にした静態調査かなりコストをかけているが,それでも100%の回収率は難しい
<参考>
令和2年国勢調査の概要(総務省統計局)
https://www.stat.go.jp/data/kokusei/2020/gaiyou.html
2020年国勢調査の回答状況における都市-農村格差(*山本 涼子, 埴淵 知哉, 山内 昌和 2021年度日本地理学会春季学術大会要旨集)
https://www.jstage.jst.go.jp/article/ajg/2021s/0/2021s_30/_article/-char/ja/
点推定はあたらない
針の穴に糸をとおすような話記号について
推定の話になると記号の取り扱いで混乱するのでここで整理しておきます.分かりやすさを優先して整理したので,皆さんの使っている教科書などの表記は<参考>の論文を確認し読み替えください
μ・・・集団全体(母集団)の算術平均=母平均
σ^2・・・集団全体(母集団)の分散=母分散
σ・・・集団全体(母集団)の標準偏差=母標準偏差
xbar・・・集団の一部(標本)の算術平均=標本平均=母平均の不偏推定量
s^2・・・集団の一部(標本)より求めた母集団の分散の推定量=不偏分散(母分散の不偏推定量)
s・・・集団の一部(標本)より求めた不偏分散よりもとめた標準偏差=母標準偏差の推定量

参考
統計学テキストの「分散」の表記に関する調査(札幌学院大学総合研究所紀要 巻 1, p. 1-10, 発行日 2014-03-31)https://sgul.repo.nii.ac.jp/records/1807
母集団と標本
母集団
対象としている集団の全体のこと無限母集団と有限母集団がある
標本
対象としている集団の一部偏ってしまうことに注意
例)森で取れた昆虫の標本を作成する際、どうしても森全体の昆虫の分布から偏ってしまう
取り扱う標本について
母集団は20000人の収縮期血圧データ(整数)母集団のヒストグラム

その集団の一部を抽出したものが標本
<注意>上記のデータはサイコロの目が均等にでるのと同様に以下のように収縮期血圧データは110から140まで均等に出現しています.
実際にある集団に対して収縮期血圧を測定するとその血圧データの分布はそのような形になりません
諸々の事情(説明を理解しやすく)を含めて設定したのですが実際とは異なる振る舞いをしているであろうことだけ承知しておいてください.

日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)(https://mhlw-grants.niph.go.jp/project/23935)を加工して作成
<参考>日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)
https://mhlw-grants.niph.go.jp/project/23935
の平成24年度~26年度 総合研究報告書のP108図1の部分を取り出して加工したものが上記になります
https://mhlw-grants.niph.go.jp/system/files/2014/143031/201412017B/201412017B0006.pdf
母平均の点推定
得られた標本より求めた平均をそのまま母集団の推定値とする例題3-1)
以下の標本より母集団の平均値(母平均)を推定せよ
利点
計算が容易平均値の場合,計算式が母集団全体の値を求める時と標本から推定する時と同じで良い
欠点
必ずしも推定値が実際と一致するわけではない・・・むしろ外れて当然サンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

ピッタシ一致するのはサンプルサイズ10の時で1.1%(98.9%はハズレ)
推定の精度を上げるためには

標本数を大きくすればよい・・・測定を繰り返して行いその平均をとると精度は上がる
サンプルサイズを100にした時の(母集団から200の標本が作成できる)のヒストグラム

精度は上がるものの,ピッタシ一致する確率も上がるとは限らない
例題3-2
結局一つの値で示す点推定はなかなかピッタシ一致しない.ならば幅を持たせた区間推定は最大何パーセントまであてることが可能か?母分散の点推定
母分散の推定は一味違う例題3-3)
例題3-1)のデータと例題3-1)で求めた母平均の推定値との偏差を求め,偏差和(全て足し合わすこと)を求めよ.そして偏差平方和も求めよ例題3-1)のデータと私だけが知っている母平均(125.0)との偏差を求め,偏差和を求めよ.そして偏差平方和も求め,それぞれ比較せよ
標本の平均を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

低めの値が多くなる傾向で偏っている.
母集団の平均(本来知る由もない)を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

偏った推定にならないものの,本来知る由もない母平均を使えるわけがない(そもそも母数知っているなら推定は不要でしょう)
不偏分散
標本の平均を用いて母分散の推定を行う.母平均と標本平均は(ほぼ)異なるので,母平均と標本平均の差も考慮して分散を求めたもの
(無論母平均は分からないが母平均と標本平均の差を考慮している)
s^2=Σ(Xi-Xbar)^2/(n-1)
nで除するよりn-1で除したほうが,値が大きくなるのは当然なので,低めの値が出るのなら少し分母を小さくした方が大きくなるのは理解できるが(ケーキを3人で分けるのか4人で分けるのか)なぜ1引くだけ??となると思います

<参考>
不偏分散は何故nではなく(n-1)で除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#VAR
例題3-4
例題3-1)のデータより母集団全体の平均値および分散と標準偏差の推定値を求めよ不偏分散より求めた標準偏差は不偏推定量なのだろうか?
上記の不偏分散のヒストグラムを標準偏差にして作成したもの
<参考>不偏分散の正の平方根は不偏標準偏差でよろしいのか(よろしくない)(Medbb's blog)
https://medbb.hatenablog.com/entry/2024/01/09/232914
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:
課題のフォロー
標本の平均との偏差より求めた偏差平方和が一番小さくなる話(故に分散の値も一番小さくなる)

第04回 推測統計(2)区間推定(正規分布)
【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。(教科書2章1,2,3)
母集団の平均値の区間推定に向けて点推定により分かったこと
1)母集団の平均値の点推定値はほぼ一致しない(あたらない)2)母集団の平均値の点推定値は標本数(サンプルサイズ)が大きいほど母集団の平均との外れ方が小さくなる
3)母集団の平均値を区間で推定する際に基準となる値は,標本から求めた点推定値しか見当たらない
4)母集団の平均値の区間推定では点推定と異なり100%一致させることが可能である
追加して
5)母集団の分散の点推定値は標本数(サンプルサイズ)が大きいほど母集団の分散との外れ方が小さくなる
母集団の平均値の区間推定の考え方
区間を推定するにあたっての基準を点推定値を基準とし,区間を推定するにあたってどのような確率で標本方求めた平均値が出現するのか仮定したうえで行うこの授業回では出現する確率の分布に正規分布を用いる
正規分布
偶然誤差の分布と呼ばれる(精度の善し悪し→偶然誤差大きいか小さいか)精度を向上させるには測定回数を増やしその平均をとれば良い(誤差は小さくなる)
標準正規分布
平均値が0標準偏差=1(分散も1)になるように値を変換したものそれをZ値という・・・標準正規分布表の行と列から求める値の事
偏差値は平均値を50、標準偏差=10になるように値を変換したもの
それを偏差値という
例題4-1
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.その時のZ値および偏差値を求めよ
標準正規分布表
正規分布を平均値が0標準偏差=1(分散も1)になるように値を変換したものそれをZ値という・・・標準正規分布表の行と列から求める値の事

標準正規分布表のPDF版はコチラから
例題4-2
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.点数の分布が正規分布に従うと仮定して受験者が10000人だった場合上位何番目に相当するか求めよ
中心極限定理
サンプル数が多ければその標本の平均の分布は正規分布になる→正しく測定されているのであれば偶然誤差の発生は正規分布に従う
→測定回数を増やせば増やすほど
注)
普段の実験などでは,数回測定を行いその平均値を結果とするだけ(のはずなので)ピンとこない
以下は100面体のサイコロを作り1回試行した値を結果とし1万回行ったものから,試行回数を2回,3回と増やしその平均値を結果としたヒストグラムの変化を示したものである
標準誤差
・標準偏差は標本の分布のバラツキ具合を示したもの・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
ここでは,なぜ√nになるのか説明しないが,少なくともサンプルサイズが大きいほど標本平均のバラツキ具合が小さくなっていくことは理解できると思う
どうしても という方は以下のリンクご覧ください.
<参考>標準誤差SEはなぜ標準偏差σを√nで除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#SE
平均値の区間推定のイメージ


標本を基に母集団の平均(母平均)を95%信頼区間で求める
ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=18点であることがわかっている.受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ

例題4-3
全国で8000人を対象に模試を実施した.本学(115人)の平均値は424点,不偏分散より求めた標準偏差は20点だった.
全国の模試の平均点を本学の点を元に95%信頼区間で推定せよ
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:
第05回 推測統計(3)区間推定(t分布)
【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。(教科書3章2標本平均の理論分布と標準誤差(SE),教科書4章1正規分布とt分布の違い,2)
例題5-1
以下のデータは20000人の血圧データからサンプルサイズ16で抽出したグループ(20)よりそれぞれ母平均の区間推定を行ったものである
標準正規分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ

個票データは以下からダウンロード可能です
nmubiostat2025-0501utf8.csv
<参考>
t分布による区間推定
母集団の平均値を推定するにおいて,標準正規分布を使うと上手くいかないケースがある・・・特に標本数が少ないと困っていたゴセットさんが標本数によって平均値の出現する確率が変化する分布を示しました.
諸々の理由でt分布と呼ばれています.
<参考>
酒井 弘憲,ギネスビールと統計家ペンネーム スチューデント,ファルマシア51巻12号,2015
https://www.jstage.jst.go.jp/article/faruawpsj/51/12/51_1168/_article/-char/ja
t分布
t分布は標準正規分布と同様に,標本より求めた母標準偏差の推定値(不偏分散に基づく標準偏差)を用いるが,標本の自由度(サンプルサイズより求める)によって変化する.サンプルサイズが大きくなるとt分布は正規分布に近似されていく.

t分布のPDF版はコチラから
「自由度」νが出てきますが,以下考え方
標本の中で自由に振る舞うことが許されている値の数例えば標本から統計量を求めたとき,母数の推定値とするなど確定すると自由に振る舞えない値が出てくる(つじつま合わせ)
t分布は抽出した標本数を基にしたものなので,正規分布のように一義的なものでは無く,標本数(自由度)によって確率分布が変わる
統計の話をするときに「t」という話が良く出てくるわけですが,正規分布との関係は良く整理しておいてください
なお大文字の「T」とみると某ポイントカードを思い浮かべる方が多いのかな(今は別のアルファベットになりましたが)
関西において「T」は「浪速の轟砲」を指すのでご注意ください
例題5-2
例題5-1のデータを用いてt分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ
例題5-1の結果と5-2の結果を比較せよ

例題5-3
5-1のデータを用いてt分布を用いて不偏分散ではなく標本自身の分散を用いて95%信頼区間で推定し,し,私しか知らない母平均と比較が含まれているか確認せよ

例題5-4 自由度が∞の時のt分布の95%信頼区間は正規分布と同じであるが自由度νが13の時,正規分布の何パーセント信頼区間に相当するのか?
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:
課題のフォロー
tの由来
t検定(調査・統計用語集 日経リサーチ)https://service.nikkei-r.co.jp/glossary/t-test
第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定
【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
(教科書7章1母比率の信頼区間の推定,3章検定の原理)
比と率と割合
疫学分野は集団の数を数える(頻度)ことがベースとなる分野無論比と率と割合は頻度以外のものでも使っている
割合(比率)
proportion全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%
比
ratio異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method
率
rate時間に対する何かの量の比
変化を表す指標
死亡率
ある集団において期間中に罹患した人数をその時間で割る
二項分布
ある事象が起こる確率が既知の時,試行回数に対して出現度数別の確率を求めたもの出現度数r=試行回数n×事象の起こる確率p
n回施行すると出現度数rは期待値になることが期待されるが,期待以外の度数になることもある(むしろ当たらない方が多いのでは?)
Pr=nCr×pr×(1-p)n-r
P(r)=nCr*p^r*(1-p)^(n-r)
例題6-1
2/3の確率でタコが入っているたこ・ラジオ焼きセットがあったとする(タコの入手が困難なので不足を牛スジ肉で代用している)
12個入りのたこ・ラジオ焼きセットを買った場合たこ入りたこ焼きが10個以上になる確率を求めよ

<参考>
たこ焼きのはじまり(大阪たこ焼マーケット)
https://takoyakimarket.com/history.html
例題6-1では10個以上(10,11,12個)の確率を累積したもので累積確率と呼ばれます.
例題6-2
例題6-1の計算結果を用いて95%信頼区間を求めよ
二項分布と正規分布
二項分布のnが大きければ正規分布に近似する(μ=np σ^2=np(1-p))

μ=np
σ^2=np(1-p)
<参考>
二項分布と母比率の区間推定【中学の数学からはじめる統計検定2級講座第10回】(とけたろうブログ)
https://toketarou.com/binomial/
例題6-3
船員保険加入者の特定健康診査の対象者と受診者はそれぞれ42903人,22413人だった.
正規分布を用いて全国の特定健康診査の受診率を95%信頼区間で推定せよ.
<参考>
2022年度 特定健康診査・特定保健指導の実施状況(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/newpage_00045.html
第2期奈良県医療費適正化計画の実績に関する評価(奈良県)
https://www.pref.nara.jp/secure/224873/第2期奈良県医療費適正化計画の実績に関する評価.pdf
奈良県のすがた2024-グラフと解説で見る統計ガイド-(奈良県政策推進課)
https://www.pref.nara.jp/26049.htm
https://www.pref.nara.jp/dd.aspx?moduleid=19736&pfromid=4
仮説検定
仮説検定はなぜ必要なのだろうか?
その仮説が科学に基づいたものであることを統計手法を用いて証明したいから例題6-4
科学的に証明されたものは100%正しいと言ってよいのだろうか?
検定(有意差検定)と推定の違い
推定
検定

科学と統計(一部再掲)
初回の講義をを思い出していただいたら良いかなと思いますが,以下抜粋小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)より
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
実証性
「考えられた仮説」が無いことには始まらない→仮説検証型それでは「考えられていない仮説」とは?
→まだ十分に確固たる仮説として成立していない仮説
仮説検証型と仮説探索型
仮説探索型とは「考えられた仮説」が存在せず(関心ある事象など),得られた結果は「考えられた仮説」になる可能性を有するが,その段階では「考えられたと言えない仮説」再現性
仮説を実証するために得られたデータから複数回,同一の検証結果になること例題6-4
再現性は本来「未来永劫」だと思うが,なぜ「複数回」同一の検証結果になることとしているのか
判定基準
「同一の結果」が100%の確率で出現しないことを示しておく必要が出てくる→そうなると,確率に基づく基準で判定しないことには,再現性を満たすことが出来ない
故に仮説検定は確率に基づいて行う
「確率」⇔「実空間での違い」
区間推定では,ある確率分布による確率(例えば95%)を統計指標(標準正規分布ならz値)に置き換えてから,実空間での対象とする事柄に置き換えて信頼区間を求めている仮説検定では,実空間で対象とする事柄の違いを求めてから,確率分布における統計指標に置き換えて確率を求めている
違いを評価するために効果量(どの程度の違いを違うと判定するか)で決定しても,その確率は変わってしまう→区間推定で経験してみましょう
例題6-5
ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=10点であることがわかっている.
受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ(以前の授業での説明用の問題の数値を変えたもの)
区間推定と仮説検定の相反する部分
区間推定は区間内に求めているものがある(含まれている ことを祈っている)仮説検定は区間外に求めているものがある(含まれていないことを祈っている)
背理法
命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法違いがあることを証明するにあたって「違いが無いことを」を証明できないことを根拠にする
仮説検定を背理法に基づいて行う理由
仮説検定を行う動機は,これまでの世界の科学的な常識とは異なる新たな知見を証明することにある
これまでの世界の科学的な常識は繰り返し用いられてきた.
新たな知見はこれまでの科学的な常識を否定しなくてはならない
つまり,従来の手技,薬剤と同じように新しい手技,薬剤を用いた時に再現性がみられなかったら,それは従来の常識を覆すものであると判定して証明する論法
無論,前提として「考えられた仮説があること」(ぼくのかんがえたさいきょうの説だとダメ)
例題6-6
「ぼくのかんがえたさいきょうの説」に基づき仮説検定を行い,その説が従来の常識を覆すものと仮説検定の結果判定された場合,なにがいけないのか述べよ
例題6-7
「考えられた仮説があること」に基づき仮説検定を行い,その説が従来の常識と変わらないものと仮説検定の結果判定された場合,不都合なことがあるのか述べよ
統計的有意差と臨床的有意差
得られたデータに基づき計算した確率が判定基準を下回った時に統計的有意差があると言います.知見は社会実装することで人類に貢献できますが,医療現場においては臨床的に意味があるとされる量を基準とする臨床的有意差が結果として求められます
無論社会で役立てていく知見としては,統計的有意差よりも臨床的有意差が重要になりますが,「科学的」な観点からは前者が支配的になります.
確率の違いを量で示すとき,その量はサンプルサイズにより変化します.故に臨床的有意差に基づきサンプルサイズを決定することで二つの違いを解消できます
例えば臨床的有意差が統計的有意差よりも大きい場合は再現性については確認できたものの臨床的な観点から確認はできません.統計科学的に良いが,医科学的には?という結果になります
一般にはサンプルサイズが大きいほど,精度の高い結果が得られるので良いという感覚のはすですが,それは区間推定の話で仮説検定において効果量の差を検証する場合は少し状況が異なります
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:
授業フォロー
標準偏差と標準誤差
度数の話を確率の世界に変換する時点で,度数の時の標準偏差は確率の世界では標準誤差となります.度数→確率は平均を求めていることになるので
第07回 推測統計(5)パラメトリック検定(t検定)
(教科書4章1,5章1,教科書8章1,3,10章1Q7)【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
パラメトリックとノンパラメトリック
教科書P44
分布の形状に依存する(量的)統計量(平均値 標準偏差)分布の形状に依存しない(質的)統計量(最頻値 中央値 四分位範囲,偏差 パーセント値)

教科書P4-7,204
パラメトリック検定・・・計測値の分布が何かしらの確率分布であることを仮定正規分布であることの確認
Q-Qプロットは縦軸が期待値 横軸は実際の値期待値はデータを順序尺度の取り扱いをしてその順位を確率に置き換えて、値を確率分布(正規分布)に代入することで期待値を算出する。
P11複雑な調査データTGを用いて

<参考>Excelによる正規確率プロットの作り方(統計WEB SSRI)
https://bellcurve.jp/statistics/blog/15362.html
例題7-1
以下の標本よりQ-Qプロットを作成するための表を完成させよ

実際の血圧 | 期待値 |
---|---|
112 | |
112 | |
113 | |
117 | |
119 | |
124 | |
125 | |
126 | |
127 | |
135 |

仮説
以降は「新たな知見」に対する話で仮説検定を用いるケースが重要になりますので,これまでの常識を覆す仮説を証明するパターンになります新たな知見を見いださない=通常通り(いつもと一緒)の仮説の証明にも用いられる 例えば等分散の検定(F検定)・・・標本Aも標本Bも同じように抽出したから分散も同じだろうという仮説にも意味がある(ことになる)
仮説検定では判断基準を違いそのものに閾値を設けるのではなく確率で示してそれを有意水準として示す
差がある仮説の判定(有意差検定)
事象としては「同一の結果が得られる」「同一の結果が得られない」の二つにいずれかになります.同一の結果が得られる仮説を帰無仮説(これまでと違いが無い仮説)H0,同一の結果が得られない仮説を対立仮説(これまでと違いがある仮説)H1と示します.有意水準は対立仮説H1の確率を示します
有意水準は通例5%とされることが多く,両側検定(効果量に違いがあるのか無いか)と片側検定(違いがが正の方向のものなのか,負の方向のものなのか)の二種類がある
背理法の考え方に基づく論理で証明.もともと証明したい仮説(差がある)を偽であるとして,矛盾を導く出すことで判定する方法
現在はコンピュータにより確率を直接求めることは可能ですし,まどろっこしい流れに映りますが,違い(差)を直接判断しているのではなく「同一の結果が得られる」確率に基づき判定基準を定めているところが科学として重要であるから故と捉えています.
ですので確率そのものは,判定のためのものであって求めた値(統計量や確率)そのものに重きを置く必要はありません.効果量そのものに重きをおく方が知見の社会実装の観点から重要になります
仮説検定(有意差検定 両側検定)のフォーマット例
手順1 帰無仮説,対立仮説をたてる
帰無仮説H0:μ=150 対立仮説H1:μ≠150手順2 母集団が従うと見做す確率分布を定め,有意水準を決める
(例えば)正規分布に従うと見做し,有意水準両側5%とする手順3 今回取得したデータをもとに,母集団が従うと見做す確率分布における統計量を求める
例
帰無仮説H0がある集団の収縮期血圧μ=150mmhgとしたときに,これまでにない高血圧防止体操を行った集団から得られたデータ(サンプルサイズn=36 標本平均xbar=147.3 不偏分散s^2=81)で検定を行う1)手順1 帰無仮説,対立仮説をたてる
帰無仮説H0:μ=150 対立仮説H1:μ≠150手順2 母集団が従うと見做す確率分布を定め,有意水準を決める
正規分布に従うと見做し,有意水準両側5%とする手順3 今回取得したデータをもとに,母集団が従うと見做す確率分布における統計量を求める
-2.7異なる,これを(標準正規分布の)検定統計量に変換すると-1.8手順4
検定統計量を用いて有意水準との比較,今回の標本が棄却域にあるのか否か(受容域なのか)判定する.1)(ケースX) |z|=1.8 p=0.0359×2(両側検定なので2倍)>0.05
帰無仮説を棄却できないので判定を保留する
2)(ケース1)有意水準よりも小さい場合 |z|=2.96 p=0.015×2(両側検定なので2倍)<0.05
帰無仮説を棄却し対立仮説を採択する 有意差がある
3)(ケース2)有意水準よりも大きい場合 |z|=1.45 p=0.0735×2(両側検定なので2倍)>0.05
帰無仮説を棄却できないので判定を保留する
注)標準正規分布表の場合確率まで求めることが可能だが,t分布表は統計量から確率を求めることはできないので統計量で比較する
例題7-2 有意差検定において背理法を使わなければならない理由を考えよ(何故,違いがあるという仮説を直接証明しないのか?)
第7回の授業ここまで(授業に関する内容での説明に20分程度使ったため)以降第8回
1標本(1群)t検定
世の中(母集団)の基準値など,既に明らかになっている事柄と比較することで世の中の一般的な状況と対象とする集団が異なっていることを明らかにすることを目的例題7-3
物騒な話ですが,ある自動販売機に偽造通貨が使われているのではないかという話が私のところに舞い込んできた.
話を聞くともっともらしい仮説が既にあるので検証することにした.
そこで,自販機に入っていた硬貨10円玉10枚を用いてこの仮説について仮説検定を行う
10円玉の硬貨μ=4.50gと比較して異なることが期待される検定になります
ここでは,とりあえず標準正規分布で検定してみましょう(よくないけど)
計算した結果ですが
標本の平均は4.42g
不偏分散より求めた標準偏差は0.119
をお使いください.
10円玉ID | 重量(g) |
---|---|
1 | 4.55 |
2 | 4.53 |
3 | 4.23 |
4 | 4.50 |
5 | 4.51 |
6 | 4.31 |
7 | 4.38 |
8 | 4.54 |
9 | 4.35 |
10 | 4.30 |
例題7-4
例題7-3の結果を先方にお伝えしたところ,適切な統計手法を用いていないとご指摘を受けました.
そこで改めてt分布を用いて検定を行ってください
1標本(関連2群)t検定
関連する2群・・・一つの対象集団を2回測定して標本を二つ作る.それぞれの標本から同一IDを確定できるのでその前後の差をとって検定する標本は対象集団のことを指すので1標本から2回データを抽出しているので,そのように書いた方が適切にも思うが世の中で2標本とするケースが多いので当初そのような表記にしていました.よく考えて昨年度と同様な一標本の表記に戻しています
例題7-5
新開発のシューズを2種類開発した.それぞれ同一被験者に従来型と新型を履いて5km走のタイムを計測し比較を行った.
有意水準5%両側検定を行い効果があるのか検証せよ
<<以下の部分は中間試験の範囲外とします>>
2標本(独立2群)t検定
関連の無い2群・・・二つの条件が異なる集団を1回測定し標本を二つ作る.それぞれの標本が同じ分散であることが前提となる(等分散・・証明できない場合でも行える手法はある(というより最初からその手法使ったらよいという考え方もある))
分散も合成する必要が出てくる
例題7-6
バセドウ患者12人に協力いただきそれぞれ6人ずつ従来の薬剤を当投与した群と新薬を投与した群に分けて脈拍数を測定した.
新薬に効果があるのか検証せよ
バセドウ患者12人に協力いただきそれぞれ6人ずつ従来の薬剤を当投与した群と新薬を投与した群に分けて脈拍数を測定した.
新薬に効果があるのか検証せよ
ID | 対照群(従来群) | 比較群(新薬群) |
---|---|---|
1 | 98 | 86 |
2 | 88 | 73 |
3 | 100 | 95 |
4 | 96 | 92 |
5 | 107 | 99 |
6 | 114 | 116 |
<<以上の部分まで中間試験の範囲外とします>>
検定で注意する点
両側検定と片側検定の注意点
教科書P207一緒な有意水準で比較した場合 片側は棄却域が存在しないことと,他方は棄却域が大きくなってしまう → 帰無仮説が棄却されやすくなる状況
有意水準は常に0.05?
教科書P208有意差は有意水準が一緒でもn=が大きくなると少ない差でも優位と判定されてしまう.
統計的有意差≠臨床的有意差
効果量を目的としているわけで,統計的な差(違い)が現実社会の中において意味がある差なのか
各群サンプルサイズ10の場合で検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
各群サンプルサイズ1000の場合検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる

αエラー βエラー
教科書P215第一種の過誤
(αエラー)・・・誤って差があると判定する確率αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤
(βエラー)・・・誤って差が無いと判定(=判定保留)する確率βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1-検出力(Power)=β
検出力=1-β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8~0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.
統計的有意性とp値に関するASA声明
<参考>統計的有意性とP値に関するASA声明(日本計量生物学会)http://biometrics.gr.jp/news/all/ASA.pdf
以下の内容が指摘されています
1. p値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
2. p値は、調べている仮説が正しい確率を測るものではない
3. 科学的な結論は、p値がある値を超えたかどうかにのみ基づくべきではない
4. 適正な推測のためには、すべてを報告する透明性が必要
5. p値は、効果の大きさや結果の重要性を意味しない
6. p値は、それだけでは仮説に関するエビデンスのよい指標とはならない
例題7-7 特に小標本の場合仮説検定においてt分布(t検定)ではなく標準正規分布を用いた検定(Z検定)を行った場合どのような過誤が起こりやすくなるか
講義後記
例題7-5回答例


第09回 中間まとめ(小テスト)
テストの採点終わりました.30点中13点以下(45%未満)の方についてはどのようにしたらよいのか,皆さんのご意見お聞かせください第08+2回 推測統計(6)パラメトリック検定(ANOVA,有意確率補正法)
教科書5章3,8章1-2,第10章Q7多群の比較の話
F分布
二群の分散に関する確率分布分散の比・・・F値(FはフィッシャーのF)

例題8-1
なぜF分布図においての自由度df1=df2の場合α=0.5になるのか簡潔に説明せよ
F分布に従う確率変数の逆数
自由度(k1,k2)を入れ替えた分布に従う例) F0.05(4,9)=6.00
1/F0.05(4,9)=F0.95(9,4)=0.1667=1/6.00)

等分散の検定(F検定)(P94)
等分散性の検定・・・分散比を求めてF値より判定「2群の分散は異なるとは言えない」・・・帰無仮説を棄却できない(保留)
一元配置分散分析
3つ以上の標本 群間分散と群内分散の分散比
群内分散とは3つ以上の標本を一つの群としたときに求める分散
群間分散とはそのぞれの標本をそれぞれの群としたときの,それぞれの平均の分散
群間分散と群内分散の比を求めたときに,大きな値(群間分散が群内分散よりも大きい)のであれば群の違いによる影響(つまり同じ母集団から抽出したとみなせない)があると判定する考え方
群間分散
群別の平均と群別の平均から求める.自由度は群数k-1
(平均値のバラツキ具合)
群内分散
全て同じ群に属するとして標本の値そのものを使って求める.自由度は総標本数n-群数k
(各々の群内における値のバラツキ具合)
群間のバラツキ具合と群内のバラツキ具合が異なるということは群によって値が異なっているということを示すことが出来る.
色々整理すると
群間で平均値を比較した時にバラツキが発生しているならば,それはそれぞれの群の平均値はは同じ母集団から抽出したものとならない.
しかしながら群内でも発生するバラツキがあるわけでが,それは偶然発生する誤差として考える

故に帰無仮説は全ての群の平均は等しい(同じ母集団から抽出した標本)
例題8-2-1
A群 8,12,16
B群 8,14,20
C群 8,16,20,28
保留 群による違いは見られなかった
例題8-2-2
A群 10,12,14
B群 12,14,16
C群 15,17,19,21
帰無仮説を棄却 群による違いはある
例題8-2-3
A群 11,12,13
B群 13,14,15
C群 16.5,17.5,18.5,19.5
帰無仮説を棄却 群による違いはある
左から例題8-2-1,2,3の箱ひげ図

多重検定
ポイントとしては、それぞれの検定が独立した仮説にもとづいたものと考えて良いか否か。良いのであれば多重検定にならない
一連のものであれば対立仮説を考えたときに有意水準が5%と言いながら5%になっていないのでは?
多重に検定することでどれかあたれば帰無仮説は棄却できるので例えば3群総当たりだと有意水準0.05で多重検定(6通り)すると有意水準が0.265になってしまう。(からよくない)
有意確率補正法
Bonferroniの場合は6通り検定するのであれば、一検定あたりの有意水準だと0.05/6=0.0083となる。全体では1-(1-0.00833)^6=1-0.95103=0.0490
Sidak補正の場合は同様に1-(1-0.05)^(1/6)=0.008512 1-(1-0.008512)^6=1-0.95=0.0500
多群になるほど検定あたりの有意水準が下がる→差が出にくい
多重比較法
パラメトリック法
Tukey法・・・各ペアに対する平均値の差の検定
Dunnett検定・・・一つの対象群との対比
ノンパラメトリック法
Dunn法
例題8-3
曜日別に検査の管理用資料を測定した。
曜日別に検査の管理用資料を測定した。それぞれ総当たりで二標本t検定を行った。有意確率をBonferroni補正法を用いて有意水準5%で判定し有意な組み合わせをすべて記せ

講義後記
例題回答例
例題8-2-1
分散比0.74
F(2,7:0.05)=4.74
判定保留 群による違いは見られなかった
例題8-2-2
分散比6.42
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある
例題8-2-3
分散比25.6
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある
第10+1回 推測統計(7)ノンパラメトリック検定,カイ二乗検定
教科書4章3,教科書5章4,教科書7章1,2
質的変量の性質(順序,名義)を用いた検定
(関連2群ノンパラメトリック)一標本Wilcoxon検定
2群の差が無いと見做せるか否かを,質的変量の性質を用いて検定する
正と負の差分それぞれより求めた順位和に偏りがあると,2群の差が無いと言えないという考え方
検定統計量Tは正と負それぞれの順位和を求め最小の値とする

例題10-1
WilcoxonT検定表でN=7の時に有意水準α=0.01(両側)未満の統計量Tが存在していないことを証明せよ
例題10-2
例題7-5のランニングシューズ2種類についてそれぞれWilcoxonT検定(α=0.05,0.01)を行い違いがみられるか検証せよ
(独立2群ノンパラメトリック)二標本Mann-Whitny検定
2群の違いを,それぞれの値を比較する群の中でどのような順位に位置するのか求め順位和に違いが無いと見做せるか否かあることを利用
例題10-3
以下の非妊娠群と妊娠群のホルモン値について妊娠による影響があるか二標本Mann-Whitny検定(α=0.05,0.01)をせよ
A群 8,12,16
B群 8,14,20
C群 8,16,20,28
A群 10,12,14
B群 12,14,16
C群 15,17,19,21
A群 11,12,13
B群 13,14,15
C群 16.5,17.5,18.5,19.5

曜日別に検査の管理用資料を測定した。
曜日別に検査の管理用資料を測定した。それぞれ総当たりで二標本t検定を行った。有意確率をBonferroni補正法を用いて有意水準5%で判定し有意な組み合わせをすべて記せ

分散比0.74
F(2,7:0.05)=4.74
判定保留 群による違いは見られなかった
分散比6.42
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある
分散比25.6
F(2,7:0.05)=4.74
帰無仮説を棄却 群による違いはある
WilcoxonT検定表でN=7の時に有意水準α=0.01(両側)未満の統計量Tが存在していないことを証明せよ
例題7-5のランニングシューズ2種類についてそれぞれWilcoxonT検定(α=0.05,0.01)を行い違いがみられるか検証せよ
以下の非妊娠群と妊娠群のホルモン値について妊娠による影響があるか二標本Mann-Whitny検定(α=0.05,0.01)をせよ
非妊娠群 | 妊娠群 |
---|---|
4.0 | 4.7 |
3.1 | 3.8 |
2.2 | 3.5 |
1.4 | 1.3 |
1.2 | 1.1 |
カイ二乗検定
計数値(度数)に関する検定計量値と計数値
計量値・・・量を測定計数値・・・頻度を測定(名義尺度)
カイ二乗分布
教科書P142χ2乗分布・・・偏差平方和に関する確率分布
χ2=ΣZi2
平均からのズレの平方をとったものを足し合わせていく→偏差平方和
標準正規分布に従う独立した確率変数が1つの場合
χ2=Z12
<参考>独立した確率変数が二つの場合
χ2=Z12+Z22
カイ二乗分布表(教科書P273)
t分布と同じく自由度により確率分布は変化するカイ二乗分布(ν=1)の時のそれぞれの上側確率に相当する正規分布の確率(両側5%(片側2.5%ずつ)は全て上側に集約されてしまう

χ2=((X-μ)/σ)2
χ20.05=((1.96-0)/1)2
例)標準正規分布で有意水準両側5%の場合の境界値はz=1.96.カイ二乗分布表より優位水準上側5%の時のカイ二乗値=3.84
ピアソンのカイ二乗
カイ二乗分布の話(X-μ)を(実際に出現した度数-出現が期待される度数(期待値))に置き換え分散で除することで分子の差分を標準正規分布のN(0,1)にしていたものを,期待値で除して求めたものである.
(ポアソン分布であるとすると平均値=期待値=分散)
カイ二乗値=Σ(観察度数-期待値)2/期待値
F分布とカイ二乗分布の関係
それぞれの独立している群のカイ二乗値の比=分散の比・・・F値U,Kはそれぞれカイ二乗分布に従う(自由度k) F(k1,k2)=U/k1/V/k2
F(ν,∞)=χ^2(ν)/ν/χ^2(∞)/∞
=χ^2(ν)/ν
χ^2(ν)=ν×F(ν,∞)

検定
適合度の検定
P140例題28で説明1行n列
事象の起こる確率に基づく頻度(=n×p)期待値(度数))と実際に観測された度数(観察度数)の差異について検定.帰無仮説(測定した分布は想定されている分布と等しい)H0:P=(1/6,1/6,1/6,1/6,1/6,1/6)・・・サイコロの場合
独立性の検定
m行n列こちらはそれぞれが独立しているか(関係があるか無いか)を検定
考え方は一緒
事象の起こる確率は実際に観測された度数を基に算出して全体の度数を乗じることで期待値(度数)とする.
Fisherの直接確率法
期待値が低い場合、.wilcoxonの統計量T理論分布と同様だが計算大変故に教科書では2×2表以外出てこない(考え方は一緒)
例えばP146例題より直接確率を求めたものが以下

例題10-4
以下のサイコロについて通常のサイコロと異なる可能性である可能性が高いので検定を行った
サイコロ | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
観察度数 | 8 | 7 | 4 | 10 | 14 | 11 |
例題10-5
以下の薬剤と尿糖の関係について検定を行ってください
観察度数 | 薬剤A | 薬剤B | 薬剤C |
---|---|---|---|
尿糖+ | 14 | 22 | 44 |
尿糖- | 28 | 40 | 52 |
講義後記
例題回答例
例題10-2
ランニングシューズA T=7
有意水準5%で差がある
ランニングシューズB T=9
有意水準5%で差がみられない(判定保留)
例題10-3
検定投棄料U=11
帰無仮説を棄却できない(判定保留)
例題10-4
検定統計量χ^2=6.67
帰無仮説を棄却できない(判定保留)
例題10-5
検定統計量χ^2=2.67
帰無仮説を棄却できない(判定保留)
第11+1回 相対リスク
【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。この授業では相対リスク=Relative Risk は一般的な用語であり、その算出指標の一つにリスク比(Risk Ratio)があるのですがそれを相対危険としているケースもあり,言葉の整理が出来ていないところでもあります。
検定の話はここまでになります.
ここからは指標の話になっていきますが,検定ではなく95%CI(信頼区間)で,その指標の意味合い(効果があると言えるのか)を確認する格好になります
観察研究における研究法と相対リスク
被験者個人を特定して追跡する形態のものとしては以下の方法がある
コホート研究(Cohort study)
対象に曝露している人々と非曝露群を設定、追跡調査していくスタイル実空間内では無理だが,データが揃っている場合は回顧的コホート研究という方法も使える。(近年はデータが蓄積されているのでその範囲内で成立するのであれば)

症例対照研究(Case-control study)
ある状態(例えば病気に罹患している)群と、罹患していない群を設定、時間を遡って調査していくスタイル後ろ向きにしか行えない(前向きだと曝露→疾患の順がおかしくなる)

実験的研究(介入研究)(intervention study)
曝露群(介入群)を研究者が割り付ける → 被験者に対する倫理的配慮が肝要無作為に割り付けることが出来る場合は交絡因子を制御できる(ことが期待される)
倫理的に考えると非介入群の方が不利益になってしまう可能性が高いので、配慮した研究デザインが求められる

説明用データ
罹患有 | 罹患無 | 計 | |
---|---|---|---|
曝露有 | A | B | A+B |
曝露無 | C | D | C+D |
計 | A+C | B+D |
リスク比
Risk Ratio(RR)曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら
A~D:指標(頻度以外に罹患率やら有病率・・・)
曝露有群の罹患リスク=A/(A+B)
曝露無群の罹患リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、罹患頻度が低ければA+B≒B C+D≒D
リスク比≒A/B/C/D=AD/BC
オッズ比
Odds Ratio(OR)オッズの比
オッズとは
相反する事象の有無についての指標(確率)の比曝露オッズ
曝露(介入)の有無毎に求めた指標(確率)の比罹患オッズ
罹患の有無毎に求めた指標(確率)の比オッズ比とリスク比の関係
曝露オッズの場合
罹患有群の曝露オッズ=A/(A+C)/C/(A+C)=A/C罹患無群の曝露オッズ=B/(B+D)/D/(B+D)=B/D
オッズ比=A/C/B/D
=AD/BC
罹患オッズの場合
曝露有群の罹患オッズ=A/(A+B)/B/(A+B)=A/B曝露無群の罹患オッズ=C/(C+D)/D/(C+D)=C/D
オッズ比=A/B/C/D
=AD/BC
上記のように罹患の頻度が低ければオッズ比とリスク比の近似値となる
リスク比,オッズ比をp=A/(A+B) q=C/(C+D)で示すと
リスク比=A/(A+B)/C/(C+D)=p/qオッズ比=A/C/B/D=A/B/C/D=p/(1-p)/q/(1-q)
例題11-1
適切な相対リスクの指標を算出せよ以下はコホート研究のデータである
不整脈あり | 不整脈なし | 計 | |
---|---|---|---|
曝露群 | 100 | 1900 | 2000 |
非曝露群 | 50 | 1950 | 2000 |
計 | 150 | 3850 | 4000 |
例題11-2
適切な相対リスクの指標を算出せよ以下は症例対照研究のデータである
不整脈あり | 不整脈なし | 計 | |
---|---|---|---|
曝露歴あり | 100 | 65 | 165 |
曝露歴なし | 100 | 135 | 235 |
計 | 200 | 200 | 400 |
例題11-3 コホート研究でそれぞれリスク比とオッズ比を求めた場合,それぞれの値が乖離する場合がある.どのような状況の時に起こるのか簡潔に説明せよ
例題11-4 症例対照研究ではリスク比とオッズ比は乖離する.どのような理由によるものか簡潔に説明せよ
講義後記
リスクとオッズの近似の度合い
リスクが大きくなるとオッズはリスクから離れていく
リスク比とオッズ比の近似の度合い
比較するリスクが大きいとオッズ比もリスク比から離れていく
第12+1回 ROC解析
(教科書6章1,2,3)教科書P115-
検査法の診断的有用性を評価する話

疾患あり | 疾患なし | 指標 | |
---|---|---|---|
検査陽性 | 真陽性 a |
偽陽性 b |
陽性的中率 a/(a+b) |
検査陰性 | 偽陰性 c |
真陰性 d |
陰性的中率 d/(c+d) |
指標 | 感度 a/(a+c) |
特異度 d/(b+d) |
有病率 (a+c)/(a+b+c+d) |
予測値
有病率の影響を受ける陽性的中率=P(D|陽性)
陰性的中率=P(Dc|陰性)
感度と特異度
感度=P(陽性|D) 疾患群における真陽性の割合偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1-偽陽性率 非疾患群における真陰性の割合


検査法の評価指標
AUC=ROC曲線を描いて算出 検査の分別能ROC曲線
教科書(P119)判別度の分析
感度と偽陽性率(1-特異度)を用いて曲線を描く

カーブが左上に行くほど検査特性が優れている.(=AUCが大きくなる)
判断基準は諸々の要素が入るが1,0と0,1の対角線と曲線の交わる部分が目安.あとは検査の目的などによって変わってくる
尤度比
教科書で尤度比としているのは陽性尤度比=感度/偽陽性率


例題12-1
2種類の検査法A,Bを施行したところ以下の結果を得た.
A法のROC曲線を描きAUCを求めよ
疾患群 | 14.3 | 15.2 | 13.8 | 14.1 | 13.9 | 12.6 | 14.2 | 14.6 | 13.1 | 13.7 |
非疾患群 | 13.2 | 14.1 | 13.8 | 13.6 | 12.9 | 12.4 | 12.1 | 12.3 | 12.3 | 12.8 |
疾患群 | 非疾患群 |
---|---|
15.2 | |
14.6 | |
14.3 | |
14.2 | |
14.1 | 14.1 |
13.9 | |
13.8 | 13.8 |
13.7 | |
13.6 | |
13.2 | |
13.1 | |
12.9 | |
12.8 | |
12.6 | |
12.4 | |
12.3 | |
12.3 | |
12.1 |
例題12-2
2種類の検査法A,Bを施行したところ以下の結果を得た.
B法のROC曲線を描きAUCを求めよ
AUCを求めどちらの検査が優れているか評価せよ
B法
疾患群 | 14.3 | 15.2 | 13.8 | 14.1 | 13.9 | 12.6 | 14.2 | 14.6 | 13.1 | 13.7 |
非疾患群 | 13.2 | 14.3 | 13.8 | 12.9 | 14.4 | 14.4 | 12.1 | 15.3 | 12.3 | 12.8 |
カットオフ値
感度・特異度のみを用いたカットオフ値はROC曲線のy=1-xの交点の時の値になるROC曲線は交点を求めてから値については別途求める必要があるので,感度・特異度曲線を用いれば簡単に求められる
有病率による調整
疾患群と非疾患群の比による調整偽陽性,偽陰性の重要性による調整
対象とする疾患によっては偽陰性率を出来るだけ低くする例題12-3
A法およびB法の感度・特異度曲線を作成し,その結果に基づくカットオフ値を求めよ
講義後記
例題12-1
AUC(A法)0.85例題12-2
AUC(B法)0.59例題12-3
カットオフ値(A法)13.7カットオフ値(B法)13.9
第13+1回 相関係数,回帰分析
【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。【SO-02-03-05】多変量解析の意義を理解している。
(教科書9章1,2,3)
相関
correlative相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか
因果
cause and effect原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない
普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)
例
たばこを吸う-肺がん・・・・相関関係○
コーヒーを飲む-肺がん・・・相関関係○
コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関
交絡因子について
教科書P220-散布図
X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)とりあえず図にすると関係が直感的にわかる(場合がある)

相関係数
-1から1までの値をとるXが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0
X軸で見たときのバラツキ具合とY軸で見たときのバラツキ具合を元に計算してる
バラツキ=散布度・・・分散・・・偏差の二乗の平均
共分散=ある対象のX軸の偏差とY軸の偏差を乗じたものがベース
Xの偏差 | Yの偏差 | 乗じた結果 |
---|---|---|
+ | + | + |
+ | - | - |
- | + | - |
- | - | + |
共分散はX軸Y軸のバラツキ具合が混ざっているのでそのままの数字だと解釈しにくい→XとYの標準偏差で除する(正規化)→相関係数
平均値で相関係数を求める際にはご注意を


(医の共通科目(分担:研究におけるデータ収集と統計処理について))より
単相関係数の検定
P180-問13-1 例題7-4のデータより介入前と介入後の相関係数を求めよ(検定も行うこと)
回帰直線
X軸の値とY軸の値を数式(y=ax+b)で示す直線を引いたときにそれぞれの点からの差(残差)の2乗して足したもの(平方和)が最も小さい時の数式が回帰直線
単回帰分析
教科書P195回帰係数・・・Y=a+bXのb
決定係数・・・1に近いほど良好なモデル
決定係数
相関係数を二乗したもの数式によって説明できる割合を示す。(寄与率とも)
高ければ高いほど数式で説明出来る
傾きの推定
傾きの推定値が0を含まないと,その項の変数(独立変数)はy(従属変数)にどのような影響を与えているのか説明できる推定は計算機に
単回帰分析(t検定と信頼区間)作者: tonagai さん(ke!san)https://keisan.casio.jp/exec/user/1491997364
重回帰分析
教科書P223(回帰直線の話を思い出す→単回帰分析)
回帰・・・元に戻る・・・何らか(定理や関係)に基づき戻っていく
変数ごとに有意差検定を行っても他の変数の影響が含まれてしまう
予測モデル式としての話とどのような変数が影響を与えているのか
重回帰分析
Y=a+b1X1+b2x2+・・・ 目的変数・・・Y説明変数・・・Xi
偏回帰係数・・・bi
標準偏回帰係数 β* 目的変数と説明変数の関係を標準化したときの偏回帰係数・・・
目的変数は量的
説明変数は量的でも質的(0,1)でも
単回帰と同じく最小二乗法で求める
決定係数・・・説明変数を増やすと値は上昇 自由度調整済み決定係数・・・1-(1-R2)(n-1)/(n-k-1) n=標本数 k=独立変数
VIF 分散拡大要因
多重共線性を見つける指標多重共線性・・・独立変数が他の独立変数と相関がある・・・偏回帰係数の標準誤差増大
VIF=(1-Ri2)-1
Ri2:他の独立変数で重回帰させたときの決定係数
許容度:1-Ri2 目安としてVIFは10以下であること=許容度が0.10を超えていること
分散分析
回帰式による変動と残差(回帰式と実測の差)の変動が異なるのか示している異なると言えなければその回帰式は統計的に・・・
ロジスティック回帰モデル
目的変数を質的変量で重回帰分析できないのかな?という話(あり・なし)の結果を確率で
ロジット変換
事象の起こる確率をpとしたときその取るべき値は0~1のいずれか.

ロジット関数は,その確率の範囲を-∞~∞に拡張するもので logit(p)=ln(p)-ln(1-p)=ln(p/(1-p))で示される.


オッズを確率pで示すと
A/C=A/(A+C)/C/(A+C)=p/(1-p)
p=A/(A+C)であるが,その取りうる値は0~1.
pをロジット変換するとln(p)-ln(1-p)=ln(p/(1-p))
ln(p/(1-p))=a+b1X1+b2x2+・・・
exp(b)がオッズ比になる件
ln(p/(1-p))=a+b1x1+b2x2とした場合
上記は
(p/(1-p))=exp(a+b1x1+b2x2+・・・)
=exp(a)*exp(b1x1)*exp(b2x2)*・・・
exp(b2)が1よりも大きい場合オッズは上昇し,1未満であれば低下する
式を整理すると
exp(b2x2)=(p/(1-p))/exp(a+b1x1+・・・)
となりexp(b2)はオッズ比を示す
問13 以下の分析結果よりどのような因子が影響を受けているのか分析をした,どのような結果なのか示せ
データは以下のとおりである
