奈良県立医科大学 生物統計学2025
(医学部医学科)

オンデマンド講義第1回,2回講義分は期日(最終日2025年5月9日)迄に受講してください
【オンデマンド講義】受講【講義後記】視聴はこちらをクリックしてください

なお,各回の課題に対する補足説明なども上記のリンクのページに【講義後記】として追加していきますので,適宜閲覧いただき自己学修に役立ててください

2025年度開講にあたって
https://medbb.net/education/2025init/

なお,例年例題について回答が欲しいという声があるのですが,授業中に示しておりますのであらためて掲載はしておりません.
課題提出
課題提出のフォームはコチラから

提出期限は授業日の翌日の午前9時59分59(JST)秒迄とする
メールアドレスは所属機関で付与されているものを記入のこと(課題の内容は当該メール宛にコピーが送信されます)
(オンデマンドの講義は受講期間最終日の翌日の午前9時59分59秒(JST)迄になります.期限内の提出を以て出席とします)

授業の進め方

授業中は課題について廻りに相談せず各自で取り組んでください.不明点は私に質問してください.その内容をみなさんでシェア出来たらと思っています.

なぜ統計が必要なのか?

私たちはデータを取得して物事を判断し次の行動につなげている.
nmuhlthstat1_2024-0101.png(303517 byte)

授業メニュー



第01回【オンデマンド講義】科学と統計

第02回【オンデマンド講義】記述統計

第03回 推測統計(1)点推定(平均と分散)

第04回 推測統計(2)区間推定(正規分布)

第05回 推測統計(3)区間推定(t分布)

第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定

第07回 推測統計(5)パラメトリック検定(t検定)

第08回 推測統計(6)パラメトリック検定(ANOVA,有意確率補正法)

第09回 中間まとめ(小テスト)

第10回 推測統計(7)ノンパラメトリック検定,カイ二乗検定

第11回 相対リスク

第12回 ROC解析

第13回 相関係数,回帰分析

第14回 生存時間分析

第15回 まとめ

第01回 科学と統計

【GE-01-04-01】根拠に基づいた医療(EBM)の 5 つのステップを列挙できる
(教科書1章1,2)

科学

科学が日常生活を豊かにしていることは明らかであるものの,科学者の想いによらない使い方もされたり,世の中全てを科学で説明できない
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm
【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf
実証性
検討することのできる仮説が無いことには始まらない
再現性
同一の実験条件では同一の結果が得られる
客観性
多くの人々に承認される
chatGPTによる実証性に関する質問
「検討することのできる仮説とは」
ChatGPT3.5
検討することのできる仮説は、研究や分析の目的に基づいて多岐にわたります。仮説とは、観測された現象を説明するための仮定や推測であり、実験やデータ分析を通じて検証可能でなければなりません。(以下略)
「検討することが出来ない仮説とは」
ChatGPT3.5(纏めると)
検討することができない仮説にはいくつかの特徴があります。科学的な文脈で、仮説は観察や実験を通じて検証可能でなければなりません。
検討が難しい仮説の特徴
検証不可能,曖昧な定義,超自然的な要素,因果関係の証明が不可能,非現実的な条件

EBM

Evidence-Based Medicine
根拠に基づいた医療
「根拠」・・・科学的根拠と表現されているケースも多い・・・(経験則だけに基づかないようにという意味合いを込めてというところかな)

医療提供における「根拠」以外の要素

意思決定における3要素・・・根拠,価値観,資源
価値観は人によってさまざま
現有(もしくは調達可能な)資源で出来ることしかできない
医療資源
joho20140730-01.png(104237 byte)
不足の観点からみる医療2.0β より)
「根拠に基づく医療」(EBM)を理解しよう(厚生労働省eJIM(イージム「統合医療」情報発信サイト))
https://www.ejim.ncgg.go.jp/public/hint2/c03.html
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)
https://www.niph.go.jp/journal/data-49-4-j49-4/
1.問題の定式化
PICO
P(Patient)どのような患者さん(対象)なのか
I(Intervention)どのような介入を適用しようとしているのか
C(Comparison)介入しない場合(もしくは他の介入)と比較して
O(Outcome)どのような結果になるのだろうか
2.問題についての情報収集
掲げた問題に相当するような情報(世の中にある研究論文など)を探す
3.情報の批判的吟味
情報そのものがどの程度信頼出来るのか,効果があるのか.
4.情報の患者への適用
今回の患者さんと情報で得られた患者像を同じと見做し適用して良いか,問題あるのか
5.1~4 のstepの振り返り
研究の場合もPICO/PECO(E(Exposure) 治療などの介入ではなく曝露)で整理し目的を明確化します.
EBMはある患者さんに医療を適用するために情報を検索という流れですが,研究はある仮説を明らかにするために目的を明確化してデータ収集・分析となります.
南郷栄秀,Evidence-based medicine:診療現場でのプロブレムの解決法 日内会誌 106:2545~2551,2017
https://www.jstage.jst.go.jp/article/naika/106/12/106_2545/_article/-char/ja/
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)

EBMの5ステップと意思決定の3要素

EBM1~3ステップが根拠の部分
根拠とする情報に実証性と再現性と客観性があったほうが良いというところは理解できるかと(つまり科学としての基本的な条件を満たしている方が良いだろう)
研究の方法によって,グレードが変わるのはそれらの要素が方法によって異なってくるので
ステップ4においては価値観と資源を含めた形となる
提出課題
1:根拠に基づかない医療とはどのようなものかお考えを示してください(短文で)

第02回 記述統計(1)尺度,度数,代表値

【SO-02-03-01】尺度(間隔、比、順序、名義)について説明できる。
(教科書2章1)
nmubiostat202102-02.png(396280 byte)

統計に用いるデータ

基本どのようなデータでも統計処理は出来る
出来ないのは,どのようなデータであっても一つしか存在しない時

データについて

レコード
症例,個体,被験者単位でまとめられたデータの塊.表の場合一行にその症例のすべてのデータを記していたらそれがレコード
変数(変量)
データの項目名のこと
データ
観測値や測定値のこと(数値)だけでなく性別など文字の場合もある.
コンピュータ処理するとき,文字だと扱いにくい時があるのでその時は数字に置き換える(→コード変換)
例えば都道府県名であれば 北海道→01 青森県→02 奈良県→29
全国地方公共団体コードの上二桁=都道府県番号
<参考>全国地方公共団体コード(総務省)
https://www.soumu.go.jp/denshijiti/code.html
都道府県番号の順序を用いて説明する事柄は存在しない.一方,文字で順列の存在するもの(松 竹 梅)はその法則にしたがった番号を振ることがあるので注意

変量(データ)の分類

変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)(比率)

1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
nmuhlthstat1_2024-0103.png(363067 byte)

記述統計量(度数)

取りまとめたものを「量で」示したもの.質的変数であっても度数(個数,人数など数えるもの)については「量」として示すことが出来る
どのようなデータでも度数を示すことは可能

度数分布表

この授業では量的変量の度数分布表を作成する場合 A~B は A以上B未満として取り扱う
  それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
店名 度数 相対度数 累積度数 累積相対度数
 
 
 
 
  1.00
1.00 ----- -----

量的変数の度数分布表

量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.
血圧 163.5mmHg 164.2mmHg 162.5mmHg・・・どれも度数を積み上げられない → 区間を設定する
「A~B」は「A以上B未満」と読む格好と思っていたが,分野などによって違うようです
「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように.
本授業(ミニテスト試験など全て含む)においては,「A~B」は「A以上B未満」として取り扱う
階級 階級値 度数 相対度数 累積度数 累積相対度数
130~140 135
140~150 145
150~160 155
160~170 165
170~180 175
----- -----

度数分布図

質的変数・・・縦棒グラフ
nmuhimstat2021-01.png(3771 byte)
量的変数・・・ヒストグラム
nmuhimstat2021-02.png(3656 byte)
棒の間隔が無いのは値が連続している状態であるが故
普通の棒グラフは棒の長さが度数を示すが,ヒストグラムは棒の面積が度数を示す
「階級の幅を等しくすること」と説明している場合があるが,それは幅が変わると高さが変わる故で,実際にはそのような区間設定はよくある
以下の参考資料に区間幅の異なるヒストグラムについても説明なされているのでよろしければごらんください
ヒストグラムーなるほど統計学園(総務省統計局)
https://www.stat.go.jp/naruhodo/4_graph/shokyu/histogram.html

記述統計量(代表値)

その集団を代表する値
代表値と散布度からなる.←駅伝やマラソンの実況中継はこれらを利用しているから状況がわかる

平均(Mean)

算術平均
いわゆる割り勘.xbar=1/n(x1+x2+・・・+xn)
欠点:外れ値があると平均値は分布の中心位置を示さない(←それって代表的な値??)
 → 対処法:外れ値を取り除くか中央値を使うか
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる
加重平均
重みづけ平均
例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの?
度数分布表を用いて算術平均を求めることもできる(個票データの算術平均とほぼ同じ)・・・Σ(階級値×階級の度数)/n

中央値

昇順に並べたときに,真ん中の順番のデータ(変数)の値
データの数が偶数だと真ん中のデータは二つになるのでそれらの平均値

最頻値

最も個数が多いデータの値
最頻値は複数存在する場合がある→二峰性

最大値,最小値

例えばある期間のピークの値を扱うケースもある

記述統計量(散布度(範囲))

範囲

最大値と最小値の差

四分位範囲

順序尺度の性質を用いた散布度
小さい順(昇順)に並べて集団を4等分
分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3)
また第1四分位数は25%タイル値,第2四分位数=中央値=50%タイル値,第3四分位数=75%タイル値とも呼ばれます
大きい方が第3四分位数なのですが,間違える方も一定数いますが100%タイル値=最大値ということを理解していたら大丈夫でしょう
四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の算出方法は数多くあります
高校数学で習われたものは文部科学省が推奨した方式で,高校数学以外では見掛けない方法です.
一番わかりやすい四分位数の出し方はヒンジ値
nmubiostat2024-0301.png(438054 byte)
以下のブログを見ていただくと数種類出来てしまうのも頷けるかと思います
ダンゴ包丁理論(tukeyのヒンジ)(Medbb's blog)
https://medbb.hatenablog.com/entry/2020/12/12/091240
考え方としては理解しやすいと思いますがtukeyのヒンジとは少し値が異なるケースもでてくるのでご注意ください

<参考>四分位数の定義(奥村 晴彦 (Haruhiko Okumura))
https://okumuralab.org/~okumura/stat/quartile.html
<参考>■四分位数の定義-教科書の内容に関するQ&A(数研通信(78号)数研出版)
https://www.chart.co.jp/subject/sugaku/suken_tsushin/78/78-10.pdf

箱ひげ図
四分位範囲をグラフ化
nmuhimstat2021-09.png(8898 byte)

記述統計量(散布度(偏差))

「偏差」とはある点と基準点とのズレをさす
「偏差」とだけ記述されてると基準点は平均値として捉えられるケースが多い

四分位偏差

順序尺度の性質を用いた散布度
QD(quartile deviation)=IQR/2=(Q3-Q1)/2
四分位範囲を2で割ると求められるが,意味的には第3四分位数と第2四分位数の偏差と第2四分位数と第1四分位数の偏差の算術平均
QD=((Q3-Q2)+(Q2-Q1))/2=(Q3-Q1)/2

(平均値との)偏差

集団の平均値と個々の値の偏差を求めその平均をとることでその集団のバラツキ具合を算出

分散

量的変量の性質を用いた散布度
平均値から求めた偏差の平均は常に0になってしまう
平均値から求めた偏差の絶対値平均を求めるのは面倒.(近年PCを使えば簡単だが)
分散は偏差平方の算術平均
nmubiostat2016-0302.png(3064 byte)
利点は,偏差を基にした散布度を算出できること
欠点は,求めた散布度の単位が二乗した格好になっている

標準偏差

分散の正の平方根を求めたもの
利点:対象とする集団のデータや平均値と同じ単位になっている.
欠点:あくまでも平方根を用いて求めているので注意する点がある
(分散と標準偏差は線形の関係に無い)
nmubiostat2024-0302.png(144702 byte)
提出課題
1:度数分布表から求めた平均値と個票データから求めた平均は最大どの程度異なるのか.「量的変数の度数分布表」で示した血圧の度数分布表を用いた場合最大どの程度異なるのか求めよ(±〇mmHg の○の数値のみ記せ)
2:平均値が中央値よりも大きくなる集団がある.値の分布はどのようになっているか簡潔に説明せよ

第03回 推測統計(1)点推定(平均と分散)

(教科書2章1)
偏った推定はよろしくない(あたらないから)
特に,計算の過程で偏ってしまうとかなりよろしくない

推定することについて

記述統計では,対象とする集団そのものの可視化が目的
推測統計では,対象とする集団は全体の中の一部(サンプル)という捉え方で,サンプルから全体像を推し測ることを目的
世の中で全てを把握するというのはかなり難しい

国勢調査

日本全国に住んでいられる方を対象にした静態調査
かなりコストをかけているが,それでも100%の回収率は難しい
<参考>
令和2年国勢調査の概要(総務省統計局)
https://www.stat.go.jp/data/kokusei/2020/gaiyou.html
2020年国勢調査の回答状況における都市-農村格差(*山本 涼子, 埴淵 知哉, 山内 昌和 2021年度日本地理学会春季学術大会要旨集)
https://www.jstage.jst.go.jp/article/ajg/2021s/0/2021s_30/_article/-char/ja/

点推定はあたらない

針の穴に糸をとおすような話

記号について

推定の話になると記号の取り扱いで混乱するのでここで整理しておきます.
分かりやすさを優先して整理したので,皆さんの使っている教科書などの表記は<参考>の論文を確認し読み替えください
μ・・・集団全体(母集団)の算術平均=母平均
σ^2・・・集団全体(母集団)の分散=母分散
σ・・・集団全体(母集団)の標準偏差=母標準偏差

xbar・・・集団の一部(標本)の算術平均=標本平均=母平均の不偏推定量
s^2・・・集団の一部(標本)より求めた母集団の分散の推定量=不偏分散(母分散の不偏推定量)
s・・・集団の一部(標本)より求めた不偏分散よりもとめた標準偏差=母標準偏差の推定量
medbbstat2023-0302.png(435647 byte)

参考
統計学テキストの「分散」の表記に関する調査(札幌学院大学総合研究所紀要 巻 1, p. 1-10, 発行日 2014-03-31)
https://sgul.repo.nii.ac.jp/records/1807

母集団と標本

母集団

対象としている集団の全体のこと
無限母集団と有限母集団がある

標本

対象としている集団の一部
偏ってしまうことに注意
例)森で取れた昆虫の標本を作成する際、どうしても森全体の昆虫の分布から偏ってしまう

取り扱う標本について

母集団は20000人の収縮期血圧データ(整数)

母集団のヒストグラム

medbbstat2022-0207.png(5259 byte)
その集団の一部を抽出したものが標本
<注意>上記のデータはサイコロの目が均等にでるのと同様に以下のように収縮期血圧データは110から140まで均等に出現しています.
実際にある集団に対して収縮期血圧を測定するとその血圧データの分布はそのような形になりません
諸々の事情(説明を理解しやすく)を含めて設定したのですが実際とは異なる振る舞いをしているであろうことだけ承知しておいてください.
medbbstat2022-0208.png(122886 byte)
日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)(https://mhlw-grants.niph.go.jp/project/23935)を加工して作成

<参考>日本人の健康・栄養状態のモニタリングを目的とした国民健康・栄養調査のあり方に関する研究(厚生労働科学研究成果データベース)
https://mhlw-grants.niph.go.jp/project/23935
の平成24年度~26年度 総合研究報告書のP108図1の部分を取り出して加工したものが上記になります
https://mhlw-grants.niph.go.jp/system/files/2014/143031/201412017B/201412017B0006.pdf

母平均の点推定

得られた標本より求めた平均をそのまま母集団の推定値とする
例題3-1)
以下の標本より母集団の平均値(母平均)を推定せよ
ocrotstat2023-0501.png(3372 byte)
利点
計算が容易
平均値の場合,計算式が母集団全体の値を求める時と標本から推定する時と同じで良い
欠点
必ずしも推定値が実際と一致するわけではない・・・むしろ外れて当然
サンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム
medbbstat2022-0202.png(96791 byte)
ピッタシ一致するのはサンプルサイズ10の時で1.1%(98.9%はハズレ)
推定の精度を上げるためには
ohsustat2016-01a.png(206456 byte)
標本数を大きくすればよい・・・測定を繰り返して行いその平均をとると精度は上がる
サンプルサイズを100にした時の(母集団から200の標本が作成できる)のヒストグラム
medbbstat2023-0301.png(103401 byte)
精度は上がるものの,ピッタシ一致する確率も上がるとは限らない
例題3-2
結局一つの値で示す点推定はなかなかピッタシ一致しない.ならば幅を持たせた区間推定は最大何パーセントまであてることが可能か?

母分散の点推定

母分散の推定は一味違う
例題3-3)
例題3-1)のデータと例題3-1)で求めた母平均の推定値との偏差を求め,偏差和(全て足し合わすこと)を求めよ.そして偏差平方和も求めよ
例題3-1)のデータと私だけが知っている母平均(125.0)との偏差を求め,偏差和を求めよ.そして偏差平方和も求め,それぞれ比較せよ

標本の平均を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

medbbstat2022-0203.png(135831 byte)
低めの値が多くなる傾向で偏っている.

母集団の平均(本来知る由もない)を用いサンプルサイズ10の時(母集団から2000の標本が作成できる)のヒストグラム

medbbstat2022-0204.png(137439 byte)
偏った推定にならないものの,本来知る由もない母平均を使えるわけがない(そもそも母数知っているなら推定は不要でしょう)

不偏分散

標本の平均を用いて母分散の推定を行う.
母平均と標本平均は(ほぼ)異なるので,母平均と標本平均の差も考慮して分散を求めたもの
(無論母平均は分からないが母平均と標本平均の差を考慮している)
s^2=Σ(Xi-Xbar)^2/(n-1)
nで除するよりn-1で除したほうが,値が大きくなるのは当然なので,低めの値が出るのなら少し分母を小さくした方が大きくなるのは理解できるが(ケーキを3人で分けるのか4人で分けるのか)なぜ1引くだけ??となると思います
medbbstat2022-0205.png(146106 byte)
<参考> 不偏分散は何故nではなく(n-1)で除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#VAR

例題3-4
例題3-1)のデータより母集団全体の平均値および分散と標準偏差の推定値を求めよ

不偏分散より求めた標準偏差は不偏推定量なのだろうか?

上記の不偏分散のヒストグラムを標準偏差にして作成したもの
medbbstat2023-b05.png(160341 byte)
<参考>不偏分散の正の平方根は不偏標準偏差でよろしいのか(よろしくない)(Medbb's blog)
https://medbb.hatenablog.com/entry/2024/01/09/232914

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

課題のフォロー

標本の平均との偏差より求めた偏差平方和が一番小さくなる話(故に分散の値も一番小さくなる)
nmuhlthstat1_2024-0402.png(306611 byte)
nmuhlthstat1_2024-0403.png(210072 byte)

第04回 推測統計(2)区間推定(正規分布)

【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。
(教科書2章1,2,3)

母集団の平均値の区間推定に向けて点推定により分かったこと

1)母集団の平均値の点推定値はほぼ一致しない(あたらない)
2)母集団の平均値の点推定値は標本数(サンプルサイズ)が大きいほど母集団の平均との外れ方が小さくなる
3)母集団の平均値を区間で推定する際に基準となる値は,標本から求めた点推定値しか見当たらない
4)母集団の平均値の区間推定では点推定と異なり100%一致させることが可能である

追加して

5)母集団の分散の点推定値は標本数(サンプルサイズ)が大きいほど母集団の分散との外れ方が小さくなる
nmuhlthstat1_2024-0401.png(113744 byte)

母集団の平均値の区間推定の考え方

区間を推定するにあたっての基準を点推定値を基準とし,区間を推定するにあたってどのような確率で標本方求めた平均値が出現するのか仮定したうえで行う
この授業回では出現する確率の分布に正規分布を用いる

正規分布

偶然誤差の分布と呼ばれる(精度の善し悪し→偶然誤差大きいか小さいか)
精度を向上させるには測定回数を増やしその平均をとれば良い(誤差は小さくなる)

標準正規分布

平均値が0標準偏差=1(分散も1)になるように値を変換したもの
それをZ値という・・・標準正規分布表の行と列から求める値の事
偏差値は平均値を50、標準偏差=10になるように値を変換したもの
それを偏差値という
例題4-1
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.その時のZ値および偏差値を求めよ
標準正規分布表
正規分布を平均値が0標準偏差=1(分散も1)になるように値を変換したもの
それをZ値という・・・標準正規分布表の行と列から求める値の事
kuswepi2021-01.png(339177 byte)
標準正規分布表のPDF版はコチラから
例題4-2
平均値が75点の集団がある.標準偏差は5点だった.
そこで82点を取った人がいる.点数の分布が正規分布に従うと仮定して受験者が10000人だった場合上位何番目に相当するか求めよ

中心極限定理

サンプル数が多ければその標本の平均の分布は正規分布になる
 →正しく測定されているのであれば偶然誤差の発生は正規分布に従う
 →測定回数を増やせば増やすほど

注) 普段の実験などでは,数回測定を行いその平均値を結果とするだけ(のはずなので)ピンとこない
以下は100面体のサイコロを作り1回試行した値を結果とし1万回行ったものから,試行回数を2回,3回と増やしその平均値を結果としたヒストグラムの変化を示したものである

標準誤差

・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
ここでは,なぜ√nになるのか説明しないが,少なくともサンプルサイズが大きいほど標本平均のバラツキ具合が小さくなっていくことは理解できると思う
どうしても という方は以下のリンクご覧ください.
<参考>標準誤差SEはなぜ標準偏差σを√nで除するのか(生物統計学2018奈良医大)
https://medbb.net/education/nmubiostat2018/index.html#SE

平均値の区間推定のイメージ

nmuhlthstat1_2024-0501.png(335658 byte)
medbbstat2022-0212.png(178634 byte)

標本を基に母集団の平均(母平均)を95%信頼区間で求める

ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=18点であることがわかっている.
受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ
medbbstat2023-0401.png(429461 byte)
例題4-3
全国で8000人を対象に模試を実施した.本学(115人)の平均値は424点,不偏分散より求めた標準偏差は20点だった.
全国の模試の平均点を本学の点を元に95%信頼区間で推定せよ

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

第05回 推測統計(3)区間推定(t分布)

【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。
(教科書3章2標本平均の理論分布と標準誤差(SE),教科書4章1正規分布とt分布の違い,2)
例題5-1
以下のデータは20000人の血圧データからサンプルサイズ16で抽出したグループ(20)よりそれぞれ母平均の区間推定を行ったものである
標準正規分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ
nmubiostat2025-0501.png(54338 byte)
個票データは以下からダウンロード可能です
nmubiostat2025-0501utf8.csv
<参考>
ohsustat2020-0108.png(321674 byte)

t分布による区間推定

母集団の平均値を推定するにおいて,標準正規分布を使うと上手くいかないケースがある・・・特に標本数が少ないと
困っていたゴセットさんが標本数によって平均値の出現する確率が変化する分布を示しました.
諸々の理由でt分布と呼ばれています.
<参考> 酒井 弘憲,ギネスビールと統計家ペンネーム スチューデント,ファルマシア51巻12号,2015
https://www.jstage.jst.go.jp/article/faruawpsj/51/12/51_1168/_article/-char/ja

t分布

t分布は標準正規分布と同様に,標本より求めた母標準偏差の推定値(不偏分散に基づく標準偏差)を用いるが,標本の自由度(サンプルサイズより求める)によって変化する.
サンプルサイズが大きくなるとt分布は正規分布に近似されていく.
nmuhims2022-01.png(169858 byte)
t分布のPDF版はコチラから

「自由度」νが出てきますが,以下考え方

標本の中で自由に振る舞うことが許されている値の数
例えば標本から統計量を求めたとき,母数の推定値とするなど確定すると自由に振る舞えない値が出てくる(つじつま合わせ)
t分布は抽出した標本数を基にしたものなので,正規分布のように一義的なものでは無く,標本数(自由度)によって確率分布が変わる
統計の話をするときに「t」という話が良く出てくるわけですが,正規分布との関係は良く整理しておいてください
なお大文字の「T」とみると某ポイントカードを思い浮かべる方が多いのかな(今は別のアルファベットになりましたが)
関西において「T」は「浪速の轟砲」を指すのでご注意ください

例題5-2
例題5-1のデータを用いてt分布を用いてそれぞれのグループより95%信頼区間で推定し,私しか知らない母平均と比較が含まれているか確認せよ
例題5-1の結果と5-2の結果を比較せよ
nmubiostat2025-0502.png(55414 byte)

例題5-3
5-1のデータを用いてt分布を用いて不偏分散ではなく標本自身の分散を用いて95%信頼区間で推定し,し,私しか知らない母平均と比較が含まれているか確認せよ
nmubiostat2025-0503.png(73308 byte)

例題5-4 自由度が∞の時のt分布の95%信頼区間は正規分布と同じであるが自由度νが13の時,正規分布の何パーセント信頼区間に相当するのか?

提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

課題のフォロー

tの由来

t検定(調査・統計用語集 日経リサーチ)
https://service.nikkei-r.co.jp/glossary/t-test

第06回 推測統計(4)母比率の区間推定(二項分布と正規分布),仮説検定

【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。
【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
(教科書7章1母比率の信頼区間の推定,3章検定の原理)

比と率と割合

疫学分野は集団の数を数える(頻度)ことがベースとなる分野
無論比と率と割合は頻度以外のものでも使っている

割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比
変化を表す指標
死亡率
ある集団において期間中に罹患した人数をその時間で割る

二項分布

ある事象が起こる確率が既知の時,試行回数に対して出現度数別の確率を求めたもの
出現度数r=試行回数n×事象の起こる確率p
n回施行すると出現度数rは期待値になることが期待されるが,期待以外の度数になることもある(むしろ当たらない方が多いのでは?)
PrnCr×pr×(1-p)n-r
P(r)=nCr*p^r*(1-p)^(n-r)
例題6-1
2/3の確率でタコが入っているたこ・ラジオ焼きセットがあったとする(タコの入手が困難なので不足を牛スジ肉で代用している)
12個入りのたこ・ラジオ焼きセットを買った場合たこ入りたこ焼きが10個以上になる確率を求めよ
nmubiostat2024-0501.png(253039 byte)
nmubiostat2024-0502.png(102653 byte)

<参考>
たこ焼きのはじまり(大阪たこ焼マーケット)
https://takoyakimarket.com/history.html

例題6-1では10個以上(10,11,12個)の確率を累積したもので累積確率と呼ばれます.
例題6-2
例題6-1の計算結果を用いて95%信頼区間を求めよ

二項分布と正規分布

二項分布のnが大きければ正規分布に近似する(μ=np σ^2=np(1-p))
nmubiostat2024-0503.png(223051 byte)
nmubiostat2024-0504.png(117802 byte)

μ=np

σ^2=np(1-p)

<参考>
二項分布と母比率の区間推定【中学の数学からはじめる統計検定2級講座第10回】(とけたろうブログ)
https://toketarou.com/binomial/

例題6-3
船員保険加入者の特定健康診査の対象者と受診者はそれぞれ42903人,22413人だった.
正規分布を用いて全国の特定健康診査の受診率を95%信頼区間で推定せよ.

<参考>
2022年度 特定健康診査・特定保健指導の実施状況(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/newpage_00045.html
第2期奈良県医療費適正化計画の実績に関する評価(奈良県)
https://www.pref.nara.jp/secure/224873/第2期奈良県医療費適正化計画の実績に関する評価.pdf
奈良県のすがた2024-グラフと解説で見る統計ガイド-(奈良県政策推進課)
https://www.pref.nara.jp/26049.htm
https://www.pref.nara.jp/dd.aspx?moduleid=19736&pfromid=4

仮説検定

仮説検定はなぜ必要なのだろうか?

その仮説が科学に基づいたものであることを統計手法を用いて証明したいから
例題6-4
科学的に証明されたものは100%正しいと言ってよいのだろうか?

検定(有意差検定)と推定の違い

推定
orcstat2020-0602.png(11589 byte)
検定
orcstat2020-0603.png(12754 byte)

科学と統計(一部再掲)

初回の講義をを思い出していただいたら良いかなと思いますが,以下抜粋
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)より
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。

実証性

「考えられた仮説」が無いことには始まらない→仮説検証型
それでは「考えられていない仮説」とは?
→まだ十分に確固たる仮説として成立していない仮説
仮説検証型と仮説探索型
仮説探索型とは「考えられた仮説」が存在せず(関心ある事象など),得られた結果は「考えられた仮説」になる可能性を有するが,その段階では「考えられたと言えない仮説」

再現性

仮説を実証するために得られたデータから複数回,同一の検証結果になること
例題6-4
再現性は本来「未来永劫」だと思うが,なぜ「複数回」同一の検証結果になることとしているのか

判定基準

「同一の結果」が100%の確率で出現しないことを示しておく必要が出てくる
→そうなると,確率に基づく基準で判定しないことには,再現性を満たすことが出来ない
故に仮説検定は確率に基づいて行う

「確率」⇔「実空間での違い」

区間推定では,ある確率分布による確率(例えば95%)を統計指標(標準正規分布ならz値)に置き換えてから,実空間での対象とする事柄に置き換えて信頼区間を求めている
仮説検定では,実空間で対象とする事柄の違いを求めてから,確率分布における統計指標に置き換えて確率を求めている
違いを評価するために効果量(どの程度の違いを違うと判定するか)で決定しても,その確率は変わってしまう→区間推定で経験してみましょう
例題6-5
ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点であった.なお母標準偏差は=10点であることがわかっている.
受験者全員(=母集団)の平均値の区間推定を信頼区間95%で示せ(以前の授業での説明用の問題の数値を変えたもの)

区間推定と仮説検定の相反する部分

区間推定は区間内に求めているものがある(含まれている ことを祈っている)
仮説検定は区間外に求めているものがある(含まれていないことを祈っている)

背理法

命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法
違いがあることを証明するにあたって「違いが無いことを」を証明できないことを根拠にする
仮説検定を背理法に基づいて行う理由
仮説検定を行う動機は,これまでの世界の科学的な常識とは異なる新たな知見を証明することにある
これまでの世界の科学的な常識は繰り返し用いられてきた.
新たな知見はこれまでの科学的な常識を否定しなくてはならない
つまり,従来の手技,薬剤と同じように新しい手技,薬剤を用いた時に再現性がみられなかったら,それは従来の常識を覆すものであると判定して証明する論法
無論,前提として「考えられた仮説があること」(ぼくのかんがえたさいきょうの説だとダメ)

例題6-6
「ぼくのかんがえたさいきょうの説」に基づき仮説検定を行い,その説が従来の常識を覆すものと仮説検定の結果判定された場合,なにがいけないのか述べよ

例題6-7
「考えられた仮説があること」に基づき仮説検定を行い,その説が従来の常識と変わらないものと仮説検定の結果判定された場合,不都合なことがあるのか述べよ

統計的有意差と臨床的有意差

得られたデータに基づき計算した確率が判定基準を下回った時に統計的有意差があると言います.
知見は社会実装することで人類に貢献できますが,医療現場においては臨床的に意味があるとされる量を基準とする臨床的有意差が結果として求められます
無論社会で役立てていく知見としては,統計的有意差よりも臨床的有意差が重要になりますが,「科学的」な観点からは前者が支配的になります.
確率の違いを量で示すとき,その量はサンプルサイズにより変化します.故に臨床的有意差に基づきサンプルサイズを決定することで二つの違いを解消できます
例えば臨床的有意差が統計的有意差よりも大きい場合は再現性については確認できたものの臨床的な観点から確認はできません.統計科学的に良いが,医科学的には?という結果になります
一般にはサンプルサイズが大きいほど,精度の高い結果が得られるので良いという感覚のはすですが,それは区間推定の話で仮説検定において効果量の差を検証する場合は少し状況が異なります
提出課題
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)1:

課題提出フォーム