奈良県立医科大学　保健統計学I２０２２
（医学部看護学科）

オンライン開講の場合は，teamsで実施します．
g_保健統計学2022の授業配信チャンネル内に【保健統計学2022オンライン講義室】にアクセスしてください．
ワンクリックで入室する場合は【保健統計学2022オンライン講義室】をクリックしてください．
出欠は対面講義の場合は出欠システム（学生証）で，オンラインの場合は授業内で確認します．

授業メニュー

ハイブリッド形式での授業になります．
第01回FTF　記述統計（１）尺度とデータ形式，度数分布，ヒストグラム

第02回CMC　記述統計（２）代表値・散布度・箱ひげ図

第03回FTF　推測統計（１）平均値の推定

第04回CMC　推測統計（２）平均値の検定

第05回CMC　人口統計

第06回FTF　死因統計

第07回CMC　疾病統計

第08回CMC　まとめ

第01回CMC　記述統計（１）尺度・度数分布・ヒストグラム

到達目標
１－１　４つの尺度について説明できる
１－２　度数分布表を作成できる

教科書１）P2-P8,P16-23,P37

統計に用いるデータ

集団から個々のデータをとりまとめて示すので・・・
nmucommed2017-01.png(276444 byte)

（奈良県立医科大学大学院看護学研究科　地域医療学（分担：データ分析編）　より）
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある（細かい場合は粗くできるが粗いものは推定するしかない）
医療情報学の分野は二次利用がテーマ

記述統計と推測統計

記述統計とは

・収集したデータを要約してその集団の状況を表す
・そこにあるデータは全体（母集団）
・度数（分布）・代表値・散布度・相関係数など

推測統計とは

事象の起こる確率を仮定した上で全体（過去・現在だけではなく未来も含む）を推測する。推定と検定に分類される。

推定とは

・収集したデータを基にしてその集団の状況を表す
・そこにあるデータは一部（標本）
・点推定・区間推定・モデリング

検定とは

・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する
・そこにあるデータは一部（標本）
・t検定・カイ二乗検定など

母集団と標本

母集団とは

対象としている集団の全体を指し示すときに「母」を最初に付ける。
無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い

標本とは

母集団の一部。
昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。

参考

標本調査はサンプル抽出が命（The Huffington Post Japan）
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html

変量(データ)の分類

変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である
１分類尺度（名義尺度）
２順序尺度
３間隔尺度
４比尺度（比例）

１，２を質的変量（定性的）
３，４を量的変量（定量的）
性質としては上位互換性があり
４＞３＞２＞１

教科書は間隔尺度及び比尺度に関して統計処理上区別する意味は無いとなっているが、注意は必要
ポイントは数学的には正しかったとしても意味的に正しいかどうか

度数分布表

それぞれのデータ（変量）の数（出現頻度）をまとめたもの
変量が名義尺度の時は多い順（お作法として。但しその他を出すなら一番最後）
順序尺度以降であれば順（名義尺度でも比較のためにお作法を破ることはある）
度数　　・・・出現頻度
相対度数・・・総出現頻度を1（100%）としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版

品名	度数	相対度数	累積度数	累積相対度数
いちご	１５
みかん	８
ぶどう	７
計	３０	１．００	-----	-----

こちらの度数分布表も空欄埋めてください

品名	度数	相対度数	累積度数	累積相対度数
かつ丼	９０
カレーライス		０．３		０．７５
ラーメン
計		１．００	-----	-----

度数分布図

度数分布表をグラフ化したもの
縦棒グラフだが量的変量に限っては「ヒストグラム」その棒の部分の面積が度数を示している
＜余談＞
図にするときには色々なお作法があります

課題

１）都道府県別の新型コロナウイルス感染症に関する指標を探して近畿，もしくは関西の府県について度数分布表を作成せよ．
＜参考＞
地域ごとの感染状況等の公表について（新型コロナウイルス感染症について）（厚生労働省）
https://www.mhlw.go.jp/stf/seisakunitsuite/newpage_00016.html
「関西」と「近畿」　何が違う？（NIKKEI STYLE）
https://style.nikkei.com/article/DGXNASJB2000S_Q1A021C1AA2P00/

補足

第02回CMC　記述統計（２）代表値・散布度・箱ひげ図

到達目標
２－１　代表値の算出及び特性について説明できる
２－２　散布度の算出及び特性について説明できる

教科書１）P24-43

代表値

average（その集団でとりまとめたデータを数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています）

算術平均

mean（算術平均以外にも相乗平均（積して累乗根をとる）などもあります）
1/n・Σx_i
パレートの法則（80-20の法則）
代表値なのに実在しない場合がある　→　集団の指標（重心）であって、事象を代表する値そのものを示しているとは限らない

幾何平均（相乗平均）

中央値

median（別名第２四分位数）
量的変量を順序尺度で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値

最頻値

mode（流行，はやり）
違う意味で数の理論（多数決）の世界
量的変量を名義尺度で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記

散布度

dispersion

最大値と最小値を使う

最大値と最小値がわかればその集団のバラツキがわかる
最大値maximum excel max関数
最小値minimum excel min関数

範囲

Range
R=最大値－最小値

特徴
　外れ値もひらう
　算出が用意

四分位範囲

小さい順（昇順）に並べて集団を4分割
分割する所の値を小さい方から第１四分位数（Q1），第２四分位数（Q2）＝中央値，第３四分位数（Q3）四分位範囲IQR(interquartile range)=Q3-Q1

四分位数の話

四分位数は出し方が何種類かありますが，基本的な考え方はtukeyの上ヒンジ　下ヒンジの話が一番理解しやすいのかなと思います．（教育指導要領とは違いますが）

小さい順（昇順）に並べて集団を4分割
注意：順序の話とその順位のラベル（数値）をこんがらがってしまわないように
例：テストの点　１６，５，１２，１６，１３，１５，１５，１８，２０，１０，２０
昇順に並べて順位（カッコ書き）をつける５（１），１０（２），１２（３），１３（４），１５（５），１５（６），１６（７），１６（８），１８（９），２０（１０），２０（１１）
n数（１１）を４で割る
第１四分位数・・・１／４の順位・・・１１／４×１＝２．７５個に分割する場所に相当する数値
第２四分位数・・・２／４の順位・・・１１／４×２＝５．５個に分割する場所に相当する数値
第３四分位数・・・３／４の順位・・・１１／４×３＝８．２５個に分割する場所に相当する数値

２．７５個に分割した場所の出し方
＋１／４番目の数値＝３番目＝１２

５．５個に分割した場所の出し方
＋２／４番目の数値＝６番目＝１５

８．２５個に分割した場所の出し方
＋３／４番目の数値＝９番目＝１８

ダンゴ包丁理論（tukeyのヒンジ）
https://medbb.hatenablog.com/entry/2020/12/12/091240
nmuhlthstat202102-01.png(21147 byte)

団子を4等分した時にどのダンゴに包丁を入れたか．

箱ひげ図

四分位範囲をグラフ化
nmuhimstat2021-09.png(8898 byte)

平均値を使う

mean

偏差

Deviation
もともとは標準となる数値からのズレ（偏り）を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる　→　合計は常に０　故に平均も常に０

分散

variance
V　excel関数はVAR
偏差を二乗したものの平均

標準偏差

Standard Deviation
記号は標本標準偏差s　母標準偏差σ
s=√V
（故にVはs^2やσ^2で表現する）
nmubiostat2016-0302.png(3064 byte)

課題

上記のデータの拡張期血圧のデータを用いて
１）平均値を求めよ
２）中央値を求めよ
３）最頻値を求めよ
４）範囲を求めよ
５）四分位範囲を求めよ
６）標準偏差を求めよ
７）度数分布表を作成し，表より平均値を概算せよ

階級	階級値	相対度数	累積度数
70～80	75
80～90	85
90～100	95
100～110	105
計		-----	-----

補足

第03回FTF　推測統計（１）平均値の推定

到達目標
３－１標準偏差と標準誤差の違いを説明できる
３－２母分散が未知の場合でも母平均を区間推定できる

教科書１）P90-98，P88,P67-70

推定

母集団から抽出した標本を基に母集団の分布を示す値（母数）を推測する
点推定と区間推定がある

点推定

一つの値で推定
母平均の推定値は標本平均
母分散の推定値は不偏分散
教科書P90-91参照

不偏分散は何故nではなく（n-1）で除するのか

求める対象（標本）が母集団全体だったとすると母分散は
（1/ｎ）Σ（ｘ_ｉ-ｘ_ｂａｒ）^２
　　しかしながら対象が母集団の一部であれば，母平均（μ）＝標本平均（ｘ_ｂａｒ）とは限らないので，
　　μとｘ_ｂａｒの差を考慮して母分散を求める（推定する）必要がある
（1/ｎ）Σ（（ｘ_ｉ-μ）-（ｘ_ｂａｒ-μ））^２
＝（1/ｎ）Σ（ｘ_ｉ-μ）^２-（2/n）Σ（ｘ_ｉｘ_ｂａｒ-ｘ_ｉμ-μｘ_ｂａｒ+μ^２）+（1/ｎ）Σ（ｘ_ｂａｒ-μ）^２
＝（1/ｎ）Σ（ｘ_ｉ-μ）^２-2（ｘ_ｂａｒ^２-2μｘ_ｂａｒ+μ^２）+（ｘ_ｂａｒ-μ）^２
＝（1/ｎ）Σ（ｘ_ｉ-μ）^２-2（ｘ_ｂａｒ-μ）^２+（ｘ_ｂａｒ-μ）^２
＝（1/ｎ）Σ（ｘ_ｉ-μ）^２-（ｘ_ｂａｒ-μ）^２
　-----
　ここで　それぞれ
　（1/ｎ）Σ（ｘ_ｉ-μ）^２＝σ^２
　（ｘ_ｂａｒ-μ）^２＝σ^２/n
　（注：詳しくは　「　標準誤差SEはなぜ標準偏差σを√nで除するのか」参照）
　とおくと
　-----
＝σ^２-σ^２/n
＝（（n-1）/n）σ^２

故に母分散の程よい推定値である不偏分散は
U＝n/（n-1）・（1/ｎ）Σ（ｘ_ｉ-ｘ_ｂａｒ）^２
　＝（1/ｎ-1）Σ（ｘ_ｉ-ｘ_ｂａｒ）^２
となる．

区間推定

母数がある確率で入る幅を持った推定値
本日の目標はP94の図の意味を理解すること。母平均は一定なのに標本平均は標本毎に異なるので幅を持たせる
orcstat2020-0602.png(11589 byte)

標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差　SE=σ/√n

標準偏差と標準誤差

（教科書P91,92）
・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ／√n

標準誤差SEはなぜ標準偏差σを√nで除するのか

標準誤差は母平均に対する標本平均のバラつき指標（標準偏差）の話
対象が母集団全体ならば0だが，母平均（μ）と標本平均（ｘ_ｂａｒ）には差が生じる
ある標本における平均値と母平均の偏差平方は
（ｘ_bar-μ）^２
＝（（1/ｎ）Σｘ_ｉ-μ）^２
＝（（1/ｎ）Σｘ_ｉ-（1/ｎ）Σμ）^２
＝（（1/ｎ）Σ（ｘ_ｉ-μ））^２
＝（1/ｎ）（1/ｎ）Σ（ｘ_ｉ-μ）^２
　-----
　ここで
　（1/ｎ）Σ（ｘ_ｉ-μ）^２
　をσ^２とおくと
　-----
＝σ^２/n
故に標準誤差は
SE＝σ／√n

中心極限定理

標本の大きさが十分であれば標本平均の分布は正規分布
　→正しく測定されているのであれば偶然誤差の発生は正規分布に従う
　→測定回数を増やせば増やすほど

正規分布

左右対称の釣鐘状分布（教科書P67-70）
平均値に近いほど出現率が高く遠ざかるに従って低くなる（ことが多い）
同じ事柄を同じ条件で繰り返すと正規分布になるという話→中心極限定理
「異質な集団の計測値が組み合わさった分布は正規分布とならない」
歪度・・・左右対称
尖度・・・山形

標準正規分布

平均値が０標準偏差＝１（分散も１）になるように値を変換したもの
偏差値は平均値を50、標準偏差＝１０になるように値を変換したもの

両者の関係
偏差値=50+10×z
ZスコアはP70参照

真度と精度の話（誤差）に置換えると（P84)

正規分布の話は精度の話。右に行くほど（精度が悪くなるほど）広がる
ただし均等にバラつくはずであっても試行回数が少ないとばらついて見えることもある
0から49999までの乱数でXY座標を発生させプロット１万回分
nmubiostat2019-0401.png(86884 byte)

0から49999までの乱数でXY座標を発生させプロット千回分
nmubiostat2019-0402.png(18835 byte)

0から49999までの乱数でXY座標を発生させプロット百回分
nmubiostat2019-0403.png(6360 byte)

母標準偏差が未知の場合の区間推定（教科書P93-98)

標本が大きい場合

正規分布は母平均値と母標準偏差が分からないと使えない→nが多い場合標本平均と標本標準偏差（不偏標準偏差））で近似できる

標本が小さい場合

正規分布は母平均値と母標準偏差が分からないと使えない→nが少ないので近似できない→t分布(標本の自由度νさえわかっていれば、後は検定統計量を求めれば確率がわかる)

ｔ分布

P73-74
自由度のみできまる確率分布
自由度・・・標本の中で自由に振る舞うことが許されている個体の数
　　　　　　統計量が母数の推定となると、自由に振る舞えない個体が出てくる（つじつま合わせ）
標本分散は偏差二乗和を個体の数で除することで求めるが母分散のほどよい推定である不偏分散はn-1（自由度）で除する
正規分布との関係を確認
nmubiostat2018-0401.png(3867 byte)

本日の課題

ある学年の学生から9人抽出し身長を測定した．

ID	身長（cm）
1	172.2
2	167.9
3	173.6
4	173.9
5	173.5
6	172.0
7	159.0
8	170.2
9	158.0

csv形式のデータはコチラから

１：95%信頼区間で母平均を推定せよ．
~~２：ID9のz値，偏差値を求めよ~~
この問題の流れでz値の話をすると頭の中整理できにくいので，2はしなくてよいです

補足

課題の回答

授業中は不偏分散使っていますが，解説の際には普通の分散を使っていたようで失礼しました．
excelで示していましたが，その場合の関数はVAR.Sになります（不偏分散標準偏差求めるならばSTDEV.S）
nmuhlthstat1_2022-0301a.png(22849 byte)

第04回CMC　推測統計（２）平均値の検定

到達目標
４－１確率がどのような意味合いのものか理解する
４－２仮説検定の論理構成を説明できる

教科書１）P104-119

確率

ある事象が起こることが期待される度合い（割合）
試行　サイコロを振って３の目が出る(y or n)
確率　サイコロを振って３の目が出る(1/6)
繰り返し試行を行うと頻度割合はその事象の確率へ収束していく
生物を対象とした場合試行を繰り返せる？→無理な場合が多い→条件を近づけて繰り返したと見做す

検定

試行の結果は事実で正しい。かといってそれが常に正しい（真）とは限らない
次の試行以降で異なる結果がでる可能性を排除できない→永遠に試行を繰り返さないとならず法則が出せない
（故に異なる現象の起こる確率にたいして閾値を定めて、なかったことにして一般性を主張するスタイル）
事象の起こる確率が著しく低くても、実際に起こらないわけではない。

orcstat2020-0603.png(12754 byte)

平均値の差の検定・・・平均値の推定との違いについて理解しておいてください．
推定の時は母平均・・・未知（故に標本から推定する）
検定の時は母平均・・・仮説に基づき設定（標本が仮説の範疇に収まるか否か検定する）

背理法

命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法
差のあることを証明するにあたって「差が無いことを」を証明できないことを根拠にする
（差（違い）を定義するにも区間推定で明らかなように，確率一定でも値は変化する）
＜注＞好きの反対は嫌い　ではなく無関心という考え方．

仮説検定

教科書P105-
＜大前提＞やみくもに検定するのではなく、検定する理由・確信があるから確かめる　という感じで

手順１：仮説をたてる（帰無仮説H0および対立仮説H1）

背理法に基づく証明をしている。
（差がない仮説が証明できないので、その対立である差がある仮説を採択する）

手順２：検定統計量を計算する

その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
（実データを確率の世界のスケールに変換）

手順３：有意水準を決める

確率的に必然と偶然を切り分けている。一般に５％で分けているが１％の時もある

手順４：有意水準と比較し、仮説を棄却採択する

例）帰無仮説H₀を棄却し対立仮説H₁採択
例）判定保留　or（P112参照のこと）
もともと「仮説」ありきなので仮説の無い検定は×

両側検定片側検定

P108
一緒な有意水準で比較した場合　片側は棄却域が存在しないことと，他方は棄却域が大きくなってしまう　→　帰無仮説が棄却されやすくなる状況

有意水準は常に0.05？

P109

αエラー　βエラー

教科書P215

第一種の過誤
αエラーの起こる確率（誤って有意差があると判定）＝有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない　→　雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤（βエラー）・・・誤って一緒と判定する確率
βエラーの起こる確率（誤って有意差が無いと判定）＝検出できない＝１－検出力（Power）＝β
検出力＝１－β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8～0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが，統計的有意差と臨床的有意差の話が出てくる．

平均値の差の検定に用いる確率分布の話

推定の場合と同様に正規分布・t分布の話

母平均と母分散が既知

P116
正規分布

母分散が未知

P117
t分布
1群の場合　帰無仮説・・・母平均に対して標本の平均は一緒
2群の場合　帰無仮説・・・二つの群の平均は一緒・・・データの差の平均　μ=0

対応のない集団

P126
それぞれの群の平均の差

対応のある集団

P129
個体の前後差をそれぞれ求めて，その差の平均
paired t検定
集団それぞれの個体の前後の差を求めて検定

本日の課題

それぞれについて検定せよ
１：平均158.5cm　標準偏差7cmの母集団がある．その中からバスケットをしている集団100人を抽出し平均を求めたところ標本平均は160.0cmだった．
２：血圧降下剤の効果を見るため25人の被験者について服用前後の収縮期血圧の測定を行った．差の平均は8mmHg，標本標準偏差（不偏分散に基づく）は12mmHgだった．
３：血圧降下剤の効果を見るため9人の被験者について服用前後の収縮期血圧の測定を行った．差の平均は8mmHg，標本標準偏差（不偏分散に基づく）は12mmHgだった．

補足

仮説検定のフォーマット例

手順１
帰無仮説Ｈ_０：μ＝１００　対立仮説Ｈ_１：μ≠１００
↓
手順２
検定統計量（ex.ｚ t)＝・・・・・ ↓
手順３
有意水準　両側5%としz検定を行う
↓
手順４
検定統計量との比較，もしくは確率の比較により，今回の標本が棄却域にあるのか否か（受容域なのか）判定する．
｜ｚ｜＝3.96＞1.96　（有意水準両側5%ならば片側2.5%なので）
帰無仮説を棄却し対立仮説を採択する
　有意差がある
例２）
｜ｚ｜＝1.45＜1.96　（有意水準両側5%ならば片側2.5%なので）
帰無仮説は棄却されない
　判定を保留する
　有意差があるとは言えない

第05回CMC　人口統計

到達目標
５－１静態統計，動態統計の違いを説明できる
５－２率を求めることが出来る

教科書　公衆衛生がみえる（P38-53）　人口静態統計，人口動態統計

静態統計と動態統計

静態統計

ある時点での対象の状況そのものを調査

動態統計

ある期間での対象の状況の変化を調査

人口静態統計調査について

5年毎（10年毎の大規模調査と簡易調査）

人口動態統計調査について

毎年（期間＝1年）

人口静態

126,146,099人（令和2年国勢調査）
奈良県は1,324,473人（同上）
naracommed20190313-03.png(255001 byte)

（奈良県の医療を取り巻く状況について　より）

年齢３区分

年少人口　　・・・０～１４歳
生産年齢人口・・・１５～６４歳
老年人口　　・・・６５歳以上

扶養負担の指標

年少人口指数・・・年少人口／生産年齢人口×１００老年人口指数・・・老年人口／生産年齢人口×１００従属人口指数・・・（年少人口＋老年人口）／生産年齢人口×１００

高齢化進行状況の指標

老年化指数　・・・老年人口／年少人口×１００

人口ピラミッド

年次毎の出生数がベースとなり持ち上がっていく格好
ただし人口ピラミッドが人口増減の要因について全てカバーできるわけでもない
ynct20201002-05.png(275744 byte)

（社会人になってみた（頃を客観的に振り返る話）　より）

出生

再生産率の３指標

出生率

期間合計特殊出生率＝Σ（対象年次における年齢別出生数／女子人口）　年齢は15歳～49歳（算出は年次毎）
コーホート合計特殊出生率＝Σ（対象世代の年齢別出生数／女子人口）　年齢は15歳～49歳（算出に期間（49歳になるまで）を要する）

総再生産率（出生女児を対象）

総再生産率＝Σ（対象年次における年齢別女児出生数／女子人口）　年齢は15歳～49歳（算出は年次毎）

純再生産率（出生女児のうち母親の年齢まで生存する女児を対象）

純再生産率＝Σ{（対象年次における年齢別女児出生数／女子人口）×　（年齢別女子生命表の定常人口／10万人）　年齢は15歳～49歳（算出は年次毎）}

本日の課題

国勢調査のデータより，全国，奈良県，橿原市，野迫川村の
年少人口指数，老年人口指数，従属人口指数，老年化指数を求めよ
nmuhlthstat1_2022-0501.png(19957 byte)

補足

出生率や生産率は割合を求めているように思えるが何故率になるのかは次回（死亡率）のところで

資料

第06回FTF　死因統計

到達目標
６－１比と率と割合について説明できる
６－２直接法，間接法で計算できる

比と率と割合（比率）と

ここら辺の理解について整理しておいてください
ごちゃごちゃに整理される原因は割合＝比率という整理になっているところだと思います

比

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例）BMI(Body Mass Index)
身長の二乗（m^2）に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・７０／（１．７＾２）≒２４．２
検査表の見方（日本人間ドック学会）
http://www.ningen-dock.jp/public/method

率

rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例）時速
マラソン（42.195km）を2時間6分で走った場合の時速・・・４２．１９５／２．１≒２０．１km/h
100m走を10秒で走った場合の時速・・・０．１／（１０／３６００）＝３６km/h

無次元の例としては稼働率
稼働率（JIT基本用語集）
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元

割合（比率）

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
０～１の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例）日本人の血液型の割合
A型　約40%
B型　約20%
O型　約30%
AB型　約10%

人年法

一人の人を一年観察したとき１人年
人年に対する何かの量の比・・・率になる
例）5人の患者を1年間観察していた時に二人死亡
Aさん　1年後生存
Bさん　3ヶ月後に死亡
Cさん　9ヶ月後に死亡
Dさん　1年後生存
Eさん　1年後生存

本来の死亡率算出

観察人年＝1+0.25+0.75+1+1=4人年
その間の死亡数が２なので
2/4=0.5　「死亡率（１人年あたり）0.5」
2/4*1000=500「死亡率（１０００人年あたり）500」

年央人口を用いる方法

6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が２なので
2/4=0.5　「1人年対0.5の死亡率」

年齢調整死亡率

年齢によって死亡率が変わるのは自明
年齢で区切って死亡率を評価する

直接法

モデル人口を用意して観察集団の年齢階級別（粗）死亡率をモデル人口における対象とする年齢階級の割合を乗ずる方法
例題 A市

年齢階級	死亡率（人口10万対）
年少人口（～１５）	60
生産年齢人口（１５～６５）	250
老年人口（６５～）	3000

B市

年齢階級	死亡率（人口10万対）
年少人口（～１５）	50
生産年齢人口（１５～６５）	200
老年人口（６５～）	4500

基準集団（昭和60年モデル）

年齢階級	人口
年少人口（～１５）	25,015,000
生産年齢人口（１５～６５）	82,654,000
老年人口（６５～）	12,618,000
総人口	120,287,000

間接法

モデル人口を用意してモデル人口における年齢階級別死亡率を観察集団の年齢階級別人口を乗ずる
全年齢の死亡数を求め積算したもの（期待死亡数）で，観察集団の死亡数を除する．
例題 C市

年齢階級	人口構成	実際の死亡数	SMR
年少人口（～１５）	130,000	-----	-----
生産年齢人口（１５～６５）	700,000	-----	-----
老年人口（６５～）	200,000	-----	-----
計	1,030,000	9,000

D市

年齢階級	人口構成	実際の死亡数	SMR
年少人口（～１５）	200,000	-----	-----
生産年齢人口（１５～６５）	500,000	-----	-----
老年人口（６５～）	330,000	-----	-----
計	1,030,000	9,000

基準死亡率

年齢階級	人口10万対
年少人口（～１５）	40
生産年齢人口（１５～６５）	200
老年人口（６５～）	3,000

死因別死亡数・死亡率

ICD（国際疾病分類）が用いられる
地域により特性が異なる

本日の課題

例題　B市D市をそれぞれ直接法で年齢調整死亡率，間接法でSMRを求めよ

補足

参考資料

人年法

厚生労働統計に用いる主な比率及び用語の解説（厚生労働省）
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/

昭和60年モデル

平成29年度人口動態統計特殊報告平成27年都道府県別年齢調整死亡率の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/other/15sibou/index.html
「１．年齢調整死亡率について」を参照

課題の答え

B市　619.87（人口10万対）
D市　81.97

第07回CMC　疾病統計

到達目標
７－１国民生活基礎調査について説明できる
７－２患者調査について説明できる

国民生活基礎調査

https://www.mhlw.go.jp/toukei/list/20-21.html
調査票から読み取れるところ・・・健康表
setonet20160521-53.png(163855 byte)

（地域と医療の統合に資する情報活用の考え方－不足の観点からみる医療2.10－　より）
入院中，もしくは介護施設に入所中の方は含まれない・・・在宅医療は含まれる
疾病に関するところは症状と傷病名（本人が把握する）について
有訴者率・・・割合（6月~7月に調査実施）
通院者率・・・割合

患者調査

https://www.mhlw.go.jp/toukei/list/10-20.html
医療機関が入力
令和２年患者調査にご協力ください
https://www.mhlw.go.jp/toukei/list/10-20-oshirase-2020-1.html

(1) 推計患者数

調査日当日に、受療した患者の推計数

(4) 受療率

推計患者数（一日あたり）を人口10 万対であらわした数・・・率（/10万人日）
受療率（人口10 万対）＝推計患者数／推計人口×100,000

傷病名

医療機関が入力

本日の課題

１）以下の患者調査のデータより，奈良県内各医療圏の受療率を算出せよ
nmuhlthstat1_2022-0701.png(30384 byte)

２）2種類の受療率の数値の違いについて考察せよ（どちらが地域住民の実態を表わしているのか）
３）国民生活基礎調査の通院者率と，患者調査の外来受療率（病院，および診療所）の差異について考察せよ

補足

参考資料

奈良県保健医療計画（奈良県）
https://www.pref.nara.jp/secure/194743/03iryokeikaku.pdf

課題の回答

Medbb.net

奈良県立医科大学 保健統計学I２０２２（医学部看護学科）

授業メニュー

第01回CMC 記述統計（１）尺度・度数分布・ヒストグラム

統計に用いるデータ

記述統計と推測統計

記述統計とは

推測統計とは

推定とは

検定とは

母集団と標本

母集団とは

標本とは

参考

変量(データ)の分類

度数分布表

度数分布図

課題

補足

第02回CMC 記述統計（２）代表値・散布度・箱ひげ図

代表値

算術平均

幾何平均（相乗平均）

中央値

最頻値

散布度

最大値と最小値を使う

範囲

四分位範囲

四分位数の話

箱ひげ図

平均値を使う

偏差

分散

標準偏差

課題

補足

第03回FTF 推測統計（１）平均値の推定

推定

点推定

不偏分散は何故nではなく（n-1）で除するのか

区間推定

標準偏差と標準誤差

標準誤差SEはなぜ標準偏差σを√nで除するのか

中心極限定理

正規分布

標準正規分布

真度と精度の話（誤差）に置換えると（P84)

母標準偏差が未知の場合の区間推定（教科書P93-98)

標本が大きい場合

標本が小さい場合

ｔ分布

本日の課題

補足

課題の回答

第04回CMC 推測統計（２）平均値の検定

確率

検定

背理法

仮説検定

手順１：仮説をたてる（帰無仮説H0および対立仮説H1）

手順２：検定統計量を計算する

手順３：有意水準を決める

手順４：有意水準と比較し、仮説を棄却採択する

両側検定片側検定

有意水準は常に0.05？

αエラー βエラー

平均値の差の検定に用いる確率分布の話

母平均と母分散が既知

母分散が未知

対応のない集団

対応のある集団

本日の課題

補足

仮説検定のフォーマット例

第05回CMC 人口統計

静態統計と動態統計

静態統計

動態統計

人口静態統計調査について

奈良県立医科大学　保健統計学I２０２２
（医学部看護学科）

第01回CMC　記述統計（１）尺度・度数分布・ヒストグラム

第02回CMC　記述統計（２）代表値・散布度・箱ひげ図

第03回FTF　推測統計（１）平均値の推定

第04回CMC　推測統計（２）平均値の検定

αエラー　βエラー

第05回CMC　人口統計

第06回FTF　死因統計

第07回CMC　疾病統計