奈良県立医科大学 保健統計学I2022
(医学部看護学科)

オンライン開講の場合は,teamsで実施します.
g_保健統計学2022の授業配信チャンネル内に【保健統計学2022オンライン講義室】にアクセスしてください.
ワンクリックで入室する場合は【保健統計学2022オンライン講義室】をクリックしてください.
出欠は対面講義の場合は出欠システム(学生証)で,オンラインの場合は授業内で確認します.

授業メニュー

ハイブリッド形式での授業になります.
第01回FTF 記述統計(1)尺度とデータ形式,度数分布,ヒストグラム

第02回CMC 記述統計(2)代表値・散布度・箱ひげ図

第03回FTF 推測統計(1)平均値の推定

第04回CMC 推測統計(2)平均値の検定

第05回CMC 人口統計

第06回FTF 死因統計

第07回CMC 疾病統計

第08回CMC まとめ

第01回CMC 記述統計(1)尺度・度数分布・ヒストグラム

到達目標
1-1 4つの尺度について説明できる
1-2 度数分布表を作成できる

教科書1)P2-P8,P16-23,P37

統計に用いるデータ

集団から個々のデータをとりまとめて示すので・・・
nmucommed2017-01.png(276444 byte)
奈良県立医科大学大学院看護学研究科 地域医療学(分担:データ分析編) より)
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある(細かい場合は粗くできるが粗いものは推定するしかない)
医療情報学の分野は二次利用がテーマ

記述統計と推測統計

記述統計とは

・収集したデータを要約してその集団の状況を表す
・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度・相関係数など

推測統計とは

事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。
推定とは
・収集したデータを基にしてその集団の状況を表す
・そこにあるデータは一部(標本)
・点推定・区間推定・モデリング
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する
・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など

母集団と標本

母集団とは

対象としている集団の全体を指し示すときに「母」を最初に付ける。
無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い

標本とは

母集団の一部。
昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html

変量(データ)の分類

変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)

1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1

教科書は間隔尺度及び比尺度に関して統計処理上区別する意味は無いとなっているが、注意は必要
ポイントは数学的には正しかったとしても意味的に正しいかどうか

度数分布表

それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版

品名 度数 相対度数 累積度数 累積相対度数
いちご 15
みかん
ぶどう
30 1.00 ----- -----
こちらの度数分布表も空欄埋めてください
品名 度数 相対度数 累積度数 累積相対度数
かつ丼 90
カレーライス 0.3 0.75
ラーメン
1.00 ----- -----

度数分布図

度数分布表をグラフ化したもの
縦棒グラフだが量的変量に限っては「ヒストグラム」その棒の部分の面積が度数を示している
<余談>
図にするときには色々なお作法があります

課題

1)都道府県別の新型コロナウイルス感染症に関する指標を探して近畿,もしくは関西の府県について度数分布表を作成せよ.
<参考>
地域ごとの感染状況等の公表について(新型コロナウイルス感染症について)(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/newpage_00016.html
「関西」と「近畿」 何が違う?(NIKKEI STYLE)
https://style.nikkei.com/article/DGXNASJB2000S_Q1A021C1AA2P00/

補足

第02回CMC 記述統計(2)代表値・散布度・箱ひげ図

到達目標
2-1 代表値の算出及び特性について説明できる
2-2 散布度の算出及び特性について説明できる

教科書1)P24-43

代表値

average(その集団でとりまとめたデータを数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています)

算術平均

mean(算術平均以外にも相乗平均(積して累乗根をとる)などもあります)
1/n・Σxi
パレートの法則(80-20の法則)
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない
幾何平均(相乗平均)

中央値

median(別名第2四分位数)
量的変量を順序尺度で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値

最頻値

mode(流行,はやり)
違う意味で数の理論(多数決)の世界
量的変量を名義尺度で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記

散布度

dispersion

最大値と最小値を使う

最大値と最小値がわかればその集団のバラツキがわかる
最大値maximum excel max関数
最小値minimum excel min関数
範囲
Range
R=最大値-最小値

特徴
 外れ値もひらう
 算出が用意

四分位範囲

小さい順(昇順)に並べて集団を4分割
分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3) 四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の話
四分位数は出し方が何種類かありますが,基本的な考え方はtukeyの上ヒンジ 下ヒンジの話が一番理解しやすいのかなと思います.(教育指導要領とは違いますが)

小さい順(昇順)に並べて集団を4分割
注意:順序の話とその順位のラベル(数値)をこんがらがってしまわないように
例:テストの点 16,5,12,16,13,15,15,18,20,10,20
昇順に並べて順位(カッコ書き)をつける 5(1),10(2),12(3),13(4),15(5),15(6),16(7),16(8),18(9),20(10),20(11)
n数(11)を4で割る
第1四分位数・・・1/4の順位・・・11/4×1=2.75個に分割する場所に相当する数値
第2四分位数・・・2/4の順位・・・11/4×2=5.5個に分割する場所に相当する数値
第3四分位数・・・3/4の順位・・・11/4×3=8.25個に分割する場所に相当する数値

2.75個に分割した場所の出し方
+1/4番目の数値=3番目=12

5.5個に分割した場所の出し方
+2/4番目の数値=6番目=15

8.25個に分割した場所の出し方
+3/4番目の数値=9番目=18

ダンゴ包丁理論(tukeyのヒンジ)
https://medbb.hatenablog.com/entry/2020/12/12/091240
nmuhlthstat202102-01.png(21147 byte)
団子を4等分した時にどのダンゴに包丁を入れたか.

箱ひげ図

四分位範囲をグラフ化
nmuhimstat2021-09.png(8898 byte)

平均値を使う

mean
偏差
Deviation
もともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0

分散
variance
V excel関数はVAR
偏差を二乗したものの平均
標準偏差
Standard Deviation
記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
nmubiostat2016-0302.png(3064 byte)

課題

nmubiostat202102-01.png(7088 byte)
上記のデータの拡張期血圧のデータを用いて
1)平均値を求めよ
2)中央値を求めよ
3)最頻値を求めよ
4)範囲を求めよ
5)四分位範囲を求めよ
6)標準偏差を求めよ
7)度数分布表を作成し,表より平均値を概算せよ
階級 階級値 度数 相対度数 累積度数 累積相対度数
70~80 75
80~90 85
90~100 95
100~110 105
----- -----

補足

第03回FTF 推測統計(1)平均値の推定

到達目標
3-1標準偏差と標準誤差の違いを説明できる
3-2母分散が未知の場合でも母平均を区間推定できる

教科書1)P90-98,P88,P67-70

推定

母集団から抽出した標本を基に母集団の分布を示す値(母数)を推測する
点推定と区間推定がある

点推定

一つの値で推定
母平均の推定値は標本平均
母分散の推定値は不偏分散
教科書P90-91参照
不偏分散は何故nではなく(n-1)で除するのか
求める対象(標本)が母集団全体だったとすると母分散は
(1/n)Σ(x-xbar
  しかしながら対象が母集団の一部であれば,母平均(μ)=標本平均(xbar)とは限らないので,
  μとxbarの差を考慮して母分散を求める(推定する)必要がある
(1/n)Σ((x-μ)-(xbar-μ))
=(1/n)Σ(x-μ)-(2/n)Σ(xbar-xμ-μxbar)+(1/n)Σ(xbar-μ)
=(1/n)Σ(x-μ)-2(xbar-2μxbar)+(xbar-μ)
=(1/n)Σ(x-μ)-2(xbar-μ)+(xbar-μ)
=(1/n)Σ(x-μ)-(xbar-μ)
 -----
 ここで それぞれ
 (1/n)Σ(x-μ)=σ
 (xbar-μ)=σ/n
 (注:詳しくは 「  標準誤差SEはなぜ標準偏差σを√nで除するのか」参照)
 とおくと
 -----
=σ/n
=((n-1)/n)σ

故に母分散の程よい推定値である不偏分散は
U=n/(n-1)・(1/n)Σ(x-xbar
 =(1/n-1)Σ(x-xbar
となる.

区間推定

母数がある確率で入る幅を持った推定値
本日の目標はP94の図の意味を理解すること。母平均は一定なのに標本平均は標本毎に異なるので幅を持たせる
orcstat2020-0602.png(11589 byte)
標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差 SE=σ/√n

標準偏差と標準誤差

(教科書P91,92)
・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
標準誤差SEはなぜ標準偏差σを√nで除するのか
標準誤差は母平均に対する標本平均のバラつき指標(標準偏差)の話
対象が母集団全体ならば0だが,母平均(μ)と標本平均(xbar)には差が生じる
ある標本における平均値と母平均の偏差平方は
(xbar-μ)
=((1/n)Σx-μ)
=((1/n)Σx-(1/n)Σμ)
=((1/n)Σ(x-μ))
=(1/n)(1/n)Σ(x-μ)
 -----
 ここで
 (1/n)Σ(x-μ)
 をσとおくと
 -----
=σ/n
故に標準誤差は
SE=σ/√n

中心極限定理

標本の大きさが十分であれば標本平均の分布は正規分布
 →正しく測定されているのであれば偶然誤差の発生は正規分布に従う
 →測定回数を増やせば増やすほど

正規分布

左右対称の釣鐘状分布(教科書P67-70)
平均値に近いほど出現率が高く遠ざかるに従って低くなる(ことが多い)
同じ事柄を同じ条件で繰り返すと正規分布になるという話→中心極限定理
「異質な集団の計測値が組み合わさった分布は正規分布とならない」
歪度・・・左右対称
尖度・・・山形

標準正規分布

平均値が0標準偏差=1(分散も1)になるように値を変換したもの
偏差値は平均値を50、標準偏差=10になるように値を変換したもの

両者の関係
偏差値=50+10×z
ZスコアはP70参照

真度と精度の話(誤差)に置換えると(P84)

ohsustat2016-01a.png(206456 byte)
正規分布の話は精度の話。右に行くほど(精度が悪くなるほど)広がる
ただし均等にバラつくはずであっても試行回数が少ないとばらついて見えることもある
0から49999までの乱数でXY座標を発生させプロット1万回分
nmubiostat2019-0401.png(86884 byte)
0から49999までの乱数でXY座標を発生させプロット千回分
nmubiostat2019-0402.png(18835 byte)
0から49999までの乱数でXY座標を発生させプロット百回分
nmubiostat2019-0403.png(6360 byte)

母標準偏差が未知の場合の区間推定(教科書P93-98)

標本が大きい場合

正規分布は母平均値と母標準偏差が分からないと使えない→nが多い場合標本平均と標本標準偏差(不偏標準偏差))で近似できる

標本が小さい場合

正規分布は母平均値と母標準偏差が分からないと使えない→nが少ないので近似できない→t分布(標本の自由度νさえわかっていれば、後は検定統計量を求めれば確率がわかる)
t分布
P73-74
自由度のみできまる確率分布
自由度・・・標本の中で自由に振る舞うことが許されている個体の数
      統計量が母数の推定となると、自由に振る舞えない個体が出てくる(つじつま合わせ)
標本分散は偏差二乗和を個体の数で除することで求めるが母分散のほどよい推定である不偏分散はn-1(自由度)で除する
正規分布との関係を確認
nmubiostat2018-0401.png(3867 byte)

本日の課題

ある学年の学生から9人抽出し身長を測定した.
ID 身長(cm)
1 172.2
2 167.9
3 173.6
4 173.9
5 173.5
6 172.0
7 159.0
8 170.2
9 158.0
csv形式のデータはコチラから

1:95%信頼区間で母平均を推定せよ.
2:ID9のz値,偏差値を求めよ
この問題の流れでz値の話をすると頭の中整理できにくいので,2はしなくてよいです

補足

課題の回答

授業中は不偏分散使っていますが,解説の際には普通の分散を使っていたようで失礼しました.
excelで示していましたが,その場合の関数はVAR.Sになります(不偏分散標準偏差求めるならばSTDEV.S)
nmuhlthstat1_2022-0301a.png(22849 byte)

第04回CMC 推測統計(2)平均値の検定

到達目標
4-1確率がどのような意味合いのものか理解する
4-2仮説検定の論理構成を説明できる

教科書1)P104-119

確率

ある事象が起こることが期待される度合い(割合)
試行 サイコロを振って3の目が出る(y or n)
確率 サイコロを振って3の目が出る(1/6)
繰り返し試行を行うと頻度割合はその事象の確率へ収束していく
生物を対象とした場合試行を繰り返せる?→無理な場合が多い→条件を近づけて繰り返したと見做す

検定

試行の結果は事実で正しい。かといってそれが常に正しい(真)とは限らない
次の試行以降で異なる結果がでる可能性を排除できない→永遠に試行を繰り返さないとならず法則が出せない
(故に異なる現象の起こる確率にたいして閾値を定めて、なかったことにして一般性を主張するスタイル)
事象の起こる確率が著しく低くても、実際に起こらないわけではない。

orcstat2020-0603.png(12754 byte)
平均値の差の検定・・・平均値の推定との違いについて理解しておいてください.
推定の時は母平均・・・未知(故に標本から推定する)
検定の時は母平均・・・仮説に基づき設定(標本が仮説の範疇に収まるか否か検定する)

背理法

命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法
差のあることを証明するにあたって「差が無いことを」を証明できないことを根拠にする
(差(違い)を定義するにも区間推定で明らかなように,確率一定でも値は変化する)
<注>好きの反対は嫌い ではなく無関心という考え方.

仮説検定

教科書P105-
<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで

手順1:仮説をたてる(帰無仮説H0および対立仮説H1)

背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)

手順2:検定統計量を計算する

その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
(実データを確率の世界のスケールに変換)

手順3:有意水準を決める

確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある

手順4:有意水準と比較し、仮説を棄却採択する

例)帰無仮説H0を棄却し対立仮説H1採択
例)判定保留 or(P112参照のこと)
もともと「仮説」ありきなので仮説の無い検定は×


両側検定片側検定

P108
一緒な有意水準で比較した場合 片側は棄却域が存在しないことと,他方は棄却域が大きくなってしまう → 帰無仮説が棄却されやすくなる状況

有意水準は常に0.05?

P109

αエラー βエラー

教科書P215

第一種の過誤
αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤(βエラー)・・・誤って一緒と判定する確率
βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1-検出力(Power)=β
検出力=1-β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8~0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.

平均値の差の検定に用いる確率分布の話

推定の場合と同様に正規分布・t分布の話

母平均と母分散が既知

P116
正規分布

母分散が未知

P117
t分布
1群の場合 帰無仮説・・・母平均に対して標本の平均は一緒
2群の場合 帰無仮説・・・二つの群の平均は一緒・・・データの差の平均 μ=0
対応のない集団
P126
それぞれの群の平均の差
対応のある集団
P129
個体の前後差をそれぞれ求めて,その差の平均
paired t検定
集団それぞれの個体の前後の差を求めて検定

本日の課題

それぞれについて検定せよ
1:平均158.5cm 標準偏差7cmの母集団がある.その中からバスケットをしている集団100人を抽出し平均を求めたところ標本平均は160.0cmだった.
2:血圧降下剤の効果を見るため25人の被験者について服用前後の収縮期血圧の測定を行った.差の平均は8mmHg,標本標準偏差(不偏分散に基づく)は12mmHgだった.
3:血圧降下剤の効果を見るため9人の被験者について服用前後の収縮期血圧の測定を行った.差の平均は8mmHg,標本標準偏差(不偏分散に基づく)は12mmHgだった.

補足

仮説検定のフォーマット例

手順1
帰無仮説H:μ=100 対立仮説H:μ≠100

手順2
検定統計量(ex.z t)=・・・・・ ↓
手順3
有意水準 両側5%としz検定を行う

手順4
検定統計量との比較,もしくは確率の比較により,今回の標本が棄却域にあるのか否か(受容域なのか)判定する.
|z|=3.96>1.96 (有意水準両側5%ならば片側2.5%なので)
帰無仮説を棄却し対立仮説を採択する
 有意差がある
例2)
|z|=1.45<1.96 (有意水準両側5%ならば片側2.5%なので)
帰無仮説は棄却されない
 判定を保留する
 有意差があるとは言えない

第05回CMC 人口統計

到達目標
5-1静態統計,動態統計の違いを説明できる
5-2率を求めることが出来る

教科書 公衆衛生がみえる(P38-53) 人口静態統計,人口動態統計

静態統計と動態統計

静態統計

ある時点での対象の状況そのものを調査

動態統計

ある期間での対象の状況の変化を調査

人口静態統計調査について

5年毎(10年毎の大規模調査と簡易調査)

人口動態統計調査について

毎年(期間=1年)

人口静態

126,146,099人(令和2年国勢調査)
奈良県は1,324,473人(同上)
naracommed20190313-03.png(255001 byte)
奈良県の医療を取り巻く状況について より)

年齢3区分

年少人口  ・・・0~14歳
生産年齢人口・・・15~64歳
老年人口  ・・・65歳以上
扶養負担の指標
年少人口指数・・・年少人口/生産年齢人口×100 老年人口指数・・・老年人口/生産年齢人口×100 従属人口指数・・・(年少人口+老年人口)/生産年齢人口×100
高齢化進行状況の指標
老年化指数 ・・・老年人口/年少人口×100

人口ピラミッド

年次毎の出生数がベースとなり持ち上がっていく格好
ただし人口ピラミッドが人口増減の要因について全てカバーできるわけでもない
ynct20201002-05.png(275744 byte)
社会人になってみた(頃を客観的に振り返る話) より)

出生

再生産率の3指標

出生率
期間合計特殊出生率=Σ(対象年次における年齢別出生数/女子人口) 年齢は15歳~49歳(算出は年次毎)
コーホート合計特殊出生率=Σ(対象世代の年齢別出生数/女子人口) 年齢は15歳~49歳(算出に期間(49歳になるまで)を要する)
総再生産率(出生女児を対象)
総再生産率=Σ(対象年次における年齢別女児出生数/女子人口) 年齢は15歳~49歳(算出は年次毎)
純再生産率(出生女児のうち母親の年齢まで生存する女児を対象)
純再生産率=Σ{(対象年次における年齢別女児出生数/女子人口)× (年齢別女子生命表の定常人口/10万人) 年齢は15歳~49歳(算出は年次毎)}

本日の課題

国勢調査のデータより,全国,奈良県,橿原市,野迫川村の
年少人口指数,老年人口指数,従属人口指数,老年化指数を求めよ
nmuhlthstat1_2022-0501.png(19957 byte)

補足

出生率や生産率は割合を求めているように思えるが何故率になるのかは次回(死亡率)のところで

資料

厚生労働統計調査・業務統計等体系図(分野別・対象別一覧表)
https://www.mhlw.go.jp/toukei/itiran/bunya_taisyoubetu.html
令和2年国勢調査(統計結果の公表情報)
https://www.stat.go.jp/data/kouhyou/e-stat_kokusei2020.xml
令和2年(2020)人口動態統計(確定数)の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/kakutei20/index.html
合計特殊出生率について(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/kakutei20/dl/tfr.pdf
02C-Q02 女性が生涯に生む子供の数(合計特殊出生率)(総務省統計局)
https://www.stat.go.jp/library/faq/faq02/faq02c02.html

第06回FTF 死因統計

到達目標
6-1比と率と割合について説明できる
6-2直接法,間接法で計算できる

比と率と割合(比率)と

ここら辺の理解について整理しておいてください
ごちゃごちゃに整理される原因は割合=比率という整理になっているところだと思います

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h

無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元

割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

人年法

一人の人を一年観察したとき1人年
人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存

本来の死亡率算出

観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5 「死亡率(1人年あたり)0.5」
2/4*1000=500「死亡率(1000人年あたり)500」

年央人口を用いる方法

6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5 「1人年対0.5の死亡率」

年齢調整死亡率

年齢によって死亡率が変わるのは自明
年齢で区切って死亡率を評価する

直接法

モデル人口を用意して観察集団の年齢階級別(粗)死亡率をモデル人口における対象とする年齢階級の割合を乗ずる方法
例題 A市
年齢階級 死亡率(人口10万対)
年少人口(~15) 60
生産年齢人口(15~65) 250
老年人口(65~) 3000
B市
年齢階級 死亡率(人口10万対)
年少人口(~15) 50
生産年齢人口(15~65) 200
老年人口(65~) 4500
基準集団(昭和60年モデル)
年齢階級 人口
年少人口(~15) 25,015,000
生産年齢人口(15~65) 82,654,000
老年人口(65~) 12,618,000
総人口 120,287,000

間接法

モデル人口を用意してモデル人口における年齢階級別死亡率を観察集団の年齢階級別人口を乗ずる
全年齢の死亡数を求め積算したもの(期待死亡数)で,観察集団の死亡数を除する.
例題 C市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 130,000 ----- -----
生産年齢人口(15~65) 700,000 ----- -----
老年人口(65~) 200,000 ----- -----
1,030,000 9,000
D市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 200,000 ----- -----
生産年齢人口(15~65) 500,000 ----- -----
老年人口(65~) 330,000 ----- -----
1,030,000 9,000
基準死亡率
年齢階級 人口10万対
年少人口(~15) 40
生産年齢人口(15~65) 200
老年人口(65~) 3,000

死因別死亡数・死亡率

ICD(国際疾病分類)が用いられる
地域により特性が異なる

本日の課題

例題 B市D市をそれぞれ直接法で年齢調整死亡率,間接法でSMRを求めよ

補足

参考資料

人年法
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/
昭和60年モデル
平成29年度人口動態統計特殊報告 平成27年都道府県別年齢調整死亡率の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/other/15sibou/index.html
「1.年齢調整死亡率について」を参照

課題の答え

B市 619.87(人口10万対)
D市 81.97

第07回CMC 疾病統計

到達目標
7-1国民生活基礎調査について説明できる
7-2患者調査について説明できる

国民生活基礎調査

https://www.mhlw.go.jp/toukei/list/20-21.html
調査票から読み取れるところ・・・健康表
setonet20160521-53.png(163855 byte)
地域と医療の統合に資する 情報活用の考え方 -不足の観点からみる医療2.10- より)
入院中,もしくは介護施設に入所中の方は含まれない・・・在宅医療は含まれる
疾病に関するところは症状と傷病名(本人が把握する)について
有訴者率・・・割合(6月~7月に調査実施)
通院者率・・・割合

患者調査

https://www.mhlw.go.jp/toukei/list/10-20.html
医療機関が入力
令和2年患者調査にご協力ください
https://www.mhlw.go.jp/toukei/list/10-20-oshirase-2020-1.html

(1) 推計患者数

調査日当日に、受療した患者の推計数

(4) 受療率

推計患者数(一日あたり)を人口10 万対であらわした数・・・率(/10万人日)
受療率(人口10 万対)=推計患者数/推計人口×100,000

傷病名

医療機関が入力

本日の課題

1)以下の患者調査のデータより,奈良県内各医療圏の受療率を算出せよ
nmuhlthstat1_2022-0701.png(30384 byte)
2)2種類の受療率の数値の違いについて考察せよ(どちらが地域住民の実態を表わしているのか)
3)国民生活基礎調査の通院者率と,患者調査の外来受療率(病院,および診療所)の差異について考察せよ

補足

参考資料

奈良県保健医療計画(奈良県)
https://www.pref.nara.jp/secure/194743/03iryokeikaku.pdf

課題の回答

nmuhlthstat1_2022-0701a.png(33025 byte)