関西福祉大学 疫学2022
(教育学部保健教育学科)

教科書

基礎から学ぶ楽しい疫学(医学書院)
https://www.igaku-shoin.co.jp/bookDetail.do?book=108378

私は「脚注で学ぶ楽しい疫学」とタイトルを読み替えています.

電卓使いますのでよろしくお願いします.
四則演算と平方根(√)の計算が出来るようにしておいてください.

授業メニュー



第1回 疫学に必要な統計(1)推定

第2回 疫学に必要な統計(2)検定

第3回 疫学の概念と歴史

第4回 暴露と疾病

第5回 疫学指標

第6回 これまでのまとめおよび確認テスト

第7回 疫学研究(1)記述疫学,生態学的研究

第8回 疫学研究(2)横断研究,コホート研究,症例対照研究

第9回 疫学研究(3)介入研究

第10回 偏りと交絡

第11回 標準化

第12~13回 スクリーニング

第14回 サーベイランスと疾病登録

第15回 疫学と倫理・まとめ

第1回 疫学に必要な統計(1)推定

到達目標
母集団の状況を推し量る推定について理解する.
1-1疫学における統計の役割について理解する
1-2推定の際に出てくる1.96がどのようなものか説明できる

記述統計と推測統計

記述統計とは

・収集したデータを要約してその集団の状況を表す
・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度・相関係数など

推測統計とは

事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。
推定とは
・収集したデータを基にしてその集団の状況を表す
・そこにあるデータは一部(標本)
・点推定・区間推定・モデリング
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する
・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など

母集団と標本

母集団とは

対象としている集団の全体を指し示すときに「母」を最初に付ける。
無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い

標本とは

母集団の一部。
昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html

区間推定に向けて

ある確率分布に従うと仮定したときに、その分布に基づき、推定に幅を持たせる
平均値の推定には標本の平均と標準偏差と確率分布が必要

標本の算術平均

代表値の一つ.集団を代表する値を示す.
mean
1/n・Σxi
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない

標本の標準偏差

散布度の一つ.集団のバラツキ具合を示す.
Standard Deviation
記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
以下標準偏差の説明に必要な用語
偏差
Deviation
もともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0

分散
variance
V excel関数はVAR
偏差を二乗したものの平均
nmubiostat2016-0302.png(3064 byte)

確率分布

正規分布
二項分布(試行回数nと成功の確率p)→(試行回数を無限大 確率を一定)→正規分布
起こる確率(チャンスを掴む確率)が一定であるとしても積み重ねていくことでバラツキ(差)が出てしまう
人など生物の成長に関わるものなどは、正規分布に近いとされている
平均値μと分散(標準偏差)により分布が決まる
常に曲線下の面積=1(100%)。といって裾野は広がるばかりで閉じない
中心極限定理によりかなり強力(通用しない相手にコーシー分布がいる)

中心極限定理
母集団の分布によらず、抽出した標本の平均値は表本数が大きくなるほど近似的に正規分布に従う

標準正規分布表
kuswepi2021-01.png(339177 byte)
標準正規分布表のPDF版はコチラから

第2回a 疫学に必要な統計(1)推定

母集団の平均値の区間推定

二つの標準偏差
普通の標準偏差と不偏標準偏差と2種類出てきます.
母集団の標準偏差の推定→不偏標準偏差
(標本標準偏差という言葉が出てきますが,不偏標準偏差を指している場合が多いのですが,標本の標準偏差そのものを指しているケースもあるのでここでは不偏標準偏差,不偏分散としておきます)
不偏分散=偏差平方和/(n-1)
標準偏差と標準誤差
・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
標準誤差SEはなぜ標準偏差σを√nで除するのか
標準誤差は母平均に対する標本平均のバラつき指標(標準偏差)の話
対象が母集団全体ならば0だが,母平均(μ)と標本平均(xbar)には差が生じる
ある標本における平均値と母平均の偏差平方は
(xbar-μ)
=((1/n)Σx-μ)
=((1/n)Σx-(1/n)Σμ)
=((1/n)Σ(x-μ))
=(1/n)(1/n)Σ(x-μ)
 -----
 ここで
 (1/n)Σ(x-μ)
 をσとおくと
 -----
=σ/n
故に標準誤差は
SE=σ/√n
区間推定の確率
母数が含まれる確率・・・入る幅を持った推定値
(中心極限定理により正規分布に近似)
orcstat2020-0602.png(11589 byte)
標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差 SE=σ/√n
式で示すと
95%の信頼区間の場合
下限:標本平均-1.96×標準誤差
上限:標本平均+1.96×標準誤差
(1.96は標準正規分布表で確認)
例題
ある大学の学生(19歳)16人の50m走の結果である
このデータより,全国の大学生の50m走の平均値の95%信頼区間を推定せよ
kuswepi2021-02.png(16138 byte)

本日の課題

例題と同じく,あるサークルの学生の50m走のデータより,全国の大学生の50m走の平均値の95%信頼区間を推定せよ
kuswepi2021-03.png(4299 byte)

課題の計算結果

kuswepi2021-04.png(14823 byte)
補足
例題で求めていたのは以下の式になります
上限 7.40+1.96×0.46÷4
下限 7.40-1.96×0.46÷4

標準偏差(0.44)ではなく不偏分散に基づく標準偏差(このページではそれを不偏標準偏差としています)を使っているというところがポイントでしょうか(母集団の標準偏差が分かっていないので標本から推定)

この授業では正規分布で推定しましたが(それしか説明していないので),通常はt分布を用います.
これは今回の標本数(16)が少ないので正規分布で区間推定した場合(95%の場合だと1.96)実際には95%の確率よりも低くなります.そこで困った技術者ゴセットさんがt分布を発見しました.

ここからは,疫学の授業ですので取り扱いはしません.
関心を持った方は以下の授業資料をご覧ください.
無論不明点などありましたらご連絡ください.対応します.
下記の授業資料がt分布による推定の話になります
https://medbb.net/education/ocrstat2021/#5
(第5回 推測統計(Ⅱ)-推定 大阪リハビリテーション専門学校 統計学2021)

(この部分は試験対象から外します.自己学修よろしくお願いします)第2回b 疫学に必要な統計(2)検定

到達目標
2-1仮説検定の手順について説明できる
教科書P170-174

仮説検定

<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで
手順1:仮説をたてる(帰無仮説H0および対立仮説H1)
H0 μ=μ0
H1 μ≠μ0
μが対象とする母集団の平均 μ0は母集団から抽出した標本の平均(=母集団の平均の推定値)
背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)
手順2:有意水準を決める
確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある
手順3:検定統計量を計算する
その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
Z検定の場合はZ値が検定統計量.
Z値は値を0,標準偏差(分散)=(平均値の話の場合は標準誤差)を1として変換したもの
全国模試の平均点が60標準偏差が8点だった.自身の会場では16人で試験を行ったとき平均点が66点だった場合
全国模試の平均点を0にすると16人の試験の平均点は6点(66-6)
全国模試の標準偏差が8点だった時,16人で試験を行った時の平均値の標準誤差は8/√16=2
Z値は6/2=3.0
手順4:有意水準と比較し、仮説を棄却採択する
有意水準両側5%の時のZの境界値は標準正規分布表より1.96
帰無仮説H0を棄却し対立仮説H1採択


検定と推定の違い

推定
orcstat2020-0602.png(11589 byte)
検定
orcstat2020-0603.png(12754 byte)

Z検定

標準正規分布を用いた検定
先週の推定と同じもの.Z検定は基本ではあるが適用できないケースが多くt検定がよく使われるが,統計の授業になってしまうので個々では割愛

αエラー βエラー

教科書P171表2

第一種の過誤
αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤(βエラー)・・・誤って一緒と判定する確率
βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1-検出力(Power)=β
検出力=1-β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8~0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.

仮説検定は用法を守り正しく使いましょう

例題

我が国における男子中学生の50m走の平均タイムは8秒02,標準偏差は0.75秒だった
皆さんが特別に指導している男子中学生のチーム64人のタイムを計り平均を求めたところ7秒92だった.
果たして皆さんの指導によるタイムは平均的な指導によるものと異なるのか有意水準5%で検定せよ

課題

我が国における男子中学生の身長は平均160.05cm,標準偏差は7.66であった.
皆さんが特別に指導している男子中学生のチーム64人の身長を測定したところ,165.80cmであった
全国平均と異なる集団なのか有意水準5%で検定せよ

参考資料

令和元年度全国体力・運動能力、運動習慣等調査結果(スポーツ庁)
https://www.mext.go.jp/sports/b_menu/toukei/kodomo/zencyo/1411922_00001.html

第3回 疫学の概念と歴史

到達目標
3-1疫学と易学の違いについて説明できる
3-2疫学と科学の関係について説明できる


疫学とは

ある人間集団単位における健康状態の頻度分布の観察
ある集団とは地域であったり年齢であったり・・・・
科学的に原因が解明されていなかったとしても,集団の特性と頻度分布の関係を見出せば,原因が未知でも問題を解決できることもある.
集団単位の設定が原因解明の限界になるので,それだけで真の原因に辿り着くとは限らない.

日本疫学会で示している定義は以下をご覧ください
<参考>
疫学(疫学用語の基礎知識 日本疫学会)
https://jeaweb.jp/glossary/glossary001.html

疫学の目的

公衆衛生の発展に寄与 → 疫学は集団を対象としている
公衆衛生→集団に寄与する→保健
個人衛生→個人に寄与する→保健~医療
公衆衛生の定義
「公衆衛生とは、生活環境衛生の整備、感染症の予防、個人衛生に関する衛生教育、疾病の早期診断と治療のための医療・看護サービスの組織化、および地域のすべての人々に健康保持に必要な生活水準を保証する社会機構の整備を目的とした地域社会の組織的努力を通じて、疾病を予防し、寿命を延ばし、身体的・精神的健康と能率の増進を図る科学であり技術である。」(Winslow,1920年)
<引用>
公衆衛生医師について(全国保健所長会)
http://www.phcd.jp/02/j_ishi/

疫学の歴史

1850年代・・・イギリスにおけるコレラの流行
<参考>
ジョン・スノー(IgnazzoVol.7 BD)
https://www.bdj.co.jp/safety/articles/ignazzo/hkdqj200000awidd.html
イギリスの近代都市づくりを進めたのは実はこれらだったのです。(こだわりアカデミー athome)
https://www.athome-academy.jp/archive/history/0000000254_all.html

日本・・・脚気の克服
<参考>
高木 兼寛(宮崎県郷土先覚者 宮崎県総合政策部文化文教課)
https://www.pref.miyazaki.lg.jp/contents/org/kenmin/kokusai/senkaku/pioneer/takaki/index.html
脚気撲滅への挑戦(明治期の農林水産業発展の歩み 農水省)
https://www.maff.go.jp/j/meiji150/eiyo/02.html

先天性白内障・・・風疹
<参考>
先天性風疹症候群(にしじまクリニック)
https://nishijima-clinic.or.jp/blog/2019/11/01/%E5%85%88%E5%A4%A9%E6%80%A7%E9%A2%A8%E7%96%B9%E7%97%87%E5%80%99%E7%BE%A4/
先天性風疹症候群:5類感染症:全数把握疾患(みえの感染症ガイドブック)
http://www.kenkou.pref.mie.jp/kansen_guidebook_hp/7kansensyou/5-10sentenseihuusin.htm

O157・・・カイワレ大根
「ビジネスに関わる行政法的事案」第27回:行政の情報提供活動のありかたについて(GBLI研究所)
http://gbli.or.jp/kohyama_gyosei-27/

課題

新型コロナウイルスへの感染リスクが高まる場面について整理しておくこと
感染拡大防止特設サイト(内閣官房)
https://corona.go.jp/proposal/

第4回 暴露と疾病

到達目標
4-1 アウトカムにどのようなものがあるか説明できる
4-2 暴露の評価方法について説明できる

疾病

Disease Outcome・・・疾病の転帰
参考までに
Functional Outcome・・・機能的転帰
<出典>functional outcome(日本リハビリテーション医学会)
https://www.jarm.or.jp/nii/rihanews/No06/RN0614BD.HTM

アウトカム

どのような事象(イベント)があるのか
死亡
罹患
寛解・・・症状が治まっている状態
治癒

定義

情報をイベントのあり/なしにしないといけない
例えば評価を2段階にすると60~100を合格 60未満は不合格
細かく分けると
90点~100点を秀 80~90を優 70~80を良 60~70を可 など

4つの尺度

変量(データ)の分類・・・測定尺度
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である(P5)
1名義尺度
2順序尺度
3間隔尺度
4比率(比例)尺度

1,2を質的データ(変量)(定性的)
3,4を量的データ(変量)(定量的)
性質としては上位互換性があり
4>3>2>1

度数分布表

それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版

品名 度数 相対度数 累積度数 累積相対度数
いちご 15
みかん
ぶどう
30 1.00 ----- -----

曝露

必ずしも浴びるわけではない.
状況にさらされている という イメージ.
居住地も曝露
危険因子・・・疾病の発生確率の上昇に寄与するもの
危険因子は疾病発生よりも前に存在している
曝露も定義の話が出てくる

予防

危険因子の存在を遠ざける
遠ざけられる危険因子もあれば,出来ないものもある
可能な限り発生する確率を下げる→限りなく下げようとすると自由度が無くなっていく
COVID-19の感染予防のマスクの話は,社会全体でみると感染予防の効果が期待できるが,個人で見た場合マスク着用により自身の感染予防を期待できない(=他者への感染予防が期待)ところが,社会工学の観点から上手く回らないところがつらい

本日の課題

こちらの度数分布表の空欄埋めてください
品名 度数 相対度数 累積度数 累積相対度数
かつ丼 90
カレーライス 0.3 0.75
ラーメン
1.00 ----- -----

第5回 疫学指標

到達目標
5-1 比と率と割合の違いについて説明できる
5-2 人年について説明できる
5-3 疾病頻度測定の指標について説明できる


割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h

無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元

人年の計算法

死亡率を例として
一人の人を一年観察したとき1人年
人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存
<本来の死亡率算出>
観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5/年「1人年対0.5の死亡率」
<年央人口を用いる方法だと>
6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5/年

イベント以外での脱落も考慮したものはP21で

疾病頻度測定の指標

罹患率・・・率
累積罹患率・・・割合
有病率(時点有病率)・・・割合
期間有病率・・・割合
死亡率・・・率
致命率・・・比もしくは割合

<参考>
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/

本日の課題

220人の患者を1年間観察しました. この一年でAという疾患に罹患した方は15名,その他で脱落(転居等)が25名でした.
罹患率を求めてください(単位は千人あたりの年間の人数で)

告知

来週はシラバス通り「これまでのまとめおよび確認テスト」を実施します

第7回 疫学研究(1)記述疫学,生態学的研究

到達目標
7-1 記述疫学の重要性について説明できる
7-2 生態学的研究の利点と欠点を説明できる

記述疫学

特段曝露について触れたものではない
ただし,人,場所,時間という曝露はあるが
記述統計と言われるものと同じ格好で,状況を可視化するもの

生態学的研究

集団レベルで曝露と疾病頻度の関係をみる.
仮説を形成するところまで 個人レベルで曝露と疾病頻度に関係が無くても集団レベルで行うと,関係が見えてくる場合がある → 謎理論誕生
集団を代表する値・・・代表値
よく使われるのが平均値.その他には 中央値=50%タイル値
順番(昇順)に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
25%タイル値は,小さい方から数えて25%=1/4の所に位置する対象の値
nmubiostat2016-0301.png(17266 byte)
以下集団レベルでみることの限界について相関係数の話から

相関

correlative
相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか

因果

cause and effect
原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない

普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)

たばこを吸う-肺がん・・・・相関関係○

タバコを吸う人にコーヒーを飲む人が多いのは・・・(yahoo知恵袋)
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1293675642
この関係を使うと
コーヒーを飲む-肺がん・・・相関関係○

コーヒー愛飲者に肺がんが多い理由は?生活習慣との関連を検証
アメリカで約50万人を対象にした調査から
from International journal of epidemiology
http://medley.life/news/item/5589521b660815fe00d5ec8e

コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関

例(空想):年末に私の前を歩く人から「ついてこないで!」と言われるが、別にその人を追いかけているわけではない。お互い宝くじ売り場に向かっているだけ

この授業(統計学)は医療系対象で「提供する医療が及ぼす影響やその要因に関する法則性を見いだす方法を探求する学問分野」(再掲)
知りたいのは「影響」が何なのかであるから目的を見失わないように

相関図

X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)
とりあえず図にすると関係が直感的にわかる(場合がある)

相関係数

-1から1までの値をとる
Xが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0

第8回 疫学研究(2)横断研究,コホート研究

到達目標
8-1 横断研究とコホート研究の違いついて説明できる
8-2 コホート研究と回顧的コホート研究の違いについて説明できる
8-3 コホート研究と症例対照研究で適切な指標で相対危険(度)を求めることができる

横断研究

曝露と疾病発生を同時に評価・・・どちらも妥当性が高い
・利点(調査コスト)
・欠点(どちらが原因?)

コホート研究

コホート・・・追跡する集団
結果より原因が先行する・・・原因(曝露)に基づく集団・・・曝露情報の妥当性が高い
・利点(時間の流れに沿った解釈が出来る 稀な曝露に対応できる)
・欠点(追跡にコストがかかる 稀な疾患には対応困難)

回顧的コホート研究

過去に曝露情報が明らかになっている集団を現在から遡る
現存する資料のみ・・・コホート研究と対極的.観察の方向性はコホート研究と同じ
・近年は保険請求のデータなどを用いた分析なども行われている
(情報の二次利用)
nmucommed2017-01.png(276444 byte)
奈良県立医科大学大学院看護学研究科 地域医療学(分担:データ分析編) より)
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある(細かい場合は粗くできるが粗いものは推定するしかない)

相対危険

relative risk

説明用データ

疾病発症 疾病無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A~D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)

曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)

頻度について
集団の中でのイベント数(発生回数)
説明用データや下記の参考では累積罹患(率)(つまり割合)で求めた話
無論罹患率や死亡率などでも求められる.(教科書P29参照)
参考
相対危険(日本疫学会)
https://jeaweb.jp/glossary/glossary017.html
フレミンガムでの試み(医学会新聞 医学書院)
https://www.igaku-shoin.co.jp/paper/archive/old/old_article/n2002dir/n2516dir/n2516_05.htm

症例対照研究

症例群,対照群・・・過去に遡って追跡する集団
観察の方向性では原因より結果が先行する・・・結果に基づく集団・・・疾病発生情報の妥当性が高い
・利点(短時間で行える 稀な疾患に対応できる)
・欠点(曝露に関する妥当性が低い)

相対危険(度)

Relative Risk・・・一般用語
罹患率比,オッズ比などなど
説明用データ
疾病発症 疾病無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比(振り返り+α)

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A~D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)

曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
 リスク比≒A/B/C/D=AD/BC

オッズ比

Odds Ratio(OR)
危険な事象が起きた場合と起きなかった場合の指標の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの

発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
    =AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる

資料

コホート研究
不整脈あり 不整脈なし
曝露群 100 1900 2000
非曝露群 50 1950 2000
150 3850 4000
症例対照研究
不整脈あり 不整脈無し
曝露歴あり 50 30 80
曝露歴無し 50 70 120
100 100

対照

選択には性と年齢をマッチ

病院対照

同一医療機関の受診者

近隣対照

同居の家族,隣近所

一般集団対照

本日の課題

1)資料の「コホート研究」「症例対照研究」からそれぞれリスク比とオッズ比を求めて比較せよ.
2)なぜ症例対象研究では,コホート研究と異なり相対危険をリスク比で示すことが出来ないのか,説明せよ
(1は授業中に追加したもの)

取りこぼしの部分(次回回収)
回顧的コホート研究

第9回 疫学研究(4)介入研究

到達目標
9-1 介入研究とコホート研究の違いついて説明できる
9-2 介入研究において非介入群に対する配慮の必要性について説明できる

介入

割り込む・・・被験者に強制的に曝露(起こる/起こらない)を割り付ける.
普段,割り込みは意識して行っている(と思います).→私の前には割り込むが高級外車の車の前には割り込まない

研究者の意向が入ってしまうがチョイスしていない → 無作為割付
RCT(Randomized Controll Trial)無作為割付介入研究

介入研究の利点と欠点

交絡因子の制御が期待できる.→交絡は説明済み・・・対策は次回以降で
介入は疾病予防に関するものに限定される
介入できないもの・・・家族,収入,学歴,職業などなど
介入結果の結果はreal worldを反映していないのでは ⇔ real world dataは実態を反映しているものの,そこから正しく知見を見出せるのか

非介入群への配慮

クロスオーバーデザイン
他にもいろいろな方法が

倫理

教科書第11章参照

疫学研究方法まとめ

表4-4,表4-6

本日の課題

介入研究とコホート研究の相違点について簡潔にまとめよ

第10回 偏りと交絡

到達目標
10-1 誤差には二つの要因からなっていることを説明できる
10-2 交絡因子に配慮できるようになる

ohsustat2016-01a.png(206456 byte)
時計がズレる理由 ①精度(月±15秒以内)) ②時刻合わせ(電波,177,誰かの時計etc)

母集団と標本

母集団・・・標的集団
標本・・・・観察対象集団
標的集団=観察対象集団・・・全数調査 悉皆調査 センサス
センサスの語源(総務省統計局)
https://www.stat.go.jp/data/e-census/guide/about/alacarte/origin.html
標本・・・無作為抽出が原則
(昆虫標本は作為的)
標本から100%データを得られるわけでもない・・・観察集団

誤差の分類

偶然誤差と系統誤差
偶然誤差 発生を抑えるのは困難・・・どうしようもないわけでもない(少なくする(精度を上げる)にはコスト(時間,回数等)を掛ける)
系統誤差・・・交絡と偏り(選択,情報,観察)
交絡・・・第7回参照の講義参照
選択・・・標本の抽出に関するあれこれ
情報・・・実態と異なる情報になってしまう.集団の特性によるところも
(観察・・・情報バイアスの一つ 観察者が知っているが故に影響を与えてしまうことP103面接者バイアス)
<参考>バイアスの種類とその対策(1)(若井建志, 大野良之,第34巻 日循協誌 第1号)
https://www.jstage.jst.go.jp/article/jjcdp1974/34/1/34_1_42/_pdf
バイアスは他にも色々
<参考>質的研究で避けるべき7つのバイアス(エディテージ・インサイト)
https://www.editage.jp/insights/7-biases-to-avoid-in-qualitative-research

検定か推定か

1~2回目の講義参照

有意差検定が無意味な場合

有意水準5%で差が見られた場合でも,着目すべきものといえるかどうかは別な部分もある
→統計的有意差と臨床的有意差の話
効果量に対する必要データ数を可変させたものが以下

 各群10データで検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
 各群1000データぐらいで検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
 nmubiostat2016-0901.png(37095 byte)
   <参考>その治療は臨床的に有益か(PEDro)
 https://www.pedro.org.au/japanese/tutorial/is-the-therapy-clinically-useful/
 <参考>統計的有意性とP値に関するASA声明
 http://biometrics.gr.jp/news/all/ASA.pdf
 以下抜粋しました
 1. P値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
 2. P値は、調べている仮説が正しい確率を測るものではない
 3. 科学的な結論は、P値がある値を超えたかどうかにのみ基づくべきではない
 4. 適正な推測のためには、すべてを報告する透明性が必要
 5. P値は、効果の大きさや結果の重要性を意味しない
 6. P値は、それだけでは仮説に関するエビデンスのよい指標とはならない
・データ数大きい場合は区間推定のほうが意味ある。

差異誤分類と非差異誤分類

図5-5説明できるように
(数式出てきて変数が沢山出てくるとギョッとしますよね)

交絡因子とその制御

性と年齢と人種は交絡因子として扱われる
計画段階で可能なこと,解析段階で制御する方法もある・・・後回ししたくなるから解析に頼りたくなるが・・・

計画段階

無作為割付
曝露(介入)と非曝露(非介入)を無作為に割り付け
限定
交絡因子の一つの状態のみ対象
マッチング
交絡因子の分布が曝露と非曝露群の間で均等に

解析段階

層化
交絡因子の層ごと(分類ごと)に解析
数学的モデリング
多変量解析→教科書第10章参照
第7回で相関の話をしたが,それは2変量の関係の話

第11回 標準化

到達目標
11-1SMRの計算ができる
11-2直接法と間接法の違いを説明できる

集団間の比較において年齢構成による影響をを除く話

年齢調整死亡率

年齢によって死亡率が変わるのは自明
年齢で区切って死亡率を評価する

直接法

モデル人口を用意して観察集団の年齢階級別(粗)死亡率をモデル人口における対象とする年齢階級の割合を乗ずる方法
例題 A市
年齢階級 死亡率(人口10万対)
年少人口(~15) 60
生産年齢人口(15~65) 250
老年人口(65~) 3000
B市
年齢階級 死亡率(人口10万対)
年少人口(~15) 50
生産年齢人口(15~65) 200
老年人口(65~) 4500
基準集団(昭和60年モデル)
年齢階級 人口
年少人口(~15) 25,015,000
生産年齢人口(15~65) 82,654,000
老年人口(65~) 12,618,000
総人口 120,287,000
昭和60年モデル資料
平成29年度人口動態統計特殊報告 平成27年都道府県別年齢調整死亡率の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/other/15sibou/index.html
「1.年齢調整死亡率について」を参照

間接法

モデル人口を用意してモデル人口における年齢階級別死亡率を観察集団の年齢階級別人口を乗ずる
全年齢の死亡数を求め積算したもので,観察集団の死亡数を除する.
例題 C市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 130,000 ----- -----
生産年齢人口(15~65) 700,000 ----- -----
老年人口(65~) 200,000 ----- -----
1,030,000 9,000
D市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 200,000 ----- -----
生産年齢人口(15~65) 500,000 ----- -----
老年人口(65~) 330,000 ----- -----
1,030,000 9,000
基準死亡率
年齢階級 人口10万対
年少人口(~15) 40
生産年齢人口(15~65) 200
老年人口(65~) 3,000

課題

1)例題のA市B市の年齢調整死亡率を算出・比較し,直接法の利点・欠点について考察せよ
2)例題のC市D市のSMRを算出・比較し,間接法の利点・欠点について考察せよ

第12~13回 スクリーニング

到達目標
スクリーニングの有効性について,ROC曲線の作成や3つのバイアスについて理解する.
12-1 ROC曲線を作成し,検査法の比較や適切なカットオフ値の検討ができる.
12-2 3つのバイアスの特徴を説明できる

スクリーニング

無症状だがある疾患に罹患している可能性のある集団に検査
①重篤 ②経過の変化が期待できる ③有病率が高い

望ましい検査と現実

ocrotstat2022-0301.png(344953 byte)

感度と特異度

感度=P(陽性|D)  疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1-偽陽性率 非疾患群における真陰性の割合
ocrotstat2022-0302.png(394121 byte)
ocrotstat2022-0303.png(266829 byte)
予測値
有病率の影響を受ける
 陽性的中率=P(D|陽性)
 陰性的中率=P(Dc|陰性)

参考

File 3. 検査結果と有病率の関係(JMP-SAS Institute Inc.)
https://www.jmp.com/ja_jp/medical-statistics/column/non-series/test-results-prevalence.html

ROC曲線

判別度の分析
感度と偽陽性率(1-特異度)を用いて曲線を描く
ocrotstat2022-0304.png(355176 byte)
量的なデータも質的な評価も用いることが出来る.

疾患群 14.3 15.2 13.8 14.1 13.9 12.6 14.2 14.6 13.1 13.7
非疾患群 13.2 14.1 13.8 13.6 12.9 12.4 12.1 12.3 12.3 12.8
csvデータはコチラ カットオフ値を12.0~15.5まで0.5刻みで設定した格好で,以下話を進めます・・・
次週ここから

検査法の評価指標

尤度比
(陽性)尤度比=感度/偽陽性率 疾患のある人に対してどの程度検出できるか
ocrotstat2022-0305.png(364354 byte)
ocrotstat2022-0306.png(368301 byte)
AUC
ROCの曲線下面積
面積が大きいほど特性が優れている
AUCの求め方は以下のように三角形と台形の面積を求めて足し合わせる事
kuswepi2020-1101.jpg(20603 byte)

スクリーニングの効果判定におけるバイアス

リード・タイム・バイアス・・・早期に発見するとその分経過は長くなる
レングス・バイアス・・・進行の速い病態は発見されにくい
セルフ・セレクション・バイアス・・・そもそも参加する人が偏っている

例題

次のマンモグラフィの検査結果からROC曲線を描き、AUCを(小数点以下2桁まで求め四捨五入)求め、カットオフ値の検討をせよ
<参考>
森本 忠興,日本の乳癌検診の歴史と課題,日乳癌検診学会誌,18(3)211-231,2009
https://www.jstage.jst.go.jp/article/jjabcs/18/3/18_3_211/_article/references/-char/ja/
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 0 4 14 12 10 40
非疾患群 20 20 12 8 0 60

課題

以下のデータと例題と比較しどちらの系がより優れているかAUCを求めて検討せよ
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 1 5 16 10 8 40
非疾患群 20 16 14 10 0 60

第14回 サーベイランスと疾病登録

到達目標
疾病頻度の推移を観察することを目的とするサーベイランスと疾病登録について理解する..
14-1 サーベイランスの概要について説明できる
14-2 1~4類感染症と5類感染症の取り扱いの違いについて説明できる

サーベイランス

目的:疾病の予防と管理
データの収集→整理・解析・解釈→情報の還元→予防と管理の実行
<参考>
データと情報の違い
joho20150613-5.png(149915 byte)
よりよい医療に貢献する医療情報技師の役割 より)

疾病登録

迅速な情報還元は目的としない.
1:患者へのサービス提供
2:疫学研究
3:疾病対策の基礎資料

登録項目

1:個人同定情報
2:疾患に関する情報
3:追跡情報

参考

コロナ 5類になるとどうなる 医療費や行動制限 見直し判断の要素は(NHK首都圏ナビ)
https://www.nhk.or.jp/shutoken/newsup/20221208a.html