関西福祉大学 疫学2021
(教育学部保健教育学科)

本授業はオンライン(オンデマンド方式)で開始します.
dotcampusに動画閲覧用のユーザーIDとパスワードを記していますのでご確認ください.
10月8日より対面授業になりました.

講義/復習動画の閲覧はこちらから

ログインID:

パスワード:

教科書

基礎から学ぶ楽しい疫学(医学書院)
https://www.igaku-shoin.co.jp/bookDetail.do?book=108378

私は「脚注で学ぶ楽しい疫学」とタイトルを読み替えています.

電卓使いますのでよろしくお願いします.
四則演算と平方根(√)の計算が出来るようにしておいてください.

授業メニュー



第1回CMC 疫学に必要な統計(1)推定

第2回CMC 疫学に必要な統計(2)検定

第3回FTF 疫学の概念と歴史

第4回FTF 暴露と疾病

第5回FTF 疫学指標

第6回 これまでのまとめおよび確認テスト

第7回FTF 疫学研究(1)記述疫学,生態学的研究

第8回FTF 疫学研究(2)横断研究,コホート研究

第9回FTF 疫学研究(3)症例対照研究

第10回FTF 疫学研究(4)介入研究

第11回FTF 偏りと交絡

第12回FTF 標準化

第13回FTF スクリーニング

第14回FTF サーベイランスと疾病登録

第15回FTF 疫学と倫理・まとめ

第1回 疫学に必要な統計(1)推定

到達目標
母集団の状況を推し量る推定について理解する.
1-1疫学における統計の役割について理解する
1-2推定の際に出てくる1.96がどのようなものか説明できる

記述統計と推測統計

記述統計とは

・収集したデータを要約してその集団の状況を表す
・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度・相関係数など

推測統計とは

事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。
推定とは
・収集したデータを基にしてその集団の状況を表す
・そこにあるデータは一部(標本)
・点推定・区間推定・モデリング
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する
・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など

母集団と標本

母集団とは

対象としている集団の全体を指し示すときに「母」を最初に付ける。
無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い

標本とは

母集団の一部。
昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html

区間推定に向けて

ある確率分布に従うと仮定したときに、その分布に基づき、推定に幅を持たせる
平均値の推定には標本の平均と標準偏差と確率分布が必要

標本の算術平均

代表値の一つ.集団を代表する値を示す.
mean
1/n・Σxi
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない

標本の標準偏差

散布度の一つ.集団のバラツキ具合を示す.
Standard Deviation
記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
以下標準偏差の説明に必要な用語
偏差
Deviation
もともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0

分散
variance
V excel関数はVAR
偏差を二乗したものの平均
nmubiostat2016-0302.png(3064 byte)

確率分布

正規分布
二項分布(試行回数nと成功の確率p)→(試行回数を無限大 確率を一定)→正規分布
起こる確率(チャンスを掴む確率)が一定であるとしても積み重ねていくことでバラツキ(差)が出てしまう
人など生物の成長に関わるものなどは、正規分布に近いとされている
平均値μと分散(標準偏差)により分布が決まる
常に曲線下の面積=1(100%)。といって裾野は広がるばかりで閉じない
中心極限定理によりかなり強力(通用しない相手にコーシー分布がいる)

中心極限定理
母集団の分布によらず、抽出した標本の平均値は表本数が大きくなるほど近似的に正規分布に従う

標準正規分布表
kuswepi2021-01.png(339177 byte)
標準正規分布表のPDF版はコチラから

母集団の平均値の区間推定

二つの標準偏差
普通の標準偏差と不偏標準偏差と2種類出てきます.
母集団の標準偏差の推定→不偏標準偏差
(標本標準偏差という言葉が出てきますが,不偏標準偏差を指している場合が多いのですが,標本の標準偏差そのものを指しているケースもあるのでここでは不偏標準偏差,不偏分散としておきます)
不偏分散=偏差平方和/(n-1)
標準偏差と標準誤差
・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
標準誤差SEはなぜ標準偏差σを√nで除するのか
標準誤差は母平均に対する標本平均のバラつき指標(標準偏差)の話
対象が母集団全体ならば0だが,母平均(μ)と標本平均(xbar)には差が生じる
ある標本における平均値と母平均の偏差平方は
(xbar-μ)
=((1/n)Σx-μ)
=((1/n)Σx-(1/n)Σμ)
=((1/n)Σ(x-μ))
=(1/n)(1/n)Σ(x-μ)
 -----
 ここで
 (1/n)Σ(x-μ)
 をσとおくと
 -----
=σ/n
故に標準誤差は
SE=σ/√n
区間推定の確率
母数が含まれる確率・・・入る幅を持った推定値
(中心極限定理により正規分布に近似)
orcstat2020-0602.png(11589 byte)
標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差 SE=σ/√n
式で示すと
95%の信頼区間の場合
下限:標本平均-1.96×標準誤差
上限:標本平均+1.96×標準誤差
(1.96は標準正規分布表で確認)
例題
ある大学の学生(19歳)16人の50m走の結果である
このデータより,全国の大学生の50m走の平均値の95%信頼区間を推定せよ
kuswepi2021-02.png(16138 byte)

本日の課題

例題と同じく,あるサークルの学生の50m走のデータより,全国の大学生の50m走の平均値の95%信頼区間を推定せよ
kuswepi2021-03.png(4299 byte)

課題の計算結果

kuswepi2021-04.png(14823 byte)
コメント
授業中の資料で95%信頼区間 とするところを 96%信頼区間と誤記している部分(修正済み)がありましたが,その通りに間違っている方が数名おられました.
なんの疑問も持たずに記していたのであればまずいですよね.
挙句の果てには93%信頼区間と書いている方もおられたり(字が丁寧ではないからか?)

第2回 疫学に必要な統計(2)検定

到達目標
2-1仮説検定の手順について説明できる
教科書P170-174

仮説検定

<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで
手順1:仮説をたてる(帰無仮説H0および対立仮説H1)
H0 μ=μ0
H1 μ≠μ0
μが対象とする母集団の平均 μ0は母集団から抽出した標本の平均(=母集団の平均の推定値)
背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)
手順2:有意水準を決める
確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある
手順3:検定統計量を計算する
その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
Z検定の場合はZ値が検定統計量.
Z値は値を0,標準偏差(分散)=(平均値の話の場合は標準誤差)を1として変換したもの
全国模試の平均点が60標準偏差が8点だった.自身の会場では16人で試験を行ったとき平均点が66点だった場合
全国模試の平均点を0にすると16人の試験の平均点は6点(66-6)
全国模試の標準偏差が8点だった時,16人で試験を行った時の平均値の標準誤差は8/√16=2
Z値は6/2=3.0
手順4:有意水準と比較し、仮説を棄却採択する
有意水準両側5%の時のZの境界値は標準正規分布表より1.96
帰無仮説H0を棄却し対立仮説H1採択


検定と推定の違い

推定
orcstat2020-0602.png(11589 byte)
検定
orcstat2020-0603.png(12754 byte)

Z検定

標準正規分布を用いた検定
先週の推定と同じもの.Z検定は基本ではあるが適用できないケースが多くt検定がよく使われるが,統計の授業になってしまうので個々では割愛

αエラー βエラー

教科書P171表2

第一種の過誤
αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤(βエラー)・・・誤って一緒と判定する確率
βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1-検出力(Power)=β
検出力=1-β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8~0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.

仮説検定は用法を守り正しく使いましょう

例題

我が国における男子中学生の50m走の平均タイムは8秒02,標準偏差は0.75秒だった
皆さんが特別に指導している男子中学生のチーム64人のタイムを計り平均を求めたところ7秒92だった.
果たして皆さんの指導によるタイムは平均的な指導によるものと異なるのか有意水準5%で検定せよ

課題

我が国における男子中学生の身長は平均160.05cm,標準偏差は7.66であった.
皆さんが特別に指導している男子中学生のチーム64人の身長を測定したところ,165.80cmであった
全国平均と異なる集団なのか有意水準5%で検定せよ

参考資料

令和元年度全国体力・運動能力、運動習慣等調査結果(スポーツ庁)
https://www.mext.go.jp/sports/b_menu/toukei/kodomo/zencyo/1411922_00001.html

第3回 疫学の概念と歴史

到達目標
3-1疫学と易学の違いについて説明できる
3-2疫学と科学の関係について説明できる


疫学とは

ある人間集団単位における健康状態の頻度分布の観察
ある集団とは地域であったり年齢であったり・・・・
科学的に原因が解明されていなかったとしても,集団の特性と頻度分布の関係を見出せば,原因が未知でも問題を解決できることもある.
集団単位の設定が原因解明の限界になるので,それだけで真の原因に辿り着くとは限らない.

日本疫学会で示している定義は以下をご覧ください
<参考>
疫学(疫学用語の基礎知識 日本疫学会)
https://jeaweb.jp/glossary/glossary001.html

疫学の目的

公衆衛生の発展に寄与 → 疫学は集団を対象としている
公衆衛生→集団に寄与する→保健
個人衛生→個人に寄与する→保健~医療
公衆衛生の定義
「公衆衛生とは、生活環境衛生の整備、感染症の予防、個人衛生に関する衛生教育、疾病の早期診断と治療のための医療・看護サービスの組織化、および地域のすべての人々に健康保持に必要な生活水準を保証する社会機構の整備を目的とした地域社会の組織的努力を通じて、疾病を予防し、寿命を延ばし、身体的・精神的健康と能率の増進を図る科学であり技術である。」(Winslow,1920年)
<引用>
公衆衛生医師について(全国保健所長会)
http://www.phcd.jp/02/j_ishi/

疫学の歴史

1850年代・・・イギリスにおけるコレラの流行
<参考>
ジョン・スノー(IgnazzoVol.7 BD)
https://www.bdj.co.jp/safety/articles/ignazzo/hkdqj200000awidd.html
イギリスの近代都市づくりを進めたのは実はこれらだったのです。(こだわりアカデミー athome)
https://www.athome-academy.jp/archive/history/0000000254_all.html

日本・・・脚気の克服
<参考>
高木 兼寛(宮崎県郷土先覚者 宮崎県総合政策部文化文教課)
https://www.pref.miyazaki.lg.jp/contents/org/kenmin/kokusai/senkaku/pioneer/takaki/index.html
脚気撲滅への挑戦(明治期の農林水産業発展の歩み 農水省)
https://www.maff.go.jp/j/meiji150/eiyo/02.html

先天性白内障・・・風疹
<参考>
先天性風疹症候群(にしじまクリニック)
https://nishijima-clinic.or.jp/blog/2019/11/01/%E5%85%88%E5%A4%A9%E6%80%A7%E9%A2%A8%E7%96%B9%E7%97%87%E5%80%99%E7%BE%A4/
先天性風疹症候群:5類感染症:全数把握疾患(みえの感染症ガイドブック)
http://www.kenkou.pref.mie.jp/kansen_guidebook_hp/7kansensyou/5-10sentenseihuusin.htm

O157・・・カイワレ大根
「ビジネスに関わる行政法的事案」第27回:行政の情報提供活動のありかたについて(GBLI研究所)
http://gbli.or.jp/kohyama_gyosei-27/

課題

新型コロナウイルスへの感染リスクが高まる場面について整理しておくこと
感染拡大防止特設サイト(内閣官房)
https://corona.go.jp/proposal/

第4回 暴露と疾病

到達目標
4-1 アウトカムにどのようなものがあるか説明できる
4-2 暴露の評価方法について説明できる

疾病

Disease Outcome・・・疾病の転帰
参考までに
Functional Outcome・・・機能的転帰
<出典>functional outcome(日本リハビリテーション医学会)
https://www.jarm.or.jp/nii/rihanews/No06/RN0614BD.HTM

アウトカム

どのような事象(イベント)があるのか
死亡
罹患
寛解・・・症状が治まっている状態
治癒

定義

情報をイベントのあり/なしにしないといけない
例えば評価を2段階にすると60~100を合格 60未満は不合格
細かく分けると
90点~100点を秀 80~90を優 70~80を良 60~70を可 など

4つの尺度

変量(データ)の分類・・・測定尺度
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である(P5)
1名義尺度
2順序尺度
3間隔尺度
4比率(比例)尺度

1,2を質的データ(変量)(定性的)
3,4を量的データ(変量)(定量的)
性質としては上位互換性があり
4>3>2>1

度数分布表

それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版

品名 度数 相対度数 累積度数 累積相対度数
いちご 15
みかん
ぶどう
30 1.00 ----- -----

曝露

必ずしも浴びるわけではない.
状況にさらされている という イメージ.
居住地も曝露
危険因子・・・疾病の発生確率の上昇に寄与するもの
危険因子は疾病発生よりも前に存在している
曝露も定義の話が出てくる

予防

危険因子の存在を遠ざける
遠ざけられる危険因子もあれば,出来ないものもある
可能な限り発生する確率を下げる→限りなく下げようとすると自由度が無くなっていく
COVID-19の感染予防のマスクの話は,社会全体でみると感染予防の効果が期待できるが,個人で見た場合マスク着用により自身の感染予防を期待できない(=他者への感染予防が期待)ところが,社会工学の観点から上手く回らないところがつらい

本日の課題

こちらの度数分布表の空欄埋めてください
品名 度数 相対度数 累積度数 累積相対度数
かつ丼 90
カレーライス 0.3 0.75
ラーメン
1.00 ----- -----

第5回 疫学指標

到達目標
5-1 比と率と割合の違いについて説明できる
5-2 人年について説明できる
5-3 疾病頻度測定の指標について説明できる


割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h

無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元

人年の計算法

死亡率を例として
一人の人を一年観察したとき1人年
人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存
<本来の死亡率算出>
観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5/年「1人年対0.5の死亡率」
<年央人口を用いる方法だと>
6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5/年

イベント以外での脱落も考慮したものはP21で

疾病頻度測定の指標

罹患率・・・率
累積罹患率・・・割合
有病率(時点有病率)・・・割合
期間有病率・・・割合
死亡率・・・率
致命率・・・比もしくは割合

<参考>
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/

本日の課題

220人の患者を1年間観察しました. この一年でAという疾患に罹患した方は15名,その他で脱落(転居等)が25名でした.
罹患率を求めてください(単位は千人あたりの年間の人数で)

告知

来週はシラバス通り「これまでのまとめおよび確認テスト」を実施します

第7回 疫学研究(1)記述疫学,生態学的研究

到達目標
7-1 記述疫学の重要性について説明できる
7-2 生態学的研究の利点と欠点を説明できる

記述疫学

特段曝露について触れたものではない
ただし,人,場所,時間という曝露はあるが
記述統計と言われるものと同じ格好で,状況を可視化するもの

生態学的研究

集団レベルで曝露と疾病頻度の関係をみる.
仮説を形成するところまで 個人レベルで曝露と疾病頻度に関係が無くても集団レベルで行うと,関係が見えてくる場合がある → 謎理論誕生
集団を代表する値・・・代表値
よく使われるのが平均値.その他には 中央値=50%タイル値
順番(昇順)に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
25%タイル値は,小さい方から数えて25%=1/4の所に位置する対象の値
nmubiostat2016-0301.png(17266 byte)
以下集団レベルでみることの限界について相関係数の話から

相関

correlative
相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか

因果

cause and effect
原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない

普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)

たばこを吸う-肺がん・・・・相関関係○

タバコを吸う人にコーヒーを飲む人が多いのは・・・(yahoo知恵袋)
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1293675642
この関係を使うと
コーヒーを飲む-肺がん・・・相関関係○

コーヒー愛飲者に肺がんが多い理由は?生活習慣との関連を検証
アメリカで約50万人を対象にした調査から
from International journal of epidemiology
http://medley.life/news/item/5589521b660815fe00d5ec8e

コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関

例(空想):年末に私の前を歩く人から「ついてこないで!」と言われるが、別にその人を追いかけているわけではない。お互い宝くじ売り場に向かっているだけ

この授業(統計学)は医療系対象で「提供する医療が及ぼす影響やその要因に関する法則性を見いだす方法を探求する学問分野」(再掲)
知りたいのは「影響」が何なのかであるから目的を見失わないように

相関図

X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)
とりあえず図にすると関係が直感的にわかる(場合がある)

相関係数

-1から1までの値をとる
Xが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0
r=sxy/(sx×sy))
sxはxの標準偏差
syはyの標準偏差
sxyは共分散

X軸で見たときのバラツキ具合とY軸で見たときのバラツキ具合を元に計算してる
バラツキ=散布度・・・分散・・・偏差の二乗の平均
共分散=ある対象のX軸の偏差とY軸の偏差を乗じたものがベース
  
Xの偏差 Yの偏差 乗じた結果
乗じた結果の平均が共分散
共分散はX軸Y軸のバラツキ具合が混ざっているのでそのままの数字だと解釈しにくい→XとYの標準偏差で除する(正規化)→相関係数

直線では無い場合は変数変換(例えば対数変換)してから計算する。

回帰直線

X軸の値とY軸の値を数式(y=ax+b)で示す
直線を引いたときにそれぞれの点からの差(残差)の2乗して足したもの(平方和)が最も小さい時の数式が回帰直線

決定係数

相関係数を二乗したもの
数式によって説明できる割合を示す。(寄与率とも)
高ければ高いほど数式で説明出来る

相関係数を集団でみた場合と個でみた場合の違い

kuswepi2021-07.xlsx

本日の課題

1)1回目の授業の課題データより中央値を求めよ
2)以下のデータより相関係数を求めよ
kuswepi2021-0701.png(4887 byte)

第8回 疫学研究(2)横断研究,コホート研究

到達目標
8-1 横断研究とコホート研究の違いついて説明できる
8-2 コホート研究と回顧的コホート研究の違いについて説明できる

横断研究

曝露と疾病発生を同時に評価・・・どちらも妥当性が高い
・利点(調査コスト)
・欠点(どちらが原因?)

コホート研究

コホート・・・追跡する集団
結果より原因が先行する・・・原因(曝露)に基づく集団・・・曝露情報の妥当性が高い
・利点(時間の流れに沿った解釈が出来る 稀な曝露に対応できる)
・欠点(追跡にコストがかかる 稀な疾患には対応困難)

回顧的コホート研究

過去に曝露情報が明らかになっている集団を現在から遡る
現存する資料のみ・・・コホート研究と対極的.観察の方向性はコホート研究と同じ
・近年は保険請求のデータなどを用いた分析なども行われている
(情報の二次利用)
nmucommed2017-01.png(276444 byte)
奈良県立医科大学大学院看護学研究科 地域医療学(分担:データ分析編) より)
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある(細かい場合は粗くできるが粗いものは推定するしかない)

相対危険

relative risk

説明用データ

疾病発症 疾病無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A~D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)

曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)

頻度について
集団の中でのイベント数(発生回数)
説明用データや下記の参考では累積罹患(率)(つまり割合)で求めた話
無論罹患率や死亡率などでも求められる.(教科書P29参照)
参考
相対危険(日本疫学会)
https://jeaweb.jp/glossary/glossary017.html
フレミンガムでの試み(医学会新聞 医学書院)
https://www.igaku-shoin.co.jp/paper/archive/old/old_article/n2002dir/n2516dir/n2516_05.htm

本日の課題

以下のサイトにある部位別のがん死亡率のデータより一つ部位を選び,女性に対する男性のリスク比を求めよ
最新がん統計(がん情報サービス 国立研究開発法人国立がん研究センター)
https://ganjoho.jp/reg_stat/statistics/stat/summary.html

第9回 疫学研究(3)症例対照研究

到達目標
9-1 コホート研究と症例対照研究のそれぞれの利点について説明できる
9-2 コホート研究と症例対照研究で適切な指標で相対危険(度)を求めることができる

症例対照研究

症例群,対照群・・・過去に遡って追跡する集団
観察の方向性では原因より結果が先行する・・・結果に基づく集団・・・疾病発生情報の妥当性が高い
・利点(短時間で行える 稀な疾患に対応できる)
・欠点(曝露に関する妥当性が低い)

相対危険(度)

Relative Risk・・・一般用語
罹患率比,オッズ比などなど
説明用データ
疾病発症 疾病無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比(先週の振り返り+α)

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A~D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)

曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
 リスク比≒A/B/C/D=AD/BC

オッズ比

Odds Ratio(OR)
危険な事象が起きた場合と起きなかった場合の指標の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの

発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
    =AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる

資料

コホート研究
不整脈あり 不整脈なし
曝露群 100 1900 2000
非曝露群 50 1950 2000
150 3850 4000
症例対照研究
不整脈あり 不整脈無し
曝露歴あり 50 30 80
曝露歴無し 50 70 120
100 100

対照

選択には性と年齢をマッチ

病院対照

同一医療機関の受診者

近隣対照

同居の家族,隣近所

一般集団対照

本日の課題

1)資料の「コホート研究」「症例対照研究」からそれぞれリスク比とオッズ比を求めて比較せよ.
2)なぜ症例対象研究では,コホート研究と異なり相対危険をリスク比で示すことが出来ないのか,説明せよ
(1は授業中に追加したもの)

第10回 疫学研究(4)介入研究

到達目標
10-1 介入研究とコホート研究の違いついて説明できる
10-2 介入研究において非介入群に対する配慮の必要性について説明できる

介入

割り込む・・・被験者に強制的に曝露(起こる/起こらない)を割り付ける.
普段,割り込みは意識して行っている(と思います).→私の前には割り込むが高級外車の車の前には割り込まない

研究者の意向が入ってしまうがチョイスしていない → 無作為割付
RCT(Randomized Controll Trial)無作為割付介入研究

介入研究の利点と欠点

交絡因子の制御が期待できる.→第7回の授業で交絡は説明済み・・・対策は次回以降で
介入は疾病予防に関するものに限定される
介入できないもの・・・家族,収入,学歴,職業などなど
介入結果の結果はreal worldを反映していないのでは ⇔ real world dataは実態を反映しているものの,そこから正しく知見を見出せるのか

非介入群への配慮

クロスオーバーデザイン
他にもいろいろな方法が

疫学研究方法まとめ

表4-4,表4-6

本日の課題

介入研究とコホート研究の相違点について簡潔にまとめよ

第11回 偏りと交絡

到達目標
11-1 誤差には二つの要因からなっていることを説明できる
11-2 交絡因子に配慮できるようになる

ohsustat2016-01a.png(206456 byte)
時計がズレる理由 ①精度(月±15秒以内)) ②時刻合わせ(電波,177,誰かの時計etc)

母集団と標本

母集団・・・標的集団
標本・・・・観察対象集団
標的集団=観察対象集団・・・全数調査 悉皆調査 センサス
センサスの語源(総務省統計局)
https://www.stat.go.jp/data/e-census/guide/about/alacarte/origin.html
標本・・・無作為抽出が原則
(昆虫標本は作為的)
標本から100%データを得られるわけでもない・・・観察集団

誤差の分類

偶然誤差と系統誤差
偶然誤差 発生を抑えるのは困難・・・どうしようもないわけでもない(少なくする(精度を上げる)にはコスト(時間,回数等)を掛ける)
系統誤差・・・交絡と偏り(選択,情報,観察)
交絡・・・第7回参照の講義参照
選択・・・標本の抽出に関するあれこれ
情報・・・実態と異なる情報になってしまう.集団の特性によるところも
(観察・・・情報バイアスの一つ 観察者が知っているが故に影響を与えてしまうことP103面接者バイアス)
<参考>バイアスの種類とその対策(1)(若井建志, 大野良之,第34巻 日循協誌 第1号)
https://www.jstage.jst.go.jp/article/jjcdp1974/34/1/34_1_42/_pdf
バイアスは他にも色々
<参考>質的研究で避けるべき7つのバイアス(エディテージ・インサイト)
https://www.editage.jp/insights/7-biases-to-avoid-in-qualitative-research

検定か推定か

1~2回目の講義参照

有意差検定が無意味な場合

有意水準5%で差が見られた場合でも,着目すべきものといえるかどうかは別な部分もある
→統計的有意差と臨床的有意差の話
効果量に対する必要データ数を可変させたものが以下

 各群10データで検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
 各群1000データぐらいで検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
 nmubiostat2016-0901.png(37095 byte)
   <参考>その治療は臨床的に有益か(PEDro)
 https://www.pedro.org.au/japanese/tutorial/is-the-therapy-clinically-useful/
 <参考>統計的有意性とP値に関するASA声明
 http://biometrics.gr.jp/news/all/ASA.pdf
 以下抜粋しました
 1. P値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
 2. P値は、調べている仮説が正しい確率を測るものではない
 3. 科学的な結論は、P値がある値を超えたかどうかにのみ基づくべきではない
 4. 適正な推測のためには、すべてを報告する透明性が必要
 5. P値は、効果の大きさや結果の重要性を意味しない
 6. P値は、それだけでは仮説に関するエビデンスのよい指標とはならない
・データ数大きい場合は区間推定のほうが意味ある。

差異誤分類と非差異誤分類

図5-5説明できるように
(数式出てきて変数が沢山出てくるとギョッとしますよね)

交絡因子とその制御

性と年齢と人種は交絡因子として扱われる
計画段階で可能なこと,解析段階で制御する方法もある・・・後回ししたくなるから解析に頼りたくなるが・・・

計画段階

無作為割付
曝露(介入)と非曝露(非介入)を無作為に割り付け
限定
交絡因子の一つの状態のみ対象
マッチング
交絡因子の分布が曝露と非曝露群の間で均等に

解析段階

層化
交絡因子の層ごと(分類ごと)に解析
数学的モデリング
多変量解析→教科書第10章参照
第7回で相関の話をしたが,それは2変量の関係の話

本日の課題

平均値の差の検定により統計的な有意差が見られたとしても,臨床的には(現実には)意味が無いものの例を挙げよ.

第12回 標準化

到達目標
12-1SMRの計算ができる
12-2直接法と間接法の違いを説明できる

集団間の比較において年齢構成による影響をを除く話

年齢調整死亡率

年齢によって死亡率が変わるのは自明
年齢で区切って死亡率を評価する

直接法

モデル人口を用意して観察集団の年齢階級別(粗)死亡率をモデル人口における対象とする年齢階級の割合を乗ずる方法
例題 A市
年齢階級 死亡率(人口10万対)
年少人口(~15) 60
生産年齢人口(15~65) 250
老年人口(65~) 3000
B市
年齢階級 死亡率(人口10万対)
年少人口(~15) 50
生産年齢人口(15~65) 200
老年人口(65~) 4500
基準集団(昭和60年モデル)
年齢階級 人口
年少人口(~15) 25,015,000
生産年齢人口(15~65) 82,654,000
老年人口(65~) 12,618,000
総人口 120,287,000
昭和60年モデル資料
平成29年度人口動態統計特殊報告 平成27年都道府県別年齢調整死亡率の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/other/15sibou/index.html
「1.年齢調整死亡率について」を参照

間接法

モデル人口を用意してモデル人口における年齢階級別死亡率を観察集団の年齢階級別人口を乗ずる
全年齢の死亡数を求め積算したもので,観察集団の死亡数を除する.
例題 C市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 130,000 ----- -----
生産年齢人口(15~65) 700,000 ----- -----
老年人口(65~) 200,000 ----- -----
1,030,000 9,000
D市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
年少人口(~15) 200,000 ----- -----
生産年齢人口(15~65) 500,000 ----- -----
老年人口(65~) 330,000 ----- -----
1,030,000 9,000
基準死亡率
年齢階級 人口10万対
年少人口(~15) 40
生産年齢人口(15~65) 200
老年人口(65~) 3,000

課題

1)例題のA市B市の年齢調整死亡率を算出・比較し,直接法の利点・欠点について考察せよ
2)例題のC市D市のSMRを算出・比較し,間接法の利点・欠点について考察せよ

第13回 スクリーニング

到達目標
スクリーニングの有効性について,ROC曲線の作成や3つのバイアスについて理解する.
13-1ROC曲線を作成し,検査法の比較や適切なカットオフ値の検討ができる.
13-23つのバイアスの特徴を説明できる

スクリーニング

無症状だがある疾患に罹患している可能性のある集団に検査
①重篤 ②経過の変化が期待できる ③有病率が高い

感度と特異度

感度=P(陽性|D)  疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1-偽陽性率 非疾患群における真陰性の割合
予測値
有病率の影響を受ける
 陽性的中率=P(D|陽性)
 陰性的中率=P(Dc|陰性)

参考

File 3. 検査結果と有病率の関係(JMP-SAS Institute Inc.)
https://www.jmp.com/ja_jp/medical-statistics/column/non-series/test-results-prevalence.html
検査法の評価指標
 尤度比=感度/偽陽性率 
 オッズ比=教科書参照 検査の有用性
 ROC-AUC=ROC曲線を描いて算出 検査の分別能

何でも陽性と判断する検査は感度も偽陽性率も1になる
(なんでもかんでも、あります!! のノリ)

ROC曲線

判別度の分析
感度と偽陽性率(1-特異度)を用いて曲線を描く

スクリーニングの効果判定におけるバイアス

リード・タイム・バイアス・・・早期に発見するとその分経過は長くなる
レングス・バイアス・・・進行の速い病態は発見されにくい
セルフ・セレクション・バイアス・・・そもそも参加する人が偏っている

課題

1)次のマンモグラフィの検査結果からROC曲線を描き、AUCを(小数点以下2桁まで求め四捨五入)求め、カットオフ値の検討をせよ
<参考>
森本 忠興,日本の乳癌検診の歴史と課題,日乳癌検診学会誌,18(3)211-231,2009
https://www.jstage.jst.go.jp/article/jjabcs/18/3/18_3_211/_article/references/-char/ja/
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 0 4 14 12 10 40
非疾患群 20 20 12 8 0 60
2)以下のデータと1)を比較しどちらの系がより優れているか
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 1 5 16 10 8 40
非疾患群 20 16 14 10 0 60
AUCの求め方は以下のように三角形と台形の面積を求めて足し合わせる事
kuswepi2020-1101.jpg(20603 byte)

第14回 サーベイランスと疾病登録

到達目標
疾病頻度の推移を観察することを目的とするサーベイランスと疾病登録について理解する..
14-1サーベイランスの概要について説明できる
14-2疾病頻度のデータを入手し状況を把握する

サーベイランス

目的:疾病の予防と管理
データの収集→整理・解析・解釈→情報の還元→予防と管理の実行
<参考>
データと情報の違い
joho20150613-5.png(149915 byte)
よりよい医療に貢献する医療情報技師の役割 より)

疾病登録

迅速な情報還元は目的としない.
1:患者へのサービス提供
2:疫学研究
3:疾病対策の基礎資料

登録項目

1:個人同定情報
2:疾患に関する情報
3:追跡情報
感染症発生動向調査年別一覧表-2019-(国立感染研究所感染症情報センター)
https://www.niid.go.jp/niid/ja/ydata.html
参考資料
感染症の範囲及び類型について(第3回 厚生科学審議会感染症部会)
https://www.mhlw.go.jp/file/05-Shingikai-10601000-Daijinkanboukouseikagakuka-Kouseikagakuka/0000040509.pdf
感染症法に基づく医師の届出のお願い(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/kekkaku-kansenshou/kekkaku-kansenshou11/01.html
感染症発生動向調査 週報(IDWR)(国立感染研究所感染症情報センター)
https://www.niid.go.jp/niid/ja/idwr.html
http://idsc.nih.go.jp/idwr/ydata/report-J.html
感染症情報 統計に関するリンク(厚生労働省)
https://www.mhlw.go.jp/bunya/kenkou/kekkaku-kansenshou15/02-01.html
新型コロナウイルス感染症を指定感染症として定める等の政令(官報令和2年1月28日)
https://www.mhlw.go.jp/content/10900000/000589748.pdf
新型コロナの「指定感染症」は過剰。インフルエンザと同じ「5類感染症」に(論座)
https://webronza.asahi.com/national/articles/2020101800001.html
本日の課題

第15回 疫学と倫理・まとめ


倫理,プライバシー,個人情報保護法や,次世代医療基盤法などについて理解する.