関西福祉大学 疫学2020
(教育学部保健教育学科)

授業について

教科書

基礎から学ぶ楽しい疫学(医学書院)
https://www.igaku-shoin.co.jp/bookDetail.do?book=108378

私は「脚注で学ぶ楽しい疫学」とタイトルを読み替えています.

電卓使いますのでよろしくお願いします(授業中はスマホで可ですが試験の時は×)
そもそも試験の時に電卓を使うべきかどうかも悩んでいます


授業メニュー(オンデマンド形式の講義になります.閲覧は[配信前半][配信後半]をクリック.)
動画の閲覧にはパスワードが必要となります.ポータルサイトdotcampusに掲載しています.確認ください
iOS 11以降のiphone等で閲覧が出来ない場合があります.androidやPC等他の端末での閲覧を推奨します
もしiphone等で閲覧したい場合は自己判断の上以下の設定をしてください.
[設定]→[Safari]→[サイト越えトラッキングを防ぐ]を無効
<参考>iPhone向けSafariで「サイト越えトラッキングを防ぐ」機能をオフにする(Yahoo)
https://support.yahoo-net.jp/SccYjcommon/s/article/H000012099

第1回 疫学の概念と歴史 [講義前半] [講義後半]

第2回 暴露と疾病 [講義前半] [講義後半]

第3回 疫学指標 [講義前半] [講義後半]

第4回 疫学研究(1)記述疫学,生態学的研究 [講義前半] [講義後半]

第5回 疫学研究(2)横断研究,コホート研究 [講義前半] [講義後半]

第6回 疫学研究(3)症例対照研究 [講義前半] [講義後半]

第7回 疫学研究(4)介入研究 [講義前半] [講義後半]

第8回 これまでのまとめおよび確認テスト(シラバスから変更有)

第9回 偏りと交絡

第10回 標準化

第11回 スクリーニング

第12回 サーベイランスと疾病登録

第13回 疫学に必要な統計(1)推定と検定

第14回 疫学に必要な統計(2)多変量解析

第15回 疫学と倫理・まとめ



第1回 疫学の概念と歴史

到達目標
1−1疫学と易学の違いについて説明できる
1−2疫学と科学の関係について説明できる


疫学とは

ある人間集団単位における健康状態の頻度分布の観察
ある集団とは地域であったり年齢であったり・・・・
科学的に原因が解明されていなかったとしても,集団の特性と頻度分布の関係を見出せば,原因が未知でも問題を解決できることもある.
集団単位の設定が原因解明の限界になるので,それだけで真の原因に辿り着くとは限らない.

日本疫学会で示している定義は以下をご覧ください
<参考>
疫学(疫学用語の基礎知識 日本疫学会)
https://jeaweb.jp/glossary/glossary001.html

疫学の目的

公衆衛生の発展に寄与 → 疫学は集団を対象としている
公衆衛生→集団に寄与する→保健
個人衛生→個人に寄与する→保健〜医療
公衆衛生の定義
「公衆衛生とは、生活環境衛生の整備、感染症の予防、個人衛生に関する衛生教育、疾病の早期診断と治療のための医療・看護サービスの組織化、および地域のすべての人々に健康保持に必要な生活水準を保証する社会機構の整備を目的とした地域社会の組織的努力を通じて、疾病を予防し、寿命を延ばし、身体的・精神的健康と能率の増進を図る科学であり技術である。」(Winslow,1920年)
<引用>
公衆衛生医師について(全国保健所長会)
http://www.phcd.jp/02/j_ishi/

疫学の歴史

1850年代・・・イギリスにおけるコレラの流行
<参考>
ジョン・スノー(IgnazzoVol.7 BD)
https://www.bdj.co.jp/safety/articles/ignazzo/hkdqj200000awidd.html
イギリスの近代都市づくりを進めたのは実はこれらだったのです。(こだわりアカデミー athome)
https://www.athome-academy.jp/archive/history/0000000254_all.html

日本・・・脚気の克服
<参考>
高木 兼寛(宮崎県郷土先覚者 宮崎県総合政策部文化文教課)
https://www.pref.miyazaki.lg.jp/contents/org/kenmin/kokusai/senkaku/pioneer/takaki/index.html
脚気撲滅への挑戦(明治期の農林水産業発展の歩み 農水省)
https://www.maff.go.jp/j/meiji150/eiyo/02.html

先天性白内障・・・風疹
<参考>
先天性風疹症候群(にしじまクリニック)
https://nishijima-clinic.or.jp/blog/2019/11/01/%E5%85%88%E5%A4%A9%E6%80%A7%E9%A2%A8%E7%96%B9%E7%97%87%E5%80%99%E7%BE%A4/
先天性風疹症候群:5類感染症:全数把握疾患(みえの感染症ガイドブック)
http://www.kenkou.pref.mie.jp/kansen_guidebook_hp/7kansensyou/5-10sentenseihuusin.htm

O157・・・カイワレ大根
「ビジネスに関わる行政法的事案」第27回:行政の情報提供活動のありかたについて(GBLI研究所)
http://gbli.or.jp/kohyama_gyosei-27/

本日の課題

ポータルサイトdotcampusを参照のこと. 受講日当日の8:00〜22:00の間に提出のこと. 提出をもって出席の扱いとする.
<参考>
平成26年度研究報告書国際共同症例対照研究における多様な携帯電話端末・通話形式と健康に関する調査・分析・評価(総務省)
https://www.tele.soumu.go.jp/resource/j/ele/body/report/pdf/h26_02.pdf

授業後補足

世界で初めて全身麻酔手術に成功したのは、日本人医師だった。華岡青洲(医療の挑戦者たち14全身麻酔手術 テルモ株式会社)
https://www.terumo.co.jp/challengers/challengers/14.html

脚気の発生(明治期の農林水産業発展の歩み 農水省)
https://www.maff.go.jp/j/meiji150/eiyo/01.html


第2回 暴露と疾病

到達目標
2−1 アウトカムにどのようなものがあるか説明できる
2−2 暴露の評価方法について説明できる

疾病

Disease Outcome・・・疾病の転帰
参考までに
Functional Outcome・・・疾病的転帰
<出典>functional outcome(日本リハビリテーション医学会)
https://www.jarm.or.jp/nii/rihanews/No06/RN0614BD.HTM

アウトカム

どのような事象(イベント)があるのか
死亡
罹患
寛解・・・症状が治まっている状態
治癒

定義

情報をイベントのあり/なしに落とさないといけない
4つの尺度の話
<参考>第2回 尺度・度数分布(奈良県立医科大学 生物統計学2020(医学部医学科))
https://medbb.net/education/nmubiostat2020/index.html#2

異なる軸では自覚症状があるのか?受診しているのか?(我慢型,気づかず型,・・)

曝露

必ずしも浴びるわけではない.
状況にさらされている という イメージ.
居住地も曝露
危険因子・・・疾病の発生確率の上昇に寄与するもの
危険因子は疾病発生よりも前に存在している
曝露も定義の話が出てくる

予防

危険因子の存在を遠ざける
遠ざけられる危険因子もあれば,出来ないものもある
可能な限り発生する確率を下げる→限りなく下げようとすると自由度が無くなっていく
COVID-19の感染予防のマスクの話は,社会全体でみると感染予防の効果が期待できるが,個人で見た場合マスク着用により自身の感染予防を期待できない(=他者への感染予防が期待)ところが,社会工学の観点から上手く回らないところがつらい

本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第3回 疫学指標

到達目標
3−1 比と率と割合の違いについて説明できる
3−2 人年について説明できる
3−3 疾病頻度測定の指標について説明できる


割合(比率)

proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0〜1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%

ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method

rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h

無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元

人年の計算法

死亡率を例として
一人の人を一年観察したとき1人年
人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存
<本来の死亡率算出>
観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5/年「1人年対0.5の死亡率」
<年央人口を用いる方法だと>
6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5/年「1人年対0.5の死亡率」

疾病頻度測定の指標

罹患率・・・率
累積罹患率・・・割合
有病率(時点有病率)・・・割合
期間有病率・・・割合
死亡率・・・率
致命率・・・比もしくは割合

<参考>
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/


本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第4回 疫学研究(1)記述疫学,生態学的研究

到達目標
4−1 記述疫学の重要性について説明できる
4−2 生態学的研究の利点と欠点を説明できる

e-stat

予習しましたか?
学校保健統計調査(文部科学省)
https://www.mext.go.jp/b_menu/toukei/chousa05/hoken/1268826.htm
目的:学校における幼児、児童及び生徒の発育及び健康の状態を明らかにする
学校保健統計調査(e-stat)
https://www.e-stat.go.jp/stat-search/files?page=1&toukei=00400002&tstat=000001011648
学校保健統計調査 / 令和元年度 参考(学校保健統計調査による身長発育値及び発育曲線)
https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00400002&tstat=000001011648&cycle=0&tclass1=000001138504&tclass2=000001138548&stat_infid=000031925092

グラフで出てきた「パーセンタイル」とは?
中央値=50%タイル値
順番(昇順)に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
25%タイル値は,小さい方から数えて25%=1/4の所に位置する対象の値
nmubiostat2016-0301.png(17266 byte)

記述疫学

特段曝露について触れたものではない
人,場所,時間
令和元年(2019)人口動態統計(確定数)の概況(厚生労働省)
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/kakutei19/index.html
Excel表 第2表−2 人口動態総覧(率)の年次推移

生態学的研究

集団レベルで曝露と疾病頻度の関係をみる.

本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第5回 疫学研究(2)横断研究,コホート研究

到達目標
5−1 横断研究とコホート研究の違いついて説明できる
5−2 コホート研究と回顧的コホート研究の違いについて説明できる

横断研究

曝露と疾病発生を同時に評価・・・どちらも妥当性が高い
・利点(調査コスト)
・欠点(どちらが原因?)

コホート研究

コホート・・・追跡する集団
結果より原因が先行する・・・原因(曝露)に基づく集団・・・曝露情報の妥当性が高い
・利点(時間の流れに沿った解釈が出来る 稀な曝露に対応できる)
・欠点(追跡にコストがかかる 稀な疾患には対応困難)

回顧的コホート研究

過去に曝露情報が明らかになっている集団を現在から遡る
現存する資料のみ・・・コホート研究と対極的.観察の方向性はコホート研究と同じ
・近年は保険請求のデータなどを用いた分析なども行われている
(情報の二次利用)
集団から個々のデータをとりまとめて示すので・・・
nmucommed2017-01.png(276444 byte)
奈良県立医科大学大学院看護学研究科 地域医療学(分担:データ分析編) より)
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある(細かい場合は粗くできるが粗いものは推定するしかない)

本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第6回 疫学研究(3)症例対照研究

到達目標
6−1 コホート研究と症例対照研究のそれぞれの利点について説明できる
6−2 コホート研究と症例対照研究で適切な指標で相対危険(度)を求めることができる

症例対照研究

症例群,対照群・・・過去に遡って追跡する集団
観察の方向性では原因より結果が先行する・・・結果に基づく集団・・・疾病発生情報の妥当性が高い
・利点(短時間で行える 稀な疾患に対応できる)
・欠点(曝露に関する妥当性が低い)

相対危険(度)

Relative Risk・・・一般用語
罹患率比,オッズ比などなど
説明用データ
疾病発症 疾病無
曝露有 A B A+B
曝露無 C D C+D
A+C B+D

リスク比

Risk Ratio(RR)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら

A〜D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)

曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
 リスク比≒A/B/C/D=AD/BC

オッズ比

Odds Ratio(OR)
危険な事象が起きた場合と起きなかった場合の指標の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの

発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
    =AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる

資料

コホート研究
不整脈あり 不整脈なし
曝露群 100 1900 2000
非曝露群 50 1950 2000
150 3850 4000
症例対照研究
不整脈あり 不整脈無し
曝露歴あり 50 30 80
曝露歴無し 50 70 120
100 100

本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第7回 疫学研究(4)介入研究

到達目標
7−1 介入研究とコホート研究の違いついて説明できる
7−2 介入研究において非介入群に対する配慮の必要性について説明できる

介入

割り込む・・・被験者に強制的に曝露(起こる/起こらない)を割り付ける.
普段,割り込みは意識して行っている(と思います).→私の前には割り込むが高級外車の車の前には割り込まない

研究者の意向が入ってしまうがチョイスしていない → 無作為割付
RCT(Randomized Controll Trial)無作為割付介入研究

介入研究の利点と欠点

交絡因子の制御が期待できる.→次回以降で
介入は疾病予防に関するものに限定される
介入できないもの・・・家族,収入,学歴,職業などなど
介入結果の結果はreal worldを反映していないのでは ⇔ real world dataは実態を反映しているものの,そこから正しく知見を見出せるのか

非介入群への配慮

クロスオーバーデザイン
他にもいろいろな方法が

本日の課題

ポータルサイトdotcampusを参照のこと.
受講日当日(金曜日)の22:00迄に提出のこと.
提出をもって出席の扱いとする.

第8回 これまでのまとめおよび確認テスト

到達目標
1−1これまでの課題について理解する
1−2自身の講義に対する理解が不足している部分がわかる
ここから対面講義

本日の課題

ポータルサイトdotcampusを参照のこと.
講義週の週末(日曜日)の22:00迄に提出のこと.

第9回 偏りと交絡

到達目標
9−1 誤差には二つの要因からなっていることを説明できる
9−2 交絡因子に配慮できるようになる

ohsustat2016-01a.png(206456 byte)
時計がズレる理由 @精度(月±15秒以内)) A時刻合わせ(電波,177,誰かの時計etc)

母集団と標本

母集団・・・標的集団
標本・・・・観察対象集団
標的集団=観察対象集団・・・全数調査 悉皆調査 センサス
センサスの語源(総務省統計局)
https://www.stat.go.jp/data/e-census/guide/about/alacarte/origin.html
標本・・・無作為抽出が原則
(昆虫標本は作為的)
標本から100%データを得られるわけでもない・・・観察集団

誤差の分類

偶然誤差と系統誤差
偶然誤差 発生を抑えるのは困難・・・どうしようもないわけでもない(少なくする(精度を上げる)にはコスト(時間,回数等)を掛ける)
系統誤差・・・交絡と偏り(選択,情報,観察)
交絡・・・改めて
選択・・・標本の抽出に関するあれこれ
情報・・・実態と異なる情報になってしまう.集団の特性によるところも
(観察・・・情報バイアスの一つ 観察者が知っているが故に影響を与えてしまうことP103面接者バイアス)
<参考>バイアスの種類とその対策(1)(若井建志, 大野良之,第34巻 日循協誌 第1号)
https://www.jstage.jst.go.jp/article/jjcdp1974/34/1/34_1_42/_pdf
バイアスは他にも色々
<参考>質的研究で避けるべき7つのバイアス(エディテージ・インサイト)
https://www.editage.jp/insights/7-biases-to-avoid-in-qualitative-research

検定か推定か

統計の授業資料参照ください
第5回 推測統計(T)−推定(大阪リハビリテーション専門学校 統計学2019)
https://medbb.net/education/ocrstat2019/#5

差異誤分類と非差異誤分類

図5−5説明できるように
(数式出てきて変数が沢山出てくるとギョッとしますよね)

交絡因子

曝露と疾病の関係に入り込む.
AとBに関係があるように見えるが実は無くて,Cの影響によりAとBに関係があるように見えていた.

<参考>交互作用
AとBに関係が無いように見えるが,Cの観点で切り分けてから関係を見なおすとAとBに関係が見られる状況
または,AとBに関係が見られているもののCの観点で切り分けるとそれぞれの関係に違いが見られる状況

3つの要件
性と年齢と人種は交絡因子として扱われる

本日の課題

ポータルサイトdotcampusを参照のこと.

第10回 標準化

到達目標
1−1SMRの計算ができる
1−2直接法と間接法の違いを説明できる

集団間の比較において年齢構成による影響をを除く話

直接法

モデル人口を用意して観察集団の年齢階級別死亡率をモデル人口における対象とする年齢階級の割合を乗ずる方法
例題 A市
年齢階級 死亡率(人口10万対)
0-14 400
15-64 10000
65- 80000
B市
年齢階級 死亡率(人口10万対)
0-14 800
15-64 5000
65- 15000
基準集団
年齢階級 人口
0-14 400
15-64 1000
65- 1400

間接法

モデル人口を用意してモデル人口における年齢階級別死亡率を観察集団の年齢階級別人口を乗ずる
全年齢の死亡数を求め積算したもので,観察集団の死亡数を除する.
例題 A市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
0-14 130000
15-64 700000
65- 200000
9000
B市
年齢階級 人口構成 死亡期待数 実際の死亡数 SMR
0-14 160000
15-64 600000
65- 400000
9000
基準死亡率
年齢階級 人口10万対
0-14 300
15-64 800
65- 1200

第11回 スクリーニング

到達目標
スクリーニングの有効性について,ROC曲線の作成や3つのバイアスについて理解する.
11−1ROC曲線を作成し,検査法の比較や適切なカットオフ値の検討ができる.
11−23つのバイアスの特徴を説明できる

スクリーニング

無症状だがある疾患に罹患している可能性のある集団に検査
@重篤 A経過の変化が期待できる B有病率が高い

感度と特異度

感度=P(陽性|D)  疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1−偽陽性率 非疾患群における真陰性の割合
予測値
有病率の影響を受ける
 陽性的中率=P(D|陽性)
 陰性的中率=P(Dc|陰性)
検査法の評価指標
 尤度比=感度/偽陽性率 
 オッズ比=教科書参照 検査の有用性
 ROC−AUC=ROC曲線を描いて算出 検査の分別能

何でも陽性と判断する検査は感度も偽陽性率も1になる
(なんでもかんでも、あります!! のノリ)

ROC曲線

判別度の分析
感度と偽陽性率(1−特異度)を用いて曲線を描く

スクリーニングの効果判定におけるバイアス

リード・タイム・バイアス・・・早期に発見するとその分経過は長くなる
レングス・バイアス・・・進行の速い病態は発見されにくい
セルフ・セレクション・バイアス・・・そもそも参加する人が偏っている

問題

1)次のマンモグラフィの検査結果からROC曲線を描き、AUCを(小数点以下2桁まで求め四捨五入)求め、カットオフ値の検討をせよ
<参考>
森本 忠興,日本の乳癌検診の歴史と課題,日乳癌検診学会誌,18(3)211-231,2009
https://www.jstage.jst.go.jp/article/jjabcs/18/3/18_3_211/_article/references/-char/ja/
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 0 4 14 12 10 40
非疾患群 20 20 12 8 0 60
2)以下のデータと1)を比較しどちらの系がより優れているか
異常なし(1) 良性(2) 悪性を否定できない(3) 悪性の疑い(4) 悪性(5)
疾患群 1 5 16 10 8 40
非疾患群 20 16 14 10 0 60
AUCの求め方は以下のように三角形と台形の面積を求めて足し合わせる事
kuswepi2020-1101.jpg(20603 byte)

第12回 サーベイランスと疾病登録

到達目標
疾病頻度の推移を観察することを目的とするサーベイランスと疾病登録について理解する..
12−1サーベイランスの概要について説明できる
12−2疾病頻度のデータを入手し状況を把握する

サーベイランス

目的:疾病の予防と管理
データの収集→整理・解析・解釈→情報の還元→予防と管理の実行
<参考>
データと情報の違い
joho20150613-5.png(149915 byte)
よりよい医療に貢献する医療情報技師の役割 より)

疾病登録

迅速な情報還元は目的としない.
1:患者へのサービス提供
2:疫学研究
3:疾病対策の基礎資料

登録項目

1:個人同定情報
2:疾患に関する情報
3:追跡情報
参考資料
感染症の範囲及び類型について(第3回 厚生科学審議会感染症部会)
https://www.mhlw.go.jp/file/05-Shingikai-10601000-Daijinkanboukouseikagakuka-Kouseikagakuka/0000040509.pdf
感染症法に基づく医師の届出のお願い(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/kekkaku-kansenshou/kekkaku-kansenshou11/01.html
年別一覧表(国立感染研究所感染症情報センター)
http://idsc.nih.go.jp/idwr/ydata/report-J.html
感染症情報 統計に関するリンク(厚生労働省)
https://www.mhlw.go.jp/bunya/kenkou/kekkaku-kansenshou15/02-01.html
新型コロナウイルス感染症を指定感染症として定める等の政令(官報令和2年1月28日)
https://www.mhlw.go.jp/content/10900000/000589748.pdf
新型コロナの「指定感染症」は過剰。インフルエンザと同じ「5類感染症」に(論座)
https://webronza.asahi.com/national/articles/2020101800001.html
本日の課題
covid19tokyo20201209_3.png(53584 byte)
covid19tokyo20201209_4.png(64924 byte)
covid19tokyo20201209_5.png(70637 byte)
出典:東京都_新型コロナウイルス陽性患者発表詳細(https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068
学籍番号
1-30  2020年9月+学籍番号の日のデータをまとめる
31-60  2020年10月+学籍番号-30の日のデータをまとめる
61-90  2020年11月+学籍番号-60の日のデータをまとめる
91-   2020年12月+学籍番号-90の日のデータをまとめる
年齢,性別,職業別に集計

1)年齢階級別の度数分布表

2)性別×職業別のクロス集計表
(職業欄が無い場合は年齢階級別×性別で作成)
<参考>
第2回 尺度・度数分布(奈良県立医科大学 生物統計学2020(医学部医学科))
https://medbb.net/education/nmubiostat2020/index.html#2
1)は以下のようなイメージ
階級 度数 相対度数 累積度数 累積相対度数
10歳未満
10代
20代
30代
40代
50代
60代
70代
80代
90代
90代
100歳以上
1.00 ----- -----
2)の様子 項目は適宜増やしてください.こちらもその他は一番最後.合計が多い順に(行列とも) 年齢の場合は階級の順序
職業・性別 男性 女性 合計
アルバイト
学生
合計

第13回 疫学に必要な統計(1)推定と検定

到達目標
母集団の状況を推し量る推定および特定の状態と異なるか判定する検定について理解する.
13−1推定と検定の相違点について理解する
13−2推定の際に出てくる1.96がどのようなものか説明できる

区間推定

ある確率分布に従うと仮定したときに、その分布に基づき、推定に幅を持たせる

正規分布

二項分布(試行回数nと成功の確率p)→(試行回数を無限大 確率を一定)→正規分布
起こる確率(チャンスを掴む確率)が一定であるとしても積み重ねていくことでバラツキ(差)が出てしまう
人など生物の成長に関わるものなどは、正規分布に近いとされている
平均値μと分散σ^2で確率が決まる
常に曲線下の面積=1(100%)。といって裾野は広がるばかりで閉じない
中心極限定理によりかなり強力(通用しない相手にコーシー分布がいる)

中心極限定理

母集団の分布によらず、抽出した標本の平均値は表本数が大きくなるほど近似的に正規分布に従う

区間推定の話に戻る

母平均にある確率で入る幅を持った推定値
母平均は一つ(当然)だが、標本平均は標本ごとに異なる(当然)ので幅を持たせてある確率(95%)で母平均を表せるように
nmubiostat2016-0401.png(9702 byte)

仮説検定

<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで
手順1:仮説をたてる(帰無仮説H0および対立仮説H1)
背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)
手順2:有意水準を決める
確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある
手順3:検定統計量を計算する
その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
手順4:有意水準と比較し、仮説を棄却採択する
例)帰無仮説H0を棄却し対立仮説H1採択

t分布

正規分布に基づき確率を求めるには母平均と母標準偏差が必要→nが多い場合標本平均と標本標準偏差で近似できるが
nが少ない場合は近似できない→t分布(標本の自由度νさえわかっていれば、後は検定統計量を求めれば確率がわかる)
<参考>Points of significanceコラム2:統計における推定と検定 (2)(一人抄読会)
http://syodokukai.exblog.jp/20853048/
自由度
考え方・・・標本の中で自由に振る舞うことが許されている個体の数
      統計値が母数の推定となると、自由に振る舞えない個体が出てくる(つじつま合わせ)
標本分散は偏差二乗和を個体の数で除することで求めるが母分散のほどよい推定である不偏分散はn-1(自由度)で除する

<参考>とりあえずt検定やってみたという統計の話(medbb.net)
http://www.medbb.net/education/ocrstat2015/img/01toriaezu.pdf

カイ二乗検定

本来あるべき姿(期待度数)と実際に測定されたデータ(測定度数)がどれだけかけ離れているか、その出現する確率を見ている

手順3の部分の手順

1−観察して度数を記入(観察度数)
2−観察度数より周辺度数を求める(いわゆる合計)
3−周辺度数から期待度数を求める
4−それぞれの観察度数と期待度数の差の二乗を求め、それを期待度数で除する(量的変量の分散の話に似ている・・・偏り)
5−4で求めた値を全部足す(これが検定統計量)
本日の課題
前回と同様の割り当てで
20代以下と30代以上で性別のクロス表を作成し,期待度数の表を作成せよ

第14回 疫学に必要な統計(2)多変量解析

到達目標
多変量解析の種類および生存曲線について理解する.
14−1単回帰分析と重回帰分析の相違点について理解する
14−2生存曲線を作成することができる

多変量解析の目的

・交絡因子の調整 ・・・ 単変量では調整しようがない→P110表 交絡因子の制御方法
・従属変数の予測 ・・・ 単変量も同じ

回帰分析

題材:2019(令和元)年国民生活基礎調査
https://www.mhlw.go.jp/toukei/list/20-21.html
1世帯票 第051表 1世帯当たり平均家計支出額,世帯人員・世帯主の年齢(5歳階級)別
より,1世帯当たり平均家計支出額と世帯人員の関係をみる.
kuswepi2020-1401.png(7769 byte)
kuswepi2020-1402.png(18363 byte)
世帯人員が多ければ支出額が大きくなるのは納得できるが,でも年齢が上がれば世帯人員も増えるし,支出も増えるのでは?(交絡因子)

kuswepi2020-1406.png(7655 byte)
kuswepi2020-1405.png(11372 byte)
年齢が上がると支出増える.→両方の変量で見たい→重回帰分析
世帯主の年齢階級別と世帯人員で支出をみると
kuswepi2020-1403.png(7851 byte)
kuswepi2020-1404.png(13145 byte)
年齢と世帯人員の関係も見てみたら・・・
kuswepi2020-1407.png(7177 byte)
kuswepi2020-1408.png(11454 byte)
年齢は交絡因子となるがなにも一時直線の関係にあるわけでもない

生存曲線

ことらは単変量の話のみで

カプランマイヤー法によるイベント発生率の計算

個票データ
患者ID 診断名 観察終了時期 患者ID 診断名 観察終了時期 患者ID 診断名 観察終了時期 患者ID 診断名 観察終了時期 患者ID 診断名 観察終了時期
1 b 3 11 a 8 21 b 9 31 b 24+ 41 a 3+
2b512b1422b1832a1242b8
3b613b923a12+33a3+43b24+
4b1414a124a334b1344a5+
5a7+15a225b17+35b1745b14
6a1416a326a736a3
7a1717a1327a837b15
8b2118b2128a1238b13
9b2119b1629b12+39a21
10b1620b24+30a140b18
+は打ち切り

生存率の計算

疾患a
診断からの月数 月開始時の生存数 死亡数 中途打ち切り数 死亡割合 生存割合 累積生存率
120200.1000.9000.900
218100.0560.9440.850
317320.1760.8240.700
512010.700
711110.0910.9090.636
89200.2220.7780.495
127210.2860.7140.354
134100.2500.7500.265
143100.3330.6670.177
172100.5000.5000.088
211101.0000.0000.000
疾患b
診断からの月数 月開始時の生存数 死亡数 中途打ち切り数 死亡割合 生存割合 累積生存率
325100.0400.9600.960
524100.0420.9580.920
623100.0430.9570.880
822100.0450.9550.840
921200.0950.9050.760
1219010.760
1318200.1110.8890.676
1416300.1880.8130.549
1513100.0770.9230.507
1612200.1670.8330.422
1710110.1000.9000.380
188200.2500.7500.285
216300.5000.5000.143
243030.143
nmubiostat2016-1401.png(7029 byte)
疾患a:青線
疾患b:赤線

第15回 疫学と倫理・まとめ


倫理,プライバシー,個人情報保護法や,次世代医療基盤法などについて理解する.