奈良県立医科大学 生物統計学2018
(医学部医学科)
本授業の位置付け
医学教育モデル・コア・カリキュラム(平成28年度改訂版)をベースに構成http://www.mext.go.jp/b_menu/shingi/chousa/koutou/033-2/toushin/1383962.htm
本講義が医学教育モデル・コア・カリキュラムにおいて担う部分・主に関連する部分
B社会と医学・医療
B-1 集団に対する医療
B-1-1) 統計の基礎
確率には頻度と信念の度合いの二つがあり、それを用いた統計・推計学の有用性と限界を理解し、確率変数とその分布、統計的推測(推定と検定)の原理と方法を理解する。
B-1-2) 統計手法の適用
医学、生物学でよく遭遇する標本に統計手法を適用するときに生じる問題点、統計パッケージの利用を含めた具体的な扱い方を修得する。
B-1-4) 疫学と予防医学
保健統計の意義と現状、疫学とその応用、疾病の予防について学ぶ。
B-1-7) 地域医療・地域保健
地域医療・地域保健の在り方と現状及び課題を理解し、地域医療に貢献するための能力を獲得する。
授業メニュー
第1回 オリエンテーション
第2回 尺度・度数分布
第3回 代表値・散布度
第4回 平均値の推定
第5回 相関係数・回帰直線
第6回 感度・特異度・ROC曲線
第7回 相対危険度
第8回 検定の原理
第9回(9−10回) パラメトリック検定
第10回(11回) ノンパラメトリック検定
第11回(11回) 計数値データの検定
第12回 独立多群間の比較
第13回 多変量解析
第14回 生存時間分析
第15回 まとめ
第1回 オリエンテーション
到達目標1−1統計の限界について理解する
1−2確率について理解する
本授業の目的
生物統計学は、統計的手法を用いて保健医療分野における課題の解決に資する学問領域である。そのため統計学の基礎だけではなく、これまで本分野においてどのような統計的手法が用いられてきたのか理解し、データの収集・解析・解釈を実施する際に最適な手法を選択するための知識と、それを活用する能力の獲得を目的とする。
本授業の到達目標
0)統計手法など必要に応じて「勉強すれば出来るようになる能力」を獲得する1)データの性質に関して説明できる
2)適切な統計手法を選択できる
3)仮説の統計学的検定法を説明できる
4)研究デザイン毎の特徴とデータを取り扱う上での注意点を説明できる
教科書
新版統計学の基礎 第2版http://www.nikkyoken.com/catalog/catalog_education/642
参考図書
バイオサイエンスの統計学−正しく活用するための実践理論http://www.nankodo.co.jp/g/g9784524220366/
参考資料
必要に応じて適宜配布しますが・・・授業の進め方
電卓使いますのでよろしくお願いします(授業中はスマホでかまいません。試験はどうしようか考え中)
単位認定
毎回「到達度確認」を実施します。提出いただいたものは返却します。定期試験での電卓利用等については、講義を進める中で判断します
「到達度確認」は正誤によって評価するものではありません。最終的に正しい知識を得ていくことが目的ですので間違いだから評価しない。ということはありません。
社会に出ると、正しいことをしたから,真正面から取り組んだから必ず報われる。というわけでもありません。積み重ねで確率が上がる程度と思います。
そのような意味で、少なくとも本授業では報われるような世界にしようと思いますのでご協力ください。
Donabedianの提唱する医療の質の評価・・・「構造」「過程」「成果」
本授業では
構造・・・講義を行う環境(受講に関する全体評価)
過程・・・到達度確認の状況(受講に関する個別評価)
成果・・・試験(個々)
と定義しました。
成果の指標も色々
参考:医療の成果に関する指標(アウトカム指標)及び過程に関する指標(プロセス指標)の取扱い(医療情報の提供のあり方等に関する検討会(第8回)厚生労働省)
http://www.mhlw.go.jp/stf/shingi/2r9852000001u0or-att/2r9852000001u0tr.pdf
統計処理について
集団からデータをとりまとめて示すので・・・(奈良県立医科大学大学院看護学研究科 地域医療学(分担:データ分析編) より)
データは目的に応じて丸めたり切ったりしてしまう。故に二次利用の場合は注意が必要。
とりあえず収集してデータベース構築をすることが目的ならば、分析は既に二次利用。耐えうるデータを目指さなければ意味が無い
・一次データは情報源からダイレクトに取得するので粒度を目的にあわせてコントロールしている
・二次データは本来の目的と異なるデータ活用となるので、その目的に対してデータの粒度があわない事がある(細かい場合は粗くできるが粗いものは推定するしかない)
医療情報学の分野は二次利用がテーマ
確率について
頻度・・・・・・・客観確率・・・自身の思考となんら関係ない。事象を外から眺めた(頻度を数えた)過去の結果で人により異ならない信念の度合い・・・主観確率・・・現時点での自身の知見による推論を混ぜ込む・・・論理的(と信じたいがいずれにしても)人により異なる
「非日常的な出来事は、主観確率を、客観確率よりも大きくしたり、小さくしたりする」
引用元:主観確率の大きさはどれぐらいか−その出来事は、本当に奇跡的と言えるか?:研究員の眼(THE HUFFINGTON POST)
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/odds_b_8965176.html
ところで医療は医療従事者にとっての日常だが、住民の方にとっては非日常
(地域と医療の統合に資する 情報活用の考え方 −不足の観点からみる医療2.10− より)
故に患者さんを中心とする医療チーム内で個々の主観確率が異なる状況に陥る(かも)。
ベイズの定理
原因は何だったの?状況はどうだったの?確率の乗法定理からベイズの定理
P(A|B)P(B)=P(A∩B)=P(B|A)P(A)よりベイズの定理は
P(A|B) =P(A∩B)=P(B|A)P(A)/P(B)
=P(A∩B)=P(B|A)P(A)/{P(B|A)P(A)+{P(B|AC)P(AC)}
=P(A∩B)=P(B|A)P(A)/{P(B|A)P(A)+{ΣP(B|Ai)P(Ai)}
C:complement
P(A)を事前確率
P(A|B)を事後確率
一年前、自動車事故について事故の有無(P(B))と自動アシストの有無P(A)の関係について調査した。(ダミーデータです)
自動運転付き | 自動運転無し | |
事故有 | 2 | 15 |
事故無 | 198 | 285 |
(2/17)*(17/500)=2/500=(2/200)*(200/500)
自動運転アシスト有の割合P(A)=200/500=0.4
自動運転アシスト無の割合P(AC)=300/500=0.6
事後確率は
事故を起こした車が自動運転アシスト有の割合
P(A|B)=2/17=0.118
=(2/200)*(200/500)/(17/500)/((2/200)*(200/500)/(17/500)+(15/300)*(300/500)/(17/500)=0.118/(0.118+0.882)=0.118
事故を起こした車が自動運転アシスト無の割合
P(AC|B)=15/17=0.882
=(15/300)*(300/500)/(17/500)/((2/200)*(200/500)/(17/500)+(15/300)*(300/500)/(17/500)=0.882/(0.118+0.882)=0.882
ココから主観確率の話
自動運転アシスト車は調査当時と普及率違うんじゃないの?(世の中のシェアは1.5倍ぐらい増加したんじゃないの)
P(A)=(200/500)*1.5=0.6
今日事故が起こった場合、自動運転付きの車である確率P(A|B)は?
事故を起こした車が自動運転アシスト有
P(A|B)=(2/200)*0.6/(17/500)/((2/200)*0.6/(17/500)+(15/300)*0.4/(17/500)=0.176/(0.176+0.588)=0.230
事故を起こした車が自動運転アシスト無
P(AC|B)=(15/300)*0.4/(17/500)/=((2/200)*0.6/(17/500)+(15/300)*0.4/(17/500)=0.588/(0.176+0.588)=0.770
モンティホールジレンマ
実際に皆さん賞品をあててみましょう賞品は一つ。残りの二つはハズレ
1.3つの箱(A B C)一つ選んでください。あなたの選んだ箱をAとします
2.私はB,Cの箱の中からハズレている(ことを知っている)箱Bを開けます
3.残りはAとC。変えることできますがどちらにします?
到達度確認
1)残りはAとC。変えることできますがどちらにします?2)箱AとBとC。この時点でそれぞれのアタリが入っている確率を答えよ
3)(公表しても良い範囲で)一番確率の低いと思われる遭遇したことのある出来事はなんでした?その確率は何%ぐらいの出来事だったと思われますか?。
授業後補足
設問1)2)回答結果
正解 Cにする A33% B0% C66% 間違いで多いのは AとC50% とか A66% C33% 初志貫徹であえて変えない系の学生もおられました 参考: ネコでもわかるモンティホールジレンマ(DOFI-BLOG どふぃぶろぐ) 情報をどこまで確率に置き換えれるのかで決まる話 設問3 有効回答数85 最小値0 最大値0.9 平均値0.0403 (5%もまんざらじゃないなと思う結果でした) 回答の一部 ・医大合格系 0.3,0.15,0.143,0.1,0.03,0.01,0.003,0.000001(医大で生まれて) (参考)目の前の可能性を見つめ修正を繰り返しながら視野の広い人生を築こう(前学長吉岡章先生 関塾タイムス) http://www.kanjuku-times.com/201302/bengaku.php ・有名人等遭遇系 0.1 旅先で元横綱の朝青龍さん 0.05 伊丹空港でデーブ・スペクターさん 0.05 甲子園球場近くのダイエーで元横浜,巨人のクルーンさん 0.08 遊んでいたら隣にお笑い芸人 0.001 姫路セントラルパークで元千葉ロッテの里崎さん 0.001 ジャックスパロウ のコスプレソックリさん 0.00001 騒動で盛り上がっているときの貴乃花部屋親方の貴乃花さん 0 淀川で吉本興業の松本人志さん (参考)マーク・クルーン(元巨人・横浜)投手の驚きの現在(MEN's HOLIDAY) http://mensholiday.tokyo/?p=347 (参考)天才じゃなくても世界一になれた思考術 元プロ野球選手・里崎智也(ニュースイッチ 日刊工業新聞社) https://newswitch.jp/p/10509 (参考)高円寺ジャックスパロウが車にはねられ死亡?突然の訃報に悲しみが広がっている(NAVERまとめ) https://matome.naver.jp/odai/2146790168773125101 ・知り合い遭遇系 0.02 ご近所さんと入学式で 0.0001 出会ってない頃の母が捨てた犬を父が拾う 1.90E-09 ハワイでご近所家族 ・当たった系 0.02 ガチャ 0.01 50m先のゴールにシュートしてクロスバー 0.01 ガチャ 0.001 ガチャ 0.0001 おみくじ白紙 0.0002 ドームツアー最前列 0.0003 一万円の券 0.000002 USJペアチケット当選 0.000001 テレビ (参考)ストイコビッチ監督が“ロングシュート”を決めて退席処分(ゲキサカ) https://web.gekisaka.jp/news/detail/?60654-44427-fl ・気をつけましょう系 0.05 電車とホームの間に落ちた 0.01 受験の時に水ぼうそう 0.01 白いヘビに遭遇 0.0001 寝ているときに自分の首をしめていた 安全に関するお客様へのお願い(JR西日本) http://www.westjr.co.jp/safety/cooperation/activity/#sec06 |
第2回 尺度・度数分布
到達目標2−1データの尺度分類(4つの尺度)について説明できる
2−2度数分布表が作成できる
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
橿原市の人口(橿原市)
http://www.city.kashihara.nara.jp/kikaku/toukei/jinkou/tikubetu_tyoubetu_jinkou.html
各地区によって異なる(年齢構成も居住期間も)
平成26年経済センサス-基礎調査(確報)奈良県結果平成29年3月(奈良県)
http://www.pref.nara.jp/secure/67732/H26kakuho_gaiyo.pdf
全国と比較して構成比率が異なることは分かるが全国の中である指標が一番になれば良い環境になるわけでもない
あくまでも、抱えている問題点と照らし合わせることで状況がみえてくる。
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
教科書は間隔尺度及び比尺度に関して統計処理上区別する意味は無いとなっているが、注意は必要
ポイントは数学的には正しかったとしても意味的に正しいかどうか
度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときに、それぞれの度数がしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
教科書P11の「複雑な調査データ」TGの度数分布表を作成してください
<参考> トリグリセリド(TG:中性脂肪)―脂肪の主成分、肥満の指標―(公益財団法人 神奈川県予防医学協会)
http://www.yobouigaku-kanagawa.or.jp/kensa/kensati09.html
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
75〜100 | 87.5 | ||||
100〜125 | |||||
125〜150 | |||||
150〜175 | |||||
175〜200 | |||||
200〜225 | |||||
225〜250 | |||||
250〜275 | |||||
275〜300 | |||||
計 | ----- | 18 | 1.00 | ----- | ----- |
度数分布図
度数分布を縦棒グラフで示したもの量的変量の場合「ヒストグラム」→縦棒の間隔は無し(量だから)
棒グラフの面積がその度数の量を示す。→ある部分だけ階級幅を倍にした場合度数は半分で描く
例:
(第1回 オリエンテーション 奈良県立医科大学 生物統計学2017(医学部医学科) より)
到達度確認
1)上記の度数分布表を完成させよ2)下記の度数分布表の空欄部A,B,Cを求めよ
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.5〜1.0 | |||||
1.0〜1.5 | 6 | A | 0.325 | ||
1.5〜2.0 | 0.1 | 17 | |||
2.0〜2.5 | B | 0.65 | |||
2.5〜3.0 | 7 | ||||
3.0〜3.5 | 0.125 | C | |||
3.5〜4.0 | |||||
計 | ----- | 1.00 | ----- | ----- |
授業後補足
1)上記の度数分布表を完成させよ 累積相対度数最後の行は1.00 累積相対度数は順に値が大きくなる(少なくなることはない) 0〜100 は 0以上100未満(診療情報管理士の世界は) 慌てて書かれている方が少し間違っているくらい 2)下記の度数分布表の空欄部A,B,Cを求めよ 「求め方で候補を挙げ逐一計算して矛盾があれば採用しない法」(推奨しないけど) (限られた時間で解くための術なんでしょう・・・現実的な問題解決を目指す発想) 1)度数及び累積度数は整数としたとき相対度数及び累積相対度数の整数になる倍数を逆算し全体の度数を推定する 出現する(累積)相対度数は0.1、0.125、0.325.0.65 それぞれより求める度数を整数とした場合 0.1 ・・・(×10)=1,2,3, ・・・10x 0.125 ・・・(×8)=1,2,3, ・・・8x 0.325 ・・・(×40)=13,26, ・・・40x 0.65 ・・・(×20)=13,26, ・・・20x これらの最小公倍数は40 Aの所に入るのは n=40の場合 40×0.325=13 n=80の場合 80×0.325=26 Aの下の行のセルの累積度数は17なので17以下じゃないとおかしい ∴n=40 A13 B9 C0.95 素直に全数を求める方法については口頭で <注意> 字は間違われないように書きましょう ナースあるある☆「医師の書く字がどうにも読めない」(ナース専科) http://nurse-senka.jp/contents/square/230009/ |
第3回 代表値・散布度
到達目標3−1代表値の算出及び特性について説明できる
3−2散布度の算出及び特性について説明できる
代表値と散布度と大きさn(個数や事象数)が提示されれば、その集団がどんなものか想像出来る(マラソン実況)
代表値
average(その集団を数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています)算術平均
mean(算術平均以外にも相乗平均(積して累乗根をとる)などもあります)1/n・Σxi
パレートの法則(80-20の法則)
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない
寄り道
民間給与実態統計2015(国税庁)http://www.e-stat.go.jp/SG1/estat/GL08020103.do?_toGL08020103_&listID=000001159883&requestSender=dsearch
第9表 業種別及び給与階級別の給与所得者数・給与額 より ローレンツ曲線
ジニ係数は医療,福祉0.358 不動産業,物品賃貸業0.439 電気・ガス・熱供給・水道業0.230
ちなみに奈良県の医師偏在の話で曲線を描くと(市町村単位)
(データ分析から考える地域医療の課題 より)
もっとも地域別医師数偏在の話が解消されればすべてが解決されるわけでもないですし、範囲を狭めていくほど偏在は生じるわけですから・・・
リソースの地理的な偏りをゼロにすることそのものは目的ではなく解決に近づく手段であって、提供になるべく偏りがでないような配分ができる仕組みとのパッケージと考えております
加重平均
重みづけをした平均1/n・Σmixi
応用 度数分布表を基にした平均値の計算法
Σ(階級値×度数)/観測数
中央値
median(別名第2四分位数)量的変量を順序尺度で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
スキージャンプの飛型点は中央値的なノリで算術平均している
スキージャンプを知ろう!!ルール解説(ジャンプ雪印メグミルク)
https://www.meg-snow.com/jump/rule/rule.html
最頻値
mode(流行,はやり)違う意味で数の理論(多数決)の世界
量的変量を名義尺度で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記(平均をとると えっオレ優勝!?状態になる)
散布度
dispersion最大値と最小値を使う
最大値と最小値がわかればその集団のバラツキがわかる最大値maximum excel max関数
最小値minimum excel min関数
範囲
RangeR=最大値−最小値
特徴
外れ値もひらう
算出が用意
四分位数を使う
Quartile小さい順(昇順)に並べて集団を4分割
四分位数の求め方
注意:順序の話とその順位のラベル(数値)をこんがらがってしまわないように例:テストの点 16,5,12,16,13,15,15,18,20,10,20
昇順に並べて順位(カッコ書き)をつける 5(1),10(2),12(3),13(4),15(5),15(6),16(7),16(8),18(9),20(10),20(11)
n数(11)を4で割る
第1四分位数・・・1/4の順位・・・11/4×1=2.75個に分割する場所に相当する数値
第2四分位数・・・2/4の順位・・・11/4×2=5.5個に分割する場所に相当する数値
第3四分位数・・・3/4の順位・・・11/4×3=8.25個に分割する場所に相当する数値
2.75個に分割した場所の出し方
+1/4番目の数値=3番目=12
5.5個に分割した場所の出し方
+2/4番目の数値=6番目=15
8.25個に分割した場所の出し方
+3/4番目の数値=9番目=18
四分位範囲
IQR(interquartile range)IQR=Q3-Q1
四分位偏差
QD(Quartile Deviation)QD=IQR/2
範囲は集団を外から見たバラツキをイメージ
偏差は集団の内部のある値からのバラツキをイメージ
平均値を使う
mean偏差
Deviationもともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0
分散
varianceV excel関数はVAR
偏差を二乗したものの平均
標準偏差
Standard Deviation記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
到達度確認
1)教科書P11の「複雑な調査データ」TGの平均値を求めよ2)先週作成した度数分布表からTGの平均値を求めよ
3)1)(算術平均)と2)(階級値由来)の差は理論上最小で0だが、最大でどの程度異なるか
4)平均値>中央値>最頻値となるよう以下の度数分布表を完成させよ
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.0〜1.0 | 0.5 | 2 | |||
1.0〜2.0 | 1.5 | (A) | |||
2.0〜3.0 | 2.5 | 3 | |||
3.0〜4.0 | 3.5 | (B) | |||
4.0〜5.0 | 4.5 | 2 | |||
5.0〜6.0 | 5.5 | (C) | |||
6.0〜7.0 | 6.5 | 6 | |||
計 | ----- | 25 | 1.00 | ----- | ----- |
授業後補足
1)教科書P11の「複雑な調査データ」TGの平均値を求めよ 140.222 2)先週作成した度数分布表からTGの平均値を求めよ 140.278 3)1)(算術平均)と2)(階級値由来)の差は理論上最小で0だが、最大でどの程度異なるか 階級幅の1/2・・・25/2=12.5 実際にそこまでズレることは無さげなのが1)2)の解答より把握できると 4)平均値>中央値>最頻値となるよう以下の度数分布表を完成させよ 空欄上からABCとすると 最頻値が一番小さくなることを考えるとABCいずれかの度数は7以上 Cに7以上を入れた場合平均値は中央値を下回るため× (その場合平均値は4.1〜4.9 中央値は5.0〜6.0)) Bに7以上を入れた場合 ABC組み合わせ 平均値 中央値 最頻値 ×5 7 0 3.54 3〜4 3.5 ×4 8 0 3.62 3〜4 3.5 ×3 9 0 3.70 3〜4 3.5 ×2 10 0 3.78 3〜4 3.5 ×1 11 0 3.86 3〜4 3.5 ×0 12 0 3.94 3〜4 3.5 ×0 11 1 4.02 3〜4 3.5 ×0 10 2 4.10 3〜4 3.5 ×0 9 3 4.18 3〜4 3.5 ×0 8 4 4.26 3〜4 3.5 ×0 7 5 4.34 4〜5 3.5 Aに7以上を入れた場合 ABC組み合わせ 平均値 中央値 最頻値 ×7 0 5 3.78 4〜5 1.5 △7 1 4 3.70 3〜4 1.5 △7 2 3 3.62 3〜4 1.5 △7 3 2 3.54 3〜4 1.5 ×7 4 1 3.46 3〜4 1.5 ×7 5 0 3.38 3〜4 1.5 〇8 0 4 3.62 2〜3 1.5 〇8 1 3 3.54 2〜3 1.5 〇8 2 2 3.46 2〜3 1.5 〇8 3 1 3.38 2〜3 1.5 〇8 4 0 3.30 2〜3 1.5 〇9 0 3 3.46 2〜3 1.5 〇9 1 2 3.38 2〜3 1.5 〇9 2 1 3.30 2〜3 1.5 〇9 3 0 3.22 2〜3 1.5 〇10 0 2 3.30 2〜3 1.5 〇10 1 1 3.22 2〜3 1.5 〇10 2 0 3.14 2〜3 1.5 ×11 0 1 3.14 1〜2 1.5 ×11 1 0 3.06 1〜2 1.5 ×12 0 0 2.98 1〜2 1.5 世界は答えが用意されているわけではないので,与えられた状況の中でより最適なものを導き出す考え方が要求される |
第4回 平均値の推定
到達目標4−1標準偏差と標準誤差の違いを説明できる
4−2母分散が未知の場合でも母平均を区間推定できる
推定
母集団から抽出した標本を基に母集団の分布を示す値(母数)を推測する点推定と区間推定がある
点推定
一つの値で推定母平均の推定値は標本平均
母分散の推定値は不偏分散
区間推定
母数がある確率で入る幅を持った推定値本日の目標はP70の話を理解すること。母平均は一定なのに標本平均は標本毎に異なるので幅を持たせる
標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差 SE=σ/√n
正規分布
左右対称の釣鐘状分布(教科書P32-40)平均値に近いほど出現率が高く遠ざかるに従って低くなる(ことが多い)
同じ事柄を同じ条件で繰り返すと正規分布になるという話→中心極限定理
「異質な集団の計測値が組み合わさった分布は正規分布とならない」(教科書P33)
正規分布っぽい形状の判断→P28 歪度 尖度を参照
教科書には検定表もついておりますが(まだ授業で検定の話は一切しておりませんので)・・・いずれの機会で
検定するときには「分布の正規性」に関してデータ数が大きければ制約なしなので(P6)、あまり気にしなくても・・・
真度と精度の話(誤差)に置換えると
上段が正規分布。裾広がりが右に行くほど広がる
下の段は良くわからない分布になるが、例えばP35のような混成分布の場合もありうる
k 信頼区間限界指数・・・標準正規分布でzスコアのこと
標準正規分布
平均値が0標準偏差=1(分散も1)になるように値を変換したもの
偏差値は平均値を50、標準偏差=10になるように値を変換したもの
中心極限定理
標本の大きさが十分であれば標本平均の分布は正規分布→正しく測定されているのであれば偶然誤差の発生は正規分布に従う
→測定回数を増やせば増やすほど
標準偏差と標準誤差
(教科書P52)・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
誤差伝搬の法則の話で考えると良い
私が過去に理由を説明したときの資料
http://www.medbb.net/education/ocrstat2015/index.html
母標準偏差が既知の場合の区間推定
(教科書P70)正規分布表でなぜ1.96になるのか確認
母標準偏差が未知の場合の区間推定
(教科書P70)正規分布は母平均値と母標準偏差が分からないと使えない→nが多い場合標本平均と標本標準偏差(不偏標準偏差))で近似できるが
nが少ない場合は近似できない→t分布(標本の自由度νさえわかっていれば、後は検定統計量を求めれば確率がわかる)
t分布
P64-66
自由度のみできまる確率分布
自由度・・・標本の中で自由に振る舞うことが許されている個体の数
統計値が母数の推定となると、自由に振る舞えない個体が出てくる(つじつま合わせ)
標本分散は偏差二乗和を個体の数で除することで求めるが母分散のほどよい推定である不偏分散はn-1(自由度)で除する
正規分布との関係を確認
次回持越し
検査値の基準範囲について教科書P35健常者を対象に測定したデータの95%(つまり健常者であっても5%は外れる) 平均値の区間推定はSEを用いるが、こちらの場合はσ。分布に関して考慮する必要がある。 <参考> 臨床検査のガイドライン(日本臨床検査医学会) https://www.jslm.org/books/guideline/ 臨床検査のガイドライン JSLM2012 http://jslm.info/GL2012/00-1.pdf 第1章検査値アプローチ−3.基準範囲・臨床判断値 http://jslm.info/GL2012/03.pdf |
到達度確認
1)P11複雑な調査データのHbA1cの平均値の95%信頼区間を求めよ次回持越し
2)P35のRBCの健常男性のデータは(推測するに)平均値は475,σ=40とします。 このデータから基準範囲を求めよ 3)P11の被験者のうち1)で求めた範囲に含まれていなかった被験者の割合を求めよ 4)P11の被験者のうち平均値±σに収まった割合を求めよ. また,HbA1cの分布が正規分布で被験者が全て健常者とした場合,どの程度の割合(%)になると予想されるか |
授業後補足
本日の余談1)SNSの話<参考>SNS時代における 個人情報保護と情報セキュリティ(竹村医学研究会小阪産病院 個人情報保護研修会) http://www.medbb.net/wiki/index.php?sp%2F20140829kosakawh 2)古い部分と新しい部分が混ざり合う街の話 <参考>なぜ廃墟に?鬼怒川に残る温泉ホテルの廃墟群と写真達(スパイシー) https://spaicy.jp/kinugawa-ruins-hotel <参考>目の前が“廃墟”旅館でイメージ悪化…人気温泉街の戦い方(とくダネFNN PRIME) https://www.fnn.jp/posts/00305310HDK#y 3)物語と現実の乖離 <参考>ブラックペアン(TBS) http://www.tbs.co.jp/blackpean_tbs/ <参考>『ブラックペアン』だけじゃない!団体から「抗議」を受けたドラマまとめ(NAVERまとめ) https://matome.naver.jp/odai/2152549117597199401 最近現実と虚構の境目が不明瞭になってきているような気がする(例えば大谷翔平選手の活躍はドカベンやあぶさん(水島新司)の世界みたく) 現実の世界が予想しえない未来を切り開き,虚構の世界での表現がリアルに近づいている. 故に,明確にするよう心掛け誤解を受けないように. <参考>虚構新聞 http://kyoko-np.net/ 不偏分散の求め方高校の時に覚えていた公式は分散を求める式ですので,不偏分散を求める場合は以下のようにU={(1/n)Σxi2-((1/n)Σxi)2}×n/(n-1) 到達度確認あれこれ1) 母分散が不明なので信頼区間限界係数はt分布表よりもとめること平均 5.17 標本標準偏差 0.572 自由度 18-1=17 t0.05 2.11 (5.17-2.11×0.572/√18=)4.89<μ’<5.46(=5.17+2.11×0.572/√18) 間違いの例 標本より求めた標準偏差をそのまま母標準偏差に Z0.05 1.96 (5.17-1.96×0.572/√18=)4.91<μ’<5.44(=5.17+1.96×0.572/√18) ----- 2)基準範囲とは,「一定の基準を満たす健常者(基準個体)の検査値分布の95%信頼区間として設定」(出典:臨床検査のガイドライン JSLM2012) 標準正規分布の95%区間は −1.96〜1.96 平均値は475 σ=40とするので 475−1.96×40〜475+1.96×40 (396.6,553.4) 学生用共通基準範囲(日本臨床検査医学会設定、2011)の基準範囲(可省項目)で M: 4.0〜5.5 F: 3.5〜5.0 となっています.意識して問題設定しました 臨床検査値 学生用共通基準範囲の設定について(日本臨床検査医学会) http://www.jslm.org/committees/standard/ref_2011.html 3) 7/18=0.39 含まれる確率は0.61 4) 15/18=0.83 ―σ〜σに含まれる確率は標準正規分布表より0.683 <補足> 3)の話は母平均の区間推定の話なのであまり意味が無い 4)の話はもっと理論値に近い値が出てもいいものだがそれが現実 |
第5回 記述統計(W)−相関係数・回帰直線
到達目標5−1相関係数を説明・計算することが出来る
5−2回帰直線がどのようなものか説明・計算することが出来る
相関
(教科書P174) correlative相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか
因果
cause and effect原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない
普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)
例
たばこを吸う−肺がん・・・・相関関係○
タバコを吸う人にコーヒーを飲む人が多いのは・・・(yahoo知恵袋)
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1293675642
この関係を使うと
コーヒーを飲む−肺がん・・・相関関係○
でもコーヒーが肺がんの原因とはかぎらない
コーヒー愛飲者に肺がんが多い理由は?生活習慣との関連を検証
アメリカで約50万人を対象にした調査から
from International journal of epidemiology
http://medley.life/news/item/5589521b660815fe00d5ec8e
コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡)
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関
例:電車に乗るとき皆がそれぞれ駅に向かって仲良く歩いてるように見えるが、互いに関係は無い。
本授業(統計学)は医療系対象で「提供する医療が及ぼす影響やその要因に関する法則性を見いだす方法を探求する学問分野」
(大阪リハビリテーション専門学校 統計学2015(理学療法学科)より)
知りたいのは「影響」であるから目的を見失わないように
相関図
X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)とりあえず図にすると関係が直感的にわかる(場合がある→交絡現象交互作用に注意)
相関係数
-1から1までの値をとる(教科書P174)+の場合正の相関 −の場合負の相関
Xが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0
相関係数が0出なければ相関は「ある」ワケだが程度は数字が0から離れるほど強くなる
一般に〜0.2であれば相関はなく、0.7〜であれば強い相関の目安とされてる。
(この教科書はr表がついています.相関の強さによって検定の結果が決まるけど,nの数による P278表8)
X軸で見たときのバラツキ具合とY軸で見たときのバラツキ具合を元に計算してる
バラツキ=散布度・・・分散・・・偏差の二乗の平均
共分散=ある対象のX軸の偏差とY軸の偏差を乗じたものがベース
注意
基本事項のところは偏差平方和の話になっているが標本分散の場合両辺をnで割らないといけない
割ると・・・二乗の平均−平均の二乗 というリズム感のある公式が出来る
Xの偏差 | Yの偏差 | 乗じた結果 |
---|---|---|
+ | + | + |
+ | − | − |
− | + | − |
− | − | + |
共分散はX軸Y軸のバラツキ具合が混ざっているのでそのままの数字だと解釈しにくい→XとYの標準偏差で除する(正規化)→相関係数
直線で無い場合は変換(例えば対数変換)してから計算してもよい(対数グラフ)
対数グラフの例(方眼紙ネット)
http://houganshi.net/taisuu.php
回帰直線
X軸の値とY軸の値を数式(y=ax+b)で示す直線を引いたときにそれぞれの点からの差(残差)の2乗して足したもの(平方和)が最も小さい時の数式が回帰直線
決定係数
相関係数を二乗すると求められる数式によって説明できる割合を示す。(寄与率とも)
つまり高ければ高いほど数式で説明出来ることになる
到達度確認
この回の分は次週冒頭にミニテストを行い,それに変えます.(一切持ち込み禁止 20分)授業後補足
本日の余談みなさんは努力されて人生を勝ち取ってきていますから,このような話は当然と思うことでしょう.ただし人それぞれでそれまでの過程が異なることから,水面下の部分の大きさや構成についてはその人の主観に依存してしまいます. 大きい人程努力して,その多様性も知っているからこそ,他者に対して丁寧な応対をされているように思います. 大きい人になってください.
また,期末試験などではなかなか出来ないのですが,チャレンジシステムを採用します 1テストで1回 採点に疑義がある場合はその理由を示してください.ホークアイなどは無いので理由書に基づき回答を再確認します. <参考> バレーボール女子ワールドGPでも導入のビデオ判定「チャレンジ」システムは試合を盛り上げるか (DIAMOND online) http://diamond.jp/articles/-/58133 「理由書」は回答用紙の返却後一週間後の授業開始時まで.授業までにお渡ししたい方は地域医療学講座まで提出ください. A4一枚で氏名学籍番号を記載のこと. 例えば他の人は似たような回答で〇なのに私は云々・・・ではなく,自身が記載された内容をどのように解釈すると良いのか示してください. また「それぞれ計算の過程もわかりやすく記すこと」としていたのですが過程が良くわからないものについては,判断できないため0点にしています. そのような方につきましては是非理由書にて,なぜ答えを導けたのか回答用紙の記述を基に過程を説明していただけますでしょうか. |
第6回 感度・特異度・ROC曲線
到達目標6−1判別特性値の計算が出来る
6−2評価結果よりROC曲線を作成し評価やカットオフ値の検討が出来る
検査法の診断的有用性を評価する話
有病率の影響を受ける指標、受けない指標を整理しておくこと
「率」ではあるが実際には割合。時点有病率ともいう(期間有病率は時点有病率に期間中の罹患を加えたもの) 比と率と割合の違いについて 比・・・異なるものを比較(無単位になる場合もあるが) 率・・・比だが時間と比較(単位は/sec /min /hr となる) 割合・・全体と一部(同じもの)を比較(無単位) 以下参考にしてください 第13回 医療統計(U)−比と率と割合(大阪保健医療大学 医療情報学2016) http://www.medbb.net/education/ohsumedinfo2016/#13 |
感度と特異度
教科書(P116)感度=P(陽性|D) 疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1−偽陽性率 非疾患群における真陰性の割合
予測値
有病率の影響を受ける
陽性的中率=P(D|陽性)
陰性的中率=P(Dc|陰性)
検査法の評価指標
尤度比=感度/偽陽性率
オッズ比=教科書参照 検査の有用性
ROC−AUC=ROC曲線を描いて算出 検査の分別能
何でも陽性と判断する検査は感度も偽陽性率も1になる
(なんでもかんでも、あります!! のノリ)
ROC曲線
教科書(P119)判別度の分析
感度と偽陽性率(1−特異度)を用いて曲線を描く
例題21でEをカットオフ値としたときの陽性的中率=7/9 陰性的中率=8/11
到達度確認
この回の分は次週冒頭にミニテストを行い,それに変えます.(一切持ち込み禁止 20分)但し
1)ROC曲線を描く
2)尤度比,オッズ比を求めよ
P118例題20 P120例題21を参考に
授業後補足
本日の余談省庁データ、近く西暦で統一…来春は間に合わず(YOMIURI ONLINE)http://www.yomiuri.co.jp/politics/20180520-OYT1T50149.html 平成元年に既に問題として把握していたのですが,一度変換してしまえば解決するだけに優先順位が低かったのでしょう 和暦でもフォーマットが色々 平成28年5月21日 H28/5/21 などなど 西暦も様々な表記がありますが 2018/5/21 43241 UNIX Time から EXCELのシリアル値(日付・時間)に変換する方法(あさひグループ) http://asahi.gr.jp/wp01/1668 EXCELは1900年1月1日を1として日単位 UNIXは1970年1月1日0時0分0秒(UST)を基準に秒単位 日本で2018年5月21日0時(43241,1526828400) 1970年1月1日(25569) 1日=24時間=24×3600秒=86400秒 1526828400/86400=1761.625 .625×24=15時間相当 UTCとJSTの差は+9なので日本標準時にするときは足してやらないといけない 大変ですが,一度変換式作れば好きな形式に直せるので(和暦)困った人が,その時に個別で解決するパターンに陥るような気がします (日付以外にも形式の話はいろいろあるのですが,なかなか理解していただけないんですよね〜)) 私はyyyymmddhhmmss のフォーマットを基本に日付のみ秒までRFIDタグの時はミリ秒まで整数で処理しました. 長崎に行ってきました 長崎行の特急なのにサガン鳥栖のラッピング電車 長崎駅では 新幹線の延伸するにあたって揉めているようですが,互いに関係性の深いことが良くわかる話です <新幹線長崎ルート>知事反発「将来に禍根残す」(佐賀新聞LiVE) http://www.saga-s.co.jp/articles/-/206818 良いことをしていてもそれをどのような評価指標で表現できるのかが,鍵と思った週末でした. 結局何のためのシステムなのかというところがスタートですが運用していくと色々な効果が出てくるのも当然で ミニテスト解答問1 5点満点 X軸は偽陽性率(1-特異度) Y軸は感度数値が異なる度に減点1 問2 尤度比2.67 オッズ比9.33 それぞれ2.7 9.3でも正解にしています.どちらかのみ正解の場合は2点 間違えかけた記載(正解にしています) |
第7回 相対危険度
到達目標7−1相対危険度を示す指標にどのようなものがあるか説明できる
7−2症例対照研究では相対危険をオッズ比で算出する理由を説明できる
相関は関連がどの程度あるか
判断分析は、検査結果を基にどのように判断していくのか(検査結果と疾患の話)
相対危険度の話は、疾患(結果)が曝露(原因)の影響をどの程度受けているのか
指標は数字として計算出来る限り結果が現れるのだが、それの解釈を誤らないようにすることであったり、そもそも解釈しようが無いので出しても意味なしの場合もある
この授業では相対危険度=Relative Risk は一般的な用語であり、その算出指標の一つに相対危険=リスク比(Risk Ratio)があると整理します
一般的にはここらへんの言葉ゴチャゴチャです。
研究手法の話
教科書P220参照・・・観察研究では群間比較に有意差を使えない?実態(現状)を明らかにしたところで、その事実を単純に拡張できるわけではない。
観察研究(Observational study)
横断研究(Cross-sectional study)曝露と疾患を同時に評価
時間軸がない場合が多く(例外は性別など)因果関係までは不明になってしまいやすい
コホート研究(Cohort study)
対象に曝露している人々と非曝露群を設定、追跡調査していくスタイル
通常前向きだが、後ろ向きにみる回顧的コホート研究というのもある。(後々でも曝露群に関する情報がある場合)
症例対照研究(Case-control study)
ある状態(例えば病気に罹患している)群と、罹患していない群を設定、時間を遡って調査していくスタイル
後ろ向きにしか行えない(前向きだと曝露→疾患の順がおかしくなる)
実験的研究(介入研究)(intervention study)
コホート研究の場合、曝露群(介入群)を研究者が割り付ける → 被験者に対する倫理的配慮が肝要無作為に割り付けることが出来る場合は交絡因子を制御できる(ことが期待される)
倫理的に考えると非介入群の方が不利益になってしまう可能性が高いので、配慮した研究デザインが求められる
説明用データ
疾病発症 | 疾病無 | 計 | |
---|---|---|---|
曝露有 | A | B | A+B |
曝露無 | C | D | C+D |
計 | A+C | B+D |
相対危険
Risk Ratio(RR)「リスク比」と言った方がわかりよい(と思うが)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら
A〜D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)
曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
リスク比≒A/B/C/D=AD/BC
オッズ比
Odds Ratio(OR)「リスク比」を出せない場合でも出せる(リスク比はそれぞれの群のリスクがわかっていないと出せない)
危険な事象が起きた場合と起きなかった場合度数の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの
発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
=AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる
到達度確認
この回の分は次週冒頭にミニテストを行い,それに変えます.(一切持ち込み禁止 20分)以下のような設問
相対危険度の算出
コホート研究
不整脈あり | 不整脈なし | 計 | |
---|---|---|---|
曝露群 | 100 | 1900 | 2000 |
非曝露群 | 50 | 1950 | 2000 |
計 | 150 | 3850 | 4000 |
不整脈あり | 不整脈無し | 計 | |
---|---|---|---|
曝露歴あり | 50 | 30 | 80 |
曝露歴無し | 50 | 70 | 120 |
計 | 100 | 100 |
授業後補足
ミニテスト解答以下の内容が示されて意味が通っていたらOK問1(A) 暴露に依らないのであればいずれも分母分子が等しくなることが想定され1になる △一般式だけ記載していたら2点 a=b=c=d とは限らない(a:b=c:d)ので注意(今回は〇にしていますが) 問1(B) 発生頻度が小さい場合 ×暴露と要因に関連が無い場合(のみであれば) 問2 それぞれの群のリスクは算定できないためオッズ比により危険度を求める ×相対危険(Risk Ratio)とオッズ比は近似となる云々(のみであれば) 本日のテスト裏 |
第8回 検定の原理
到達目標8−1確率がどのような意味合いのものか理解する
8−2仮説検定の論理構成を説明できる
教科書第三章P46〜
確率
ある事象が起こることが期待される度合い(割合)ある個体に事象が起こる/起こらないのいずれかとして、確率をそのまま提示しても答たことにはならない
試行 サイコロを振って3の目が出る(y or n)
確率 サイコロを振って3の目が出る(1/6)
繰り返し試行を行うと頻度割合はその事象の確率へ収束していく
生物を対象とした場合試行を繰り返せる?→無理な場合が多い→条件を近づけて繰り返したと見做す
条件が近くないと単純に比較できない→(再掲:教科書220)
試行の結果は事実で正しい。かといってそれが常に正しい(真)とは限らない
次の試行以降で異なる結果がでる可能性を排除できない→永遠に試行を繰り返さないとならず法則が出せない
(故に異なる現象の起こる確率にたいして閾値を定めて、なかったことにして一般性を主張するスタイル)
事象の起こる確率が著しく低くても、実際に起こらないわけではない。
参考
デジタル絵本 かっぱの雨乞い (札幌平岸高校デザインアートコース)
降るまで雨乞いをするので「雨乞いをすれば雨が降る」となってしまう
参考
単語記事: テレ東伝説(ニコニコ大百科(仮))
http://dic.nicovideo.jp/a/%E3%83%86%E3%83%AC%E6%9D%B1%E4%BC%9D%E8%AA%AC
背理法
命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法差のあることを証明するにあたって「差が無いことを」を証明できないことを根拠にする
(差(違い)を定義するにも区間推定で明らかなように,確率一定でも状況で変化する)
<注>好きの反対は嫌い ではなく無関心という考え方.
仮説検定
教科書P46-<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで
手順1:仮説をたてる(帰無仮説H0および対立仮説H1)
背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)
手順2:検定統計量を計算する
その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
(実データを確率の世界のスケールに変換) 教科書P50では(3)の前半の部分Z= の部分がそれ
手順3:有意水準を決める
確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある
手順4:有意水準と比較し、仮説を棄却採択する
例)帰無仮説H0を棄却し対立仮説H1採択
注意
区間推定の話の延長線上が検定(P70とP51を比較)
エラー
教科書P215αエラー βエラーが存在する
第一種の過誤
αエラーの起こる確率(誤って有意差があると判定)=有意水準
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
第二種の過誤(βエラー)・・・誤って一緒と判定する確率
βエラーの起こる確率(誤って有意差が無いと判定)=検出できない=1−検出力(Power)=β
検出力=1−β
サンプル数↑・・・検出力↑・・・β↓
一般に検出力0.8〜0.9で違いを見積もった上でサンプル数を決定する
検出力をが上がるとβエラーの確率は下がるが,統計的有意差と臨床的有意差の話が出てくる.
仮説検定は用法を守り正しく使いましょう
到達度確認
この回の分は次週冒頭にミニテストを行い,それに変えます.(一切持ち込み禁止 20分)P50例題6を理解しておいてください
例えば被験者が16人の場合,9人の場合どうなるでしょうか
授業後補足
本日のテーマの参考になるtweet
授業後の雑談を通して結局のところ単純に判定結果やp値を記しても臨床的な感覚に結び付きにくいので95%CIを示すなど,現実的に意味があるのが判断できるようにする必要があると思います.私が示したαエラーの話(適当な例とは思えないが)例えば大学教員の財布にどの程度お金が入っているか全国調査したときの結果がμ=6万円 σ=1万円だったとする. その時に・・・・ミニテスト解答いつものように採点しています10点満点 1)(3点)帰無仮説と対立仮説H0:μ=140cm H1:μ≠140cm 標本より推測される母平均が140cmであるのか無いのか 2)(4点)母分散(標準偏差)が既知なのでそれを用いれば良い 3)(3点)2)で求めた検定統計量を基に採点しています ごちゃごちゃになっている人(逆の結果)が数名 あくまでもH0を棄却することを目的にしているので(H1の仮説がある)棄却できなかったときは,「判定保留」もしくは消極的に「差はない」 棄却の上でH1を採択.H0の話を飛ばして結論を出さないように |
第9回 パラメトリック検定
到達目標9−1パラメトリック検定の頑強性robustnessを説明できる
9−2t検定を行うことができる
パラメトリックとノンパラメトリック
教科書P44分布の形状(母数)に依存する統計量(平均値 標準偏差・・・量的変量)
分布の形状(母数)に依存しない統計量(順位 中央値 パーセント値・・・質的変量)
教科書P4-7,204
パラメトリック検定・・・計測値の分布が正規分布であることを仮定
正規確率紙法・・・Q-Qプロット
データを順序尺度的に用いてその順序からパーセンタイルを求めて、その値を確率分布(正規分布)に代入して期待値を算出して比較する。
P11複雑な調査データTGを用いて
<参考>正規確率プロットの作り方(統計WEB 社会情報サービス統計調査研究室)
https://software.ssri.co.jp/statweb2/tips/tips_8.html
<参考>連続補正
順位は順序尺度で離散量
このまま扱うと正規分布と合わないのでそれぞれ0側に向かって0.5だけシフト
適切な統計処理に必要な考え方(次週以降どこかでします)
P203-216・分布の正規性
→そんなに気にしていない
分布の正規性について「データ数が大きくなると制約無し」・・・どの程度 パラメトリックの場合→結局妥当な話になってしまう ・検定法によって判定が異なる場合
→データが出てから検定法を選択するのは適切ではない
・片側検定,両側検定
→両側検定が妥当
・有意差検定の有意水準は0.05でよいの
・有意差検定が無意味な場合
→統計的有意差と臨床的有意差の話 教科書の効果量に対する必要データ数を可変させたものが以下
各群10データで検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
各群1000データぐらいで検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
<参考>その治療は臨床的に有益か(PEDro)
https://www.pedro.org.au/japanese/tutorial/is-the-therapy-clinically-useful/
<参考>統計的有意性とP値に関するASA声明
http://biometrics.gr.jp/news/all/ASA.pdf
以下抜粋しました
1. P値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
2. P値は、調べている仮説が正しい確率を測るものではない
3. 科学的な結論は、P値がある値を超えたかどうかにのみ基づくべきではない
4. 適正な推測のためには、すべてを報告する透明性が必要
5. P値は、効果の大きさや結果の重要性を意味しない
6. P値は、それだけでは仮説に関するエビデンスのよい指標とはならない
・データ数大きい場合は区間推定のほうが意味ある。
教科書P6テーブル(適用要件による使い分け)
1標本t検定・・・空白2標本t検定・・・2群の等分散性
空白の意味は、データ元が同じところなので問題にならない
2群の等分散性に関しては、ぞれを前提として検定が成り立っているので(以下に紹介する(スチューデントの)t検定は
無論、等分散ではない場合に用いる検定(ウェルチのt検定)もあるのですが、そちらを最初から使った方が良いという話があります。
ノンパラかパラメトリックの話と同様ですが、どちらでやろうとも有意差が出てるぐらい明確なものが理想ではありますが
2群の差の検定(ここらへんも不足している部分)
1標本t検定(関連2群)
教科書P58P60例題8を見ながら
関連する2群(ペア)・・・一つの群を2回測定している
前後の差を見る
t値(標準化された検定統計量)・・・2群のペアの差の平均を標準誤差で正規化したもの
帰無仮説は前後の差がゼロ
検定統計量と有意水準αのt値を比較する。
2標本t検定(独立2群)
教科書P82〜 P84例題12 P87例題13こちらの場合は、F検定(P86)で等分散を確認してからの手順になる。
一標本との違いは分散が2種あること(一標本はペアの差をとるので一つ)
そのため合成する
t値・・・それぞれの群の平均の差を標準誤差で正規化したもの
F分布・・・χ2分布の時にお話しします
到達度確認
次回ミニテストQ-Qプロット
確率は (順位−0.5)/全数
HbA1c | 順位 | 確率 | 期待値 |
---|---|---|---|
4.5 | 1 | 4.365 | |
4.6 | 2 | ||
4.8 | 3 | ||
4.9 | 4 | ||
5.0 | 5 | 5.065 | |
5.1 | 6 | 5.202 | |
5.3 | 7 | ||
5.8 | 8 |
平均=5.0 標準偏差=0.4で計算せよ
注意としては与えられている正規分布表はp/2なので2倍したときのzをみないといけない
t検定・・・2種類の違いを理解しておくように
補足
今日の所感Q-Qプロットのところで時間のかかるシナリオだったので,積み残し多数ミニテスト解答いつものように採点しています10点満点確率は空欄全部埋めて5点 期待値入って1点/空欄 合計10点満点 確率のところ両側の確率を書いていた人は3点にしています. 期待値は±0.02に収まっていたら正解にしています. 回答欄作品集 以上の作品につきまして,加点および減点をしておりません. 次の作品につきましても加点及び減点をしておりませんが,少しコメントさせてください. テストの時点ではあなたのアナザースカイであるドイツは一次L突破の可能性があったのですが,残念な事に火が消えてしまいました. 私もドイツチームはサッカーを始めたころにハンジ・ミュラーのCMに影響を受け,今でも好きなチームです. さて,ドイツの敗退は真剣勝負の不足が原因と報道されていますが,これはスポーツだけの話ではありません. ぜひとも,ミニテストであっても真剣にお取り組みいただかないと,期末試験で残念な事態になるのではないかと危惧しております. そのような中で希望の光は,結びで「そろそろテスト勉強しなければ・・・」と記されていたことです. 採点中の私の手を止めた文章を書かれた文才溢れるあなたのことですから,もう既にテスト勉強をされているに違いありません. 「明日やろうは馬鹿野郎」という有名な言葉もあるぐらいですから. あなたは本授業を受講することで期末試験に参加できます. 期末試験での大量得点を心よりお祈り申し上げます. <参考>ドイツ、深刻だった真剣勝負不足 まさかの1次L敗退(朝日新聞 Yahoo) https://headlines.yahoo.co.jp/hl?a=20180628-00000015-asahi-spo |
第10回 ノンパラメトリック検定
2018年6月18日は地震により休講とします. 安全に配慮し行動してください. 補講日程は教務より連絡があります 6月25日は通常通り
|
10−1パラメトリック検定とノンパラメトリック検定の違いを説明できる
10−2ノンパラメトリック検定を行い判定することが出来る
先週分の積み残しからします
一標本Wilcoxon検定
ウィルコクソンの符号付順位和検定教科書(P6)・・・分布型,計測尺度,分散の制約なし
教科書(P74)
1:ペアのデータの差dを求める
2:dの絶対値よりそれぞれの差(d)の順位(昇順)を求める
同順位の話・・・教科書P76参照
3:検定統計量Tは+,−別に順位を足したもので小さい方
T0=min(T1,T2)
有意確率については直接計算出来るが(P75)延々と計算していくのは大変
n≦25まではWilcoxon検定表を使ってください(P274)
N数が少ないと(空白の部分)判定保留にしかならない
教科書P78参照のこと
n>25は正規分布に近似と見なしてz値を求める方法で検定
平均値
検定統計量Tの平均値T1=n(n+1)/2-T2
T2=n(n+1)/2-T1
(Σk=n(n+1)/2)
T1+T2=n(n+1)-T1-T2
2*(T1+T2)=n(n+1)
μT=(T1+T2)/2=n(n+1)/4
標準誤差
σT=√(n(n+1)(2n+1)/24)検定統計量
Z=(T-μT)/σT連続補正
先週の講義参照P76(例題10)参照
Mann-Whitney検定
二標本になるとややこしくなるのはパラメトリック検定と同じP102参照
検定統計量
自群の個々について、それよりも他群で大きい個体数の総和を求めて検定統計量としている
1:ある群(A)の値それぞれがもう一方の群(B)に入ったとしたときに(Aの)その値よりも(Bの群のなかで)値が大きい個数をカウントする。(A群の)全てについて行い和をとる。(順位-1の話)
2:AとBを入れ替えて1:と同様の計算をするか、公式でB群の和を求め小さい方を検定統計量Uとする
同順位の話・・・教科書P103参照
こちらも標本数が多くなると正規分布の話が出てくる
平均値
μU=n1n2/2標準誤差
σU=√n1n2(n1+n2+1)/12)検定統計量
Z=(U-μU)/σU到達度確認
10−1)P63演習3についてノンパラメトリック検定を行い、パラメトリック検定の結果と比較せよ。第11回 計数値データの検定
到達目標11−1二項分布と正規分布の関係を説明できる
11−2カイ二乗分布と正規分布の関係を説明できる
計量値と計数値
計量値・・・量を測定計数値・・・頻度を測定(名義尺度)
量的変量は頻度の測定も出来る
二項分布
標本の大きさ=n事象の起こる確率=p
r=np=n回試行を繰り返したときに事象の起こる回数(期待度数)
二項分布→npが5よりも大きい(nが十分に大きい場合 教科書ではnp≧10 and n(1-p)≧10)正規分布に近似(P135)
χ2乗分布
教科書P142χ2乗分布・・・母分散を推定できる確率分布
自由度とともに分散も増加する
正規分布から上側確率を計算
バラツキの話なので下側の確率はバラつきすぎていない確率
→ 正規分布の両側5%(両側2.5%ずつ)はカイ二乗で上側に集約される
χ2乗検定
出現度数Oiと期待度数Eiのズレを検定期待度数は与えられた情報から推測した理論的に求めた度数
独立性はそれぞれの要因を用いて推測
期待度数が低い場合、そのまま使えないが、計算は楽
Fisherの直接確率法はいつでも使えるが計算大変
(コンピュータを使える時代)
故に教科書では2×2表以外出てこない(考え方は一緒)
よくある?間違え
度数なのに比率(100%)に直してから検定とか
到達度確認
11−1)P146例題29の計数値をすべて半分にして検定し例題29の検定結果と比較せよ第12回 独立多群間の比較
到達目標12−1F分布とカイ二乗分布の関係を説明できる
12−2分散分析と多重検定の違いを説明できる
F分布
カイ二乗分布と同じく分散に関する確率分布それぞれの群のカイ二乗値の比=分散の比・・・F値(FはフィッシャーのF)
F分布とカイ二乗分布の関係
χ^2(ν)=ν×F(ν,∞)
F検定の話(P94)
等分散性の検定・・・分散比を求めてF値より判定「2群の分散は異なるとは言えない」・・・帰無仮説を棄却できない(保留)
多群間の比較
教科書P154全群を一括して比較・・・同時比較
多群が互いに独立・それぞれ比較・・・多重比較
同時比較して差があったから多重比較するというのは、何を述べたいかによるが・・・お作法的にそのように分析するケースは多々
同時比較
これまでと同じように正規分布に従うか否かの話になる→P172(P111と対比させながら)一元配置分散分析
群間分散と群内分散の比をとるKruskal-Wallis検定
教科書P164P166例題33のデータで極端値の話
多重検定
教科書P217ポイントとしては、それぞれの検定が独立した仮説にもとづいたものと考えて良いか否か。良いのであれば多重検定にならない
一連のものであれば対立仮説を考えたときに有意水準が5%と言いながら5%になっていないのでは?
多重に検定することでどれかあたれば帰無仮説は棄却できるので例えば3群総当たりだと有意水準0.05で多重検定(6通り)すると有意水準が0.265になってしまう。(からよくない)
有意確率補正法
Bonferriniの場合は6通り検定するのであれば、一検定あたりの有意水準だと0.05/6=0.0083となる。全体では1-(1-0.00833)^6=1-0.95103=0.0490Sidak補正の場合は同様に1-(1-0.05)^(1/6)=0.008512 1-(1-0.008512)^6=1-0.95=0.0500
多群になるほど検定あたりの有意水準が下がる→差が出にくい
多重比較法
パラメトリック法Tukey法・・・各ペアに対する平均値の差の検定
Dunnett検定・・・一つの対象群との対比
ノンパラメトリック法
Dunn法
到達度確認
1)158例題31についてKruskall-Wallis検定を用いて判定せよ2)ある細胞を温度条件により4群にわけて培養を行いデータを測定した.標本数は,A=4,B=3,C=5,D=8であった.群間変動の分散SA2が100 郡内変動の分散SE2が30だった場合有意水準5%,1%でそれぞれ検定せよ
3)曜日別に検査の管理用資料を測定した。それぞれ総当たりで二標本t検定を行った。有意確率を補正し有意水準5%で判定し有意な組み合わせをすべて記せ
補足
第13回 多変量解析
到達目標13−1多変量解析の必要性について説明できる
13−2重回帰分析においてどのように変数が選ばれているか説明できる
多変量解析について
教科書P5多くの変量を用いて・・・探索的 予測・・・(重回帰分析)
要約・・・外的基準がない(主成分分析)
「関係ありそうなデータを集めたけどどうしたらまとまるのやら」という悩みを解決してくれるという夢を見やすい
重回帰分析
教科書P223(回帰直線の話を思い出す→単回帰分析)
回帰・・・元に戻る・・・何らか(定理や関係)に基づき戻っていく
単回帰分析
教科書P195回帰係数・・・Y=a+bXのb
決定係数(以前の授業参照)
重回帰分析
偏回帰係数・・・Y=a+b1X1+b2x2+・・ のbi標準偏回帰係数 β* 変数を正規化したときの回帰係数
単回帰と同じく最小二乗法で求める
決定係数・・・説明変数を増やすと値は上昇 自由度調整済み決定係数・・・1-(1-R2)(n-1)/(n-k-1) n=標本数 k=独立変数
VIF 分散拡大要因
多重共線性を見つける指標 他の変数に影響を与える・・・偏回帰係数の標準誤差増大
多重共線性・・・独立変数が他の独立変数と関連がある
VIF=(1-Ri2)-1
Ri2:他の独立変数で回帰させたときの決定係数
目安としては10以下であればそのまま
以下はSPSSの出力(データは教科書P11の「複雑な調査データ」)でBMIを従属変数 それ以外(ID 性別除く)を独立変数とした場合
変数減少法で
ちなみに変数増加法ですると
エクセルの場合
到達度確認
1)教科書P11の「複雑な調査データ」3行目(性別1 年齢51)のデータより重回帰分析により得られた数式からBMI値を推定せよ第14回 生存時間分析
到達目標13−1カプランマイヤー法による生存確率の推定することが出来る
13−2ログランク検定による生存率の差の検定を行うことが出来る
生存時間分析は治療法等の評価に時間軸を含めたもの
イベント発生までの時間による分析
生存率
生存率には計算方式が複数電算機の普及によりKaplan-Meier法でも容易に計算出来る時代
そもそも率は比の特殊な形態で単位時間あたりのイベント数を表わす
(第6回の授業で比率割合取り上げました)
Kaplan-Meierで求める非イベント発生(生存)率=1-イベント発生(死亡)率は、率では無く時点イベント(死亡)割合なので注意
<参考>
患者の生存率(地域がん登録全国協議会)
http://www.jacr.info/about/survival.html
直接法は割合。中途打ち切りがあると困る
生命保険数理法も割合。中途打ち切りについては1/2を観察期間に含めているがイベント発生(死亡)者の観察期間を考慮していないので率では無い(考慮していたら人年あたり(率)になる)
カプランマイヤー法によるイベント発生率の計算
個票データ患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | b | 3 | 11 | a | 8 | 21 | b | 9 | 31 | b | 24+ | 41 | a | 3+ |
2 | b | 5 | 12 | b | 14 | 22 | b | 18 | 32 | a | 12 | 42 | b | 8 |
3 | b | 6 | 13 | b | 9 | 23 | a | 12+ | 33 | a | 3+ | 43 | b | 24+ |
4 | b | 14 | 14 | a | 1 | 24 | a | 3 | 34 | b | 13 | 44 | a | 5+ |
5 | a | 7+ | 15 | a | 2 | 25 | b | 17+ | 35 | b | 17 | 45 | b | 14 |
6 | a | 14 | 16 | a | 3 | 26 | a | 7 | 36 | a | 3 | |||
7 | a | 17 | 17 | a | 13 | 27 | a | 8 | 37 | b | 15 | |||
8 | b | 21 | 18 | b | 21 | 28 | a | 12 | 38 | b | 13 | |||
9 | b | 21 | 19 | b | 16 | 29 | b | 12+ | 39 | a | 21 | |||
10 | b | 16 | 20 | b | 24+ | 30 | a | 1 | 40 | b | 18 |
実測正常率の計算
疾患a診断からの月数 | 月開始時の正常数 | 発症数 | 中途打ち切り数 | 発症割合 | 正常割合 | 累積正常率 |
---|---|---|---|---|---|---|
1 | 20 | 2 | 0 | 0.100 | 0.900 | 0.900 |
2 | 18 | 1 | 0 | 0.056 | 0.944 | 0.850 |
3 | 17 | 3 | 2 | 0.176 | 0.824 | 0.700 |
5 | 12 | 0 | 1 | 0.700 | ||
7 | 11 | 1 | 1 | 0.091 | 0.909 | 0.636 |
8 | 9 | 2 | 0 | 0.222 | 0.778 | 0.495 |
12 | 7 | 2 | 1 | 0.286 | 0.714 | 0.354 |
13 | 4 | 1 | 0 | 0.250 | 0.750 | 0.265 |
14 | 3 | 1 | 0 | 0.333 | 0.667 | 0.177 |
17 | 2 | 1 | 0 | 0.500 | 0.500 | 0.088 |
21 | 1 | 1 | 0 | 1.000 | 0.000 | 0.000 |
診断からの月数 | 月開始時の正常数 | 発症数 | 中途打ち切り数 | 発症割合 | 正常割合 | 累積正常率 |
---|---|---|---|---|---|---|
3 | 25 | 1 | 0 | 0.040 | 0.960 | 0.960 |
5 | 24 | 1 | 0 | 0.042 | 0.958 | 0.920 |
6 | 23 | 1 | 0 | 0.043 | 0.957 | 0.880 |
8 | 22 | 1 | 0 | 0.045 | 0.955 | 0.840 |
9 | 21 | 2 | 0 | 0.095 | 0.905 | 0.760 |
12 | 19 | 0 | 1 | 0.760 | ||
13 | 18 | 2 | 0 | 0.111 | 0.889 | 0.676 |
14 | 16 | 3 | 0 | 0.188 | 0.813 | 0.549 |
15 | 13 | 1 | 0 | 0.077 | 0.923 | 0.507 |
16 | 12 | 2 | 0 | 0.167 | 0.833 | 0.422 |
17 | 10 | 1 | 1 | 0.100 | 0.900 | 0.380 |
18 | 8 | 2 | 0 | 0.250 | 0.750 | 0.285 |
21 | 6 | 3 | 0 | 0.500 | 0.500 | 0.143 |
24 | 3 | 0 | 3 | 0.143 |
疾患a:青線
疾患b:赤線
ログランク検定
カイ二乗分布による検定を行う(期待度数と比較してバラツキがあるか否か)
イベント発生毎のクロス表(カッコ内は期待度数)
1ヶ月発症数 | 健常数 | 合計 | |
症例a | 2(0.889) | 18(19.111) | 20 |
症例b | 0(1.111) | 25(24.889) | 25 |
合計 | 2 | 43 | 45 |
発症数 | 健常数 | 合計 | |
症例a | 1(0.419) | 17(16.581) | 18 |
症例b | 0(0.581) | 25(24.419) | 25 |
合計 | 1 | 42 | 43 |
実測罹患率及び期待度数
診断からの月数 | a観察度数 | a打ち切り数 | a総人数 | a期待度数 | b観察度数 | b打ち切り数 | b総人数 | b期待度数 |
---|---|---|---|---|---|---|---|---|
1 | 2 | 0 | 20 | 0.889 | 0 | 0 | 25 | 1.111 |
2 | 1 | 0 | 18 | 0.419 | 0 | 0 | 25 | 0.581 |
3 | 3 | 2 | 17 | 1.619 | 1 | 0 | 25 | 2.381 |
5 | 0 | 1 | 12 | 0.333 | 1 | 0 | 24 | 0.667 |
6 | 0 | 0 | 11 | 0.324 | 1 | 0 | 23 | 0.676 |
7 | 1 | 1 | 11 | 0.333 | 0 | 0 | 22 | 0.667 |
8 | 2 | 0 | 9 | 0.871 | 1 | 0 | 22 | 2.129 |
9 | 0 | 0 | 7 | 0.500 | 2 | 0 | 21 | 1.500 |
12 | 2 | 1 | 7 | 0.538 | 0 | 1 | 19 | 1.462 |
13 | 1 | 0 | 4 | 0.545 | 2 | 0 | 18 | 2.455 |
14 | 1 | 0 | 3 | 0.632 | 3 | 0 | 16 | 3.368 |
15 | 0 | 0 | 2 | 0.133 | 1 | 0 | 13 | 0.867 |
16 | 0 | 0 | 2 | 0.286 | 2 | 0 | 12 | 1.714 |
17 | 1 | 0 | 2 | 0.333 | 1 | 1 | 10 | 1.667 |
18 | 0 | 0 | 1 | 0.222 | 2 | 0 | 8 | 1.778 |
21 | 1 | 0 | 1 | 0.571 | 3 | 0 | 6 | 3.429 |
今回は二つの群の比較・・・自由度k=n-1=1
O1=a観察度数の総和=15
E1=a期待度数の総和=8.549
O2=b観察度数の総和=20
E2=b期待度数の総和=26.451
検定統計量χ^2=6.441
χ^2(1,0.95)=3.8415
故に帰無仮説を棄却し対立仮説を採択する(a,bの再発率に差がある)
到達度確認
次のデータからカプランマイヤー法により生存確率を推定し生存曲線を描き,疾患ABによる違いがあるか検定せよ第15回 まとめ
到達目標15−1授業で出た問題を全て解ける
15−2履修後も統計を自己学修する意欲を持つ
到達度確認・ミニテスト総合得点分布
再試撲滅キャンペーンをやっております
試験で残念ながら実力が発揮できなくとも,再試で通る実力があると総合的に判断出来れば合格点に達します
試験の話(配点)
昨年度の配点は概ね以下のような感じでした00 第1回 オリエンテーション
10 第2回 尺度・度数分布
10 第3回 代表値・散布度
18 第4回 平均値の推定
02 第5回 相関係数・回帰直線
22 第6回 感度・特異度・ROC曲線
04 第7回 相対危険度
00 第8回 検定の原理
10 第9回 パラメトリック検定
00 第10回 ノンパラメトリック検定
00 第11回 計数値データの検定
02 第12回 独立多群間の比較
20 第13回 生存時間分析
02 第14回 多変量解析
では振り返っていきましょう.
補足
到達度確認について 問1:皆さん自身それぞれの試験の点の予想は? 皆さんの点の平均をとると67.4点 一番高い点を書いた方は95点 一番低いもので52点 実際の試験と同じ点を書かれた方は2名おられました 問2:学年全体の試験の平均点の予想は? 皆さんの予想平均点の平均をとると67.1点 一番高い点を書いた方は80点 一番低いもので50点 実際の試験の平均点は67.1点よりもかなり良い点です. 四捨五入した試験の平均点と同じ点を書かれた方は1名おられました 問3:学年全体の試験の標準偏差の予想は? 皆さんの予想した標準偏差の平均は13.1点 実際の試験の標準偏差とほぼ同じでした. 四捨五入した標準偏差(=13)を書かれた方は7名おられました |
いまいち納得いかない疑問に対してシンプルに説明しようとするシリーズ
不偏分散は何故nではなく(n-1)で除するのか求める対象(標本)が母集団全体だったとすると母分散は (1/n)Σ(xi-xbar)2 しかしながら対象が母集団の一部であれば,母平均(μ)=標本平均(xbar)とは限らないので,μとxbarの差を考慮して母分散を求める(推定する)必要がある (1/n)Σ((xi-μ)-(xbar-μ))2 =(1/n)Σ(xi-μ)2-(2/n)Σ(xixbar-xiμ-μxbar+μ2)+(1/n)Σ(xbar-μ)2 =(1/n)Σ(xi-μ)2-2(xbar2-2μxbar+μ2)+(xbar-μ)2 =(1/n)Σ(xi-μ)2-2(xbar-μ)2+(xbar-μ)2 =(1/n)Σ(xi-μ)2-(xbar-μ)2 ----- ここで それぞれ (1/n)Σ(xi-μ)2=σ2 (xbar-μ)2=σ2/n (注:詳しくは 上記参照) とおくと ----- =σ2-σ2/n =((n-1)/n)σ2 故に母分散の程よい推定値である不偏分散は U=n/(n-1)・(1/n)Σ(xi-xbar)2 =(1/n-1)Σ(xi-xbar)2 となる. 注)第4回の授業の時の補足で不偏分散の算出でもn/(n-1)が登場しています |