奈良県立医科大学 生物統計学2017
(医学部医学科)
本授業の位置付け
医学教育モデル・コア・カリキュラム(平成28年度改訂版)をベースに構成http://www.mext.go.jp/b_menu/shingi/chousa/koutou/033-2/toushin/1383962.htm
本講義が医学教育モデル・コア・カリキュラムにおいて担う部分・主に関連する部分
B社会と医学・医療
B-1 集団に対する医療
B-1-1) 統計の基礎
確率には頻度と信念の度合いの二つがあり、それを用いた統計・推計学の有用性と限界を理解し、確率変数とその分布、統計的推測(推定と検定)の原理と方法を理解する。
B-1-2) 統計手法の適用
医学、生物学でよく遭遇する標本に統計手法を適用するときに生じる問題点、統計パッケージの利用を含めた具体的な扱い方を修得する。
B-1-4) 疫学と予防医学
保健統計の意義と現状、疫学とその応用、疾病の予防について学ぶ。
B-1-7) 地域医療・地域保健
地域医療・地域保健の在り方と現状及び課題を理解し、地域医療に貢献するための能力を獲得する。
授業メニュー
第1回 オリエンテーション
第2回 尺度・度数分布
第3回 代表値・散布度
第4回 平均値の推定
第5回 相関係数・回帰直線
第6回 感度・特異度・ROC曲線
第7回 相対危険度
第8回 検定の原理
第9回 パラメトリック検定
第10回 ノンパラメトリック検定
第11回 計数値データの検定
第12回 独立多群間の比較
第13回 生存時間分析
第14回 多変量解析
第15回 まとめ
13回と14回を諸般の事情で入れ替えております
第1回 オリエンテーション
到達目標1−1授業の概要を説明できる
1−2統計の種類について説明できる
本授業の目的
生物統計学は、統計的手法を用いて保健医療分野における課題の解決に資する学問領域である。そのため統計学の基礎だけではなく、これまで本分野においてどのような統計的手法が用いられてきたのか理解し、データの収集・解析・解釈を実施する際に最適な手法を選択するための知識と、それを活用する能力の獲得を目的とする。
本授業の到達目標
1)データの性質に関して説明できる2)適切な統計手法を選択できる
3)仮説の統計学的検定法を説明できる
4)研究デザイン毎の特徴とデータを取り扱う上での注意点を説明できる
0)統計手法など必要に応じて「勉強すれば出来るようになる能力」を獲得する
教科書
新版統計学の基礎 第2版(昨年度の指定教科書の改訂版)http://www.nikkyoken.com/catalog/catalog_education/642
参考図書
バイオサイエンスの統計学−正しく活用するための実践理論http://www.nankodo.co.jp/g/g9784524220366/
参考資料
必要に応じて適宜配布しますが・・・授業の進め方
電卓使いますのでよろしくお願いします(授業中はスマホでかまいませんが試験の時は×)
単位認定
毎回「到達度確認」を実施します。提出いただいたものは返却します。定期試験では電卓利用します
「到達度確認」は正誤によって評価するものではありません。最終的に正しい知識を得ていくことが目的ですので間違いだから評価しないことはありません。
統計処理について
集団からデータをとりまとめて示すので・・・【統計学01】変量は対象を見る視点。視点を変えることで違うものが見えてくる。統計処理は個別の事情を排除する切ないもの。比例尺度はマイナスの世界がない。マラソンや駅伝の先頭集団は代表値と散布度で実況される
— めどぶぶ (@medbb) 2014年9月24日
(データ分析から考える地域医療の課題 より)
確率について
頻度・・・・・・・客観確率・・・自身の思考となんら関係ない。事象を外から眺めた(頻度を数えた)過去の結果で人により異ならない信念の度合い・・・主観確率・・・現時点での自身の知見による推論に基づく・・・論理的(なはず)だが人により異なる(可能性がある)
「非日常的な出来事は、主観確率を、客観確率よりも大きくしたり、小さくしたりする」
引用元:主観確率の大きさはどれぐらいか−その出来事は、本当に奇跡的と言えるか?:研究員の眼(THE HUFFINGTON POST)
http://www.huffingtonpost.jp/nissei-kisokenkyujyo/odds_b_8965176.html
ところで医療は医療従事者にとって日常だが、住民の方にとっては非日常
(地域と医療の統合に資する 情報活用の考え方 −不足の観点からみる医療2.10− より)
故に患者さんを中心とする医療チーム内で個々の主観確率が異なる状況に陥るかも。
モンティホールジレンマ
3つの箱があります。一つの箱にハワイ旅行。あとの二つはたわしが入っています。あなたは箱を一つ選びます。
あなたの選んだ箱がハワイ旅行の客観確率は?
司会者(桂三〇師匠)が選んだものと違う箱を一つあけました。たわしが入っていました。
参考:新婚さんいらっしゃい!(ABC朝日放送)
http://www.asahi.co.jp/shinkon/
あなたの選んだ箱がハワイ旅行の主観確率は?
師匠はたわしと知っててあけた場合(あなたもお約束であることを知っている)
師匠はハワイ旅行を出してもかまわないと思ってあけた場合(番組としてはぶち壊しだがそういうことがあることをあなたは知っている)
実際に皆さん賞品をあててみましょう
賞品は一つ。残りの二つはハズレ
1.3つの箱(A B C)一つ選んでください。選んだ箱をAとします
2.私はB,Cの箱の中からハズレている(ことを知っている)箱Bを開けます
3.残りはAとC変えることできますがどちらにします?到達度確認の問題1)
では、実際にどんなものか見てみましょう
ネコでもわかるモンティホールジレンマ(DOFI-BLOG どふぃぶろぐ)
記述統計と推測統計
統計とは2つ以上の要素の集まりからなる集団の特性を明らかにすること集団の特性≒個々の特性 という考え方。実際には 集団の特性≠個々の特性 のケースも多い
記述統計学
データの集団が何を示すのか(取り扱うデータが全て)度数分布・代表値・散布度
推測統計学
推定と検定に分かれるどちらも取り扱うデータは明らかにしたい全体の一部分となる
推定
データが何を示すのか 一部のデータを対象 → 全体を推測
検定
データがどのような状況か 与えられたデータを対象 → 検証・・・未来予測
両者は密接に関連している
到達度確認
1)残りはAとC変えることできますがどちらにします?2)統計があなたの人生に幸せをもたらす可能性の程度(確率)を示し、あわせてその理由を述べよ
授業後補足
モンティホールジレンマと新婚さんいらっしゃい!新婚さんいらっしゃい!は自分の医師で箱を選ぶのではなくくじで選んでましたモンティホールジレンマ補足モンティホールですが納得できない場合はトーナメント戦で優勝するチームの予測を考えると良いかもしれませんそれぞれのチームのレベルがわからなくくじ引きでシードを決めたとき試合開始前 優勝する確率 シードに関係なく全て 1/9≒11%1回戦終了時点 ・勝ったチームは実力ではなくツイてるだけとした場合 トーナメント残りは4人+1人なのでそれぞれ均等割(20%) ・勝ったチームは実力を証明したと考える場合 トーナメント側は試合で残った4人は優勝の確率が上がるが、シード側は何もしていないのでそのまま 決勝戦 ・勝ったチームは実力ではなくツイてるだけとした場合 トーナメントを勝ち残ってきた側とシード側に実力の差があるかわかっていないのでそれぞれ優勝する確率は50% (シードは何もしていないのに勝手に優勝確率が上がる) ・勝ったチームは実力を証明したと考える場合 トーナメントを勝ち残ってきた側とシード側に実力の差がある可能性がある。シードの優勝する確率は11%のままなのでトーナメントを勝ち残ったほうは89% (注:試合での疲れが次の試合に響かない事前提となりますが) 公平と公正の違いの話を思い出したりしていました。 シードがある時点で公平ではないとしても、それが公正であることを否定するものではない 逆に公平であれば公正とは限らない 集約されたデータから見ると個々の事情が吹き飛ばされている分、公平であれば公正だろうとなる。故に公平にこだわるのでしょう。 個々のデータを丁寧にみると個々の状況がみえてきて、公平ではなくとも公正に 公平は機会を均等に。公正は結果からツキ(バラツキ)を取り除く。 通常はチームの実力を鑑みて公平ではなくとも公正な方向で試合を組んでいます。<参考>【ネットで話題】バスケの静岡県大会くそワロタwwwww【真実】 (NAVERまとめ) https://matome.naver.jp/odai/2138278173194681601 この話はこれからの地域の保健医療の話に必要な話です。以前そのような話をしたのでどうぞ 地域と医療の統合に資する 情報活用の考え方 −不足の観点からみる医療2.10− 到達度確認のあれこれ1)(賞品を当てることが前提なので)変えてCを選ぶ(ほうが確率は上がる)まだ商品が出ていない場合、意図してなかったらACともに50%だが意図していた場合Aは33% Bは66%。意図している可能性を否定できない限り変えたほうが上がる 2)50%という方が多かったのはもたらす/もたらさないの二択で考えている方が多かったからかな? |
第2回 尺度・度数分布
到達目標2−1データの尺度分類(4つの尺度)について説明できる
2−2度数分布表が作成できる
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
橿原市の人口(橿原市)
http://www.city.kashihara.nara.jp/kikaku/toukei/jinkou/tikubetu_tyoubetu_jinkou.html
各地区によって異なる(年齢構成も居住期間も)
平成26年経済センサス-基礎調査(確報)奈良県結果平成29年3月(奈良県)
http://www.pref.nara.jp/secure/67732/H26kakuho_gaiyo.pdf
全国と比較して構成比率が異なることは分かるが全国の中である指標が一番になれば良い環境になるわけでもない
あくまでも、抱えている問題点と照らし合わせることで状況がみえてくる。
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
教科書は間隔尺度及び比尺度に関して統計処理上区別する意味は無いとなっているが、注意は必要
ポイントは数学的には正しかったとしても意味的に正しいかどうか
度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときに、それぞれの度数がしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
度数分布表から算術平均を計算できる
Σ(階級値×度数)/構成数
教科書P11の「複雑な調査データ」TGの度数分布表を作成してください
<参考> トリグリセリド(TG:中性脂肪)―脂肪の主成分、肥満の指標―(公益財団法人 神奈川県予防医学協会)
http://www.yobouigaku-kanagawa.or.jp/kensa/kensati09.html
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
75〜100 | 87.5 | ||||
100〜125 | |||||
125〜150 | |||||
150〜175 | |||||
175〜200 | |||||
200〜225 | |||||
225〜250 | |||||
250〜275 | |||||
275〜300 | |||||
計 | ----- | 18 | 1.00 | ----- | ----- |
度数分布図
度数分布を縦棒グラフで示したもの量的変量の場合「ヒストグラム」→縦棒の間隔は無し(量だから)
棒グラフの面積がその度数の量を示す。→ある部分だけ階級幅を倍にした場合度数は半分で描く
到達度確認
1)上記の度数分布表を完成させよ2)上記のヒストグラムを作成せよ
ただし200以上の階級幅は50で作成の事
授業後補足
教科書該当ページ 第1章(P10-P18) 第2章(P20,P29) 統計データは幅広く見たほうが良いだろうというのが例えば産業と疾患の話。 <参考>振動障害(うみねこ通信No.116平成21年2月号 青森労災病院) http://www.aomorih.johas.go.jp/guide/umineko/2009/2.php 平成27年度奈良県林業統計 http://www.pref.nara.jp/23014.htm 林業労働 http://www.pref.nara.jp/secure/60021/11.roudou_h27.pdf からも従事者の減少高齢化がわかる(高齢化のピークは過ぎたか) 公平と公正の話。指標を全国比較して違う(スコアが低い)から改善が必要 もしくはスコアが高いからもう取り組みは不要と単純に考えるのはまずいという話。 |
第3回 代表値・散布度
到達目標3−1代表値の算出及び特性について説明できる
3−2散布度の算出及び特性について説明できる
代表値と散布度と大きさn(個数や事象数)が提示されれば、その集団がどんなものか想像出来る(マラソン実況)
代表値
average(その集団を数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています)算術平均
mean(算術平均以外にも相乗平均(積して累乗根をとる)などもあります)1/n・Σxi
パレートの法則(80-20の法則)
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない
寄り道
民間給与実態統計2015(国税庁)http://www.e-stat.go.jp/SG1/estat/GL08020103.do?_toGL08020103_&listID=000001159883&requestSender=dsearch
第9表 業種別及び給与階級別の給与所得者数・給与額 より ローレンツ曲線
ジニ係数は医療,福祉0.358 不動産業,物品賃貸業0.439 電気・ガス・熱供給・水道業0.230
ちなみに奈良県の医師偏在の話で曲線を描くと(市町村単位)
(データ分析から考える地域医療の課題 より)
もっとも地域別医師数偏在の話が解消されればすべてが解決されるわけでもないですし、範囲を狭めていくほど偏在は生じるわけですから・・・
リソースの地理的な偏りをゼロにすることそのものは目的ではなく解決に近づく手段であって、提供になるべく偏りがでないような配分ができる仕組みとのパッケージと考えております
度数分布表を基にした平均値の計算法について(再掲)
Σ(階級値×度数)/観測数
中央値
median(別名第2四分位数)量的変量を順序尺度で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
スキージャンプの飛型点は中央値的なノリで算術平均している
スキージャンプを知ろう!!ルール解説(ジャンプ雪印メグミルク)
https://www.meg-snow.com/jump/rule/rule.html
最頻値
mode(流行,はやり)違う意味で数の理論(多数決)の世界
量的変量を名義尺度で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記(平均をとると えっオレ優勝!?状態になる)
散布度
dispersion最大値と最小値を使う
最大値と最小値がわかればその集団のバラツキがわかる最大値maximum excel max関数
最小値minimum excel min関数
範囲
RangeR=最大値−最小値
特徴
外れ値もひらう
算出が用意
四分位数を使う
Quartile小さい順(昇順)に並べて集団を4分割
第1四分位数 First Quartile:Q1 = 25th percentile 25%タイル値
第2四分位数 Second Quartile:Q2 = 50th percentile 50%タイル値 = Median 中央値
第3四分位数 Third Quartile:Q3 = 75th percentile 75%タイル値
四分位数の求め方・・・厳密には数種類ある(P41)
この授業の世界での取り決め
四分位は特に指定しない限りtukeyのヒンジで
http://medbb.exblog.jp/12047409/
四分位範囲
IQR(interquartile range)IQR=Q3-Q1
四分位偏差
QD(Quartile Deviation)QD=IQR/2
範囲は集団を外から見たバラツキをイメージ
偏差は集団の内部のある値からのバラツキをイメージ
平均値を使う
mean偏差
Deviationもともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0
分散
varianceV excel関数はVAR
偏差を二乗したものの平均
標準偏差
Standard Deviation記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
到達度確認
1)度数分布表のA,B,Cに入る数値を求めよ2)度数分布表から平均値を求めよ
3)なぜ、母分散の程よい推定である不偏分散では偏差平方和をnではなくn-1で割るのか
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.5〜1.0 | |||||
1.0〜1.5 | 6 | A | 0.325 | ||
1.5〜2.0 | 0.1 | 17 | |||
2.0〜2.5 | B | 0.65 | |||
2.5〜3.0 | 7 | ||||
3.0〜3.5 | 0.125 | C | |||
3.5〜4.0 | |||||
計 | ----- | 1.00 | ----- | ----- |
補足
本日の余談 キャンパス移転に伴い県立医大が「将来像」 町医者ジャンボ(読売テレビ) http://www.ytv.co.jp/machiisha/ ”いい人生やった”その一言のために(プロフェッショナル仕事の流儀 NHK) http://www.nhk.or.jp/professional/2009/0113/ 教科書該当ページ 第2章(P21-27,P41) ローレンツ曲線の話所得格差を測る指標 −ジニ係数とローレンツ曲線−(とやま経済月報2005年4月)http://www.pref.toyama.jp/sections/1015/ecm/back/2005apr/shihyo/ 分散のところちょっと整理しておきましょう。 教科書では標本標準偏差を不偏分散によるものとしているので (実用上それでよいが、混乱しないように整理) 母分散 σ^2:母集団の分散・・・全要素の値が必要 標本分散 s^2:標本の分散・・・標本の値が必要 不偏分散 u^2:標本より母分散の不偏推定量をもとめたもの <参考>標本平均, 標本分散, 不偏分散(琉球大学工学部電気電子工学科電子システム工学講座(准教授)半塲 滋) http://dsl4.eee.u-ryukyu.ac.jp/DOCS/error/node19.html 標本分散と不偏分散もどちらも母分散の推定値・平均値の推定とはワケが違う 上記サイトから引用「正規分布に対し, 標本平均は平均の最尤推定量かつ不偏推定量なのであるが, 標本分散は分散の最尤推定量ではあるが不偏推定量ではなく, 不偏分散は分散の不偏推定量ではあるが最尤推定量ではない。 」 到達度確認のあれこれ1)個票データは存在しません2)もし個票データが存在してそちらで計算したならば同じような値が出てきます(当然ですが) 3)教科書P23参照。標本の平均との偏差の和は必ずゼロですが、母平均(≠標本平均の場合)との偏差の和はゼロにならない ということをイメージしていれば大丈夫でしょう |
第4回 平均値の推定
到達目標4−1標準偏差と標準誤差の違いを説明できる
4−2母分散が未知の場合でも母平均を区間推定できる
推定
母集団から抽出した標本を基に母集団の分布を示す値(母数)を推測する点推定と区間推定がある
点推定
一つの値で推定母平均の推定値は標本平均
母分散の推定値は不偏分散
区間推定
母数がある確率で入る幅を持った推定値本日の目標はP70の話を理解すること。母平均は一定なのに標本平均は標本毎に異なるので幅を持たせる
標本平均に幅を持たせることで、その枠内に母平均が入る。→平均値のバラつき具合が標準誤差 SE=σ/√n
正規分布
左右対称の釣鐘状分布(教科書P32-40)平均値に近いほど出現率が高く遠ざかるに従って低くなる(ことが多い)
同じモノを同じ条件で繰り返すと正規分布という話
ポイントは「異質な集団の計測値が組み合わさった分布は正規分布とならない」(教科書P33)ハズなのですが・・・
いずれ話をする検定の話はこの部分がキーとなりますが、異質な集団を一緒と判定したり、一緒な集団を異質と判定したり。そもそも異質って?判定基準って?
正規分布っぽい形状の判断→P28 歪度 尖度を参照
教科書には検定表もついておりますが(まだ授業で検定の話は一切しておりませんので)・・・いずれの機会で
検定するときには「分布の正規性」に関してデータ数が大きければ制約なしなので(P6)、あんまり・・・
真度と精度の話(誤差)に置換えると
上段が正規分布。裾広がりが右に行くほど広がる
下の段は良くわからない分布になるが、例えばP35のような混成分布の場合もありうる
k 信頼区間限界指数・・・標準正規分布でzスコアのこと
標準正規分布
平均値が0標準偏差=1(分散も1)になるように値を変換したもの
偏差値は平均値を50、標準偏差=10になるように値を変換したもの
中心極限定理
標本の大きさが十分であれば標本平均の分布は正規分布→正しく測定されているのであれば偶然誤差の発生は正規分布に従う
→測定回数を増やせば増やすほど
標準偏差と標準誤差
(教科書P52)・標準偏差は標本の分布のバラツキ具合を示したもの
・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
誤差伝搬の法則の話で考えると良い
私が過去に理由を説明したときの資料
http://www.medbb.net/education/ocrstat2015/index.html
母標準偏差が既知の場合の区間推定
(教科書P70)正規分布表でなぜ1.96になるのか確認
母標準偏差が未知の場合の区間推定
(教科書P70)正規分布は母平均値と母標準偏差が分からないと使えない→nが多い場合標本平均と標本標準偏差で近似できるが
nが少ない場合は近似できない→t分布(標本の自由度νさえわかっていれば、後は検定統計量を求めれば確率がわかる)
t分布
P64-66
自由度のみできまる確率分布
自由度・・・標本の中で自由に振る舞うことが許されている個体の数
統計値が母数の推定となると、自由に振る舞えない個体が出てくる(つじつま合わせ)
標本分散は偏差二乗和を個体の数で除することで求めるが母分散のほどよい推定である不偏分散はn-1(自由度)で除する
到達度確認
1)P11複雑な調査データのTGの95%信頼区間を求めよ2)P39例題のケースで88点の場合、偏差値と上位から何番目になるか求めよ
3)標本標準偏差が変わらずサンプル数が5倍になった時、標準誤差はどの程度変化するのか?
補足
教科書該当ページ第2章(P28,32-37)第3章(P52-53) 第4章(P64-66,70-71) 本日の余談実際降っていない雨表示、気象庁 山陰沖レーダー画面(47NEWS)https://this.kiji.is/231273048212111364?c=39546741839462401 科学の話ということで、反証可能性のことやら、実態との乖離の話やら 本日は学生にしてみれば普段の月曜日、社会人にとっては半分お休みという感じでした
私のtweetに鮮魚が登場したときは心穏やかで速やかに帰宅しているサインでもあります http://twilog.org/medbb/search?word=%E9%AE%AE%E9%AD%9A&ao=a 私のyoutube動画で一番人気があるのがこれ。 出雲高校校歌(夏の甲子園第98回大会(初出場)にて)2016年8月7日 到達度確認あれこれ1)分散は二乗の平均−平均の二乗で求められますが不偏分散を求めるのでn/n-1倍してください。 今回は全数調査したわけではないので(念のため) 母分散は不明なので信頼区間限界係数はt分布表より 区間推定の場合上限下限は区間に含むか否かの話がありましたが、≦を使っているけーすが多いです(知る限り)。 教科書の正規分布表では両側確率が示されていますがz値の点を含む面積が示されています となると<を使うほうが筋と言いたくなりますが、違う分布表(例えば診療情報管理士のためのやさしい統計学(じほう))を見ると 中心から上限までの面積が示されていますがZ=1.96の時に0.4750となっています。 (まだ授業をしていませんが)検定の場合確率が有意水準未満か否かで判断しますので、そちらと整合性を取ると区間推定は≦で良いかと 2)Z=(88-55)/15=2.2 標準正規分布表より両側で0.02780 上側だけなので0.0139×400人=5.56人ということで6人程度と推測される 3)1/√5≒0.447倍に減少する 推奨電卓の件試験の時にあまりハイスペックなものを持ち込まれると(プログラマブル電卓とか)ややこしいことになるのでその旨試験前には教務より提示があると思います 四則演算が出来て平方根が求められるものでこの試験は乗り切れます。偏差値の件からの話どこにでも頭の回転が速い人間は存在するという話お作法と体力(根気)のところが違いとなっているんだと思っています。 それは補える可能性が高いわけで・・・という話 |
第5回 記述統計(W)−相関係数・回帰直線
到達目標5−1相関係数を説明・計算することが出来る
5−2回帰直線がどのようなものか説明することが出来る
相関
(教科書P174) correlative相関関係がある・・・関連がある
相関関係が無い・・・関連がない
他方の影響を受けるか受けないか
因果
cause and effect原因と結果
因果関係がある・・・影響がある
因果関係が無い・・・影響がない
普通は関連がある(相関がある)=影響を及ぼす関係(因果関係がある)と考える(考えたくなる)
例
たばこを吸う−肺がん・・・・相関関係○
タバコを吸う人にコーヒーを飲む人が多いのは・・・(yahoo知恵袋)
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1293675642
この関係を使うと
コーヒーを飲む−肺がん・・・相関関係○
でもコーヒーが肺がんの原因とはかぎらない
コーヒー愛飲者に肺がんが多い理由は?生活習慣との関連を検証
アメリカで約50万人を対象にした調査から
from International journal of epidemiology
http://medley.life/news/item/5589521b660815fe00d5ec8e
コーヒーと肺がんの相関関係に割り込んでいる(どちらとも相関関係がある)状態=交絡)
割り込んでいるそれ=交絡因子・・・たばこ
コーヒーと肺がんに因果関係が無いとしたならその関係は疑似相関
例:電車に乗るとき皆がそれぞれ駅に向かって仲良く歩いてるように見えるが、互いに関係は無い。
本授業(統計学)は医療系対象で「提供する医療が及ぼす影響やその要因に関する法則性を見いだす方法を探求する学問分野」
(大阪リハビリテーション専門学校 統計学2015(理学療法学科)より)
知りたいのは「影響」であるから目的を見失わないように
相関図
X軸とY軸に一つの対象に与えられるそれぞれの値をプロット(例:身長と体重)とりあえず図にすると関係が直感的にわかる(場合がある→交絡現象交互作用に注意)
相関係数
-1から1までの値をとる(教科書P174)+の場合正の相関 −の場合負の相関
Xが増加すればYも増加する・・・1
Xが増加すればYは減少する・・・-1
Xが増加しようが減少しようがYは関係ない・・・0
相関係数が0出なければ相関は「ある」ワケだが程度は数字が0から離れるほど強くなる
一般に〜0.2であれば相関はなく、0.7〜であれば強い相関の目安とされてる。
X軸で見たときのバラツキ具合とY軸で見たときのバラツキ具合を元に計算してる
バラツキ=散布度・・・分散・・・偏差の二乗の平均
共分散=ある対象のX軸の偏差とY軸の偏差を乗じたものがベース
注意
基本事項のところは偏差平方和の話になっているが標本分散の場合両辺をnで割らないといけない
割ると・・・二乗の平均−平均の二乗 というリズム感のある公式が出来る
Xの偏差 | Yの偏差 | 乗じた結果 |
---|---|---|
+ | + | + |
+ | − | − |
− | + | − |
− | − | + |
共分散はX軸Y軸のバラツキ具合が混ざっているのでそのままの数字だと解釈しにくい→XとYの標準偏差で除する(正規化)→相関係数
直線で無い場合は変換(例えば対数変換)してから計算してもよい(対数グラフ)
対数グラフの例(方眼紙ネット)
http://houganshi.net/taisuu.php
回帰直線
X軸の値とY軸の値を数式(y=ax+b)で示す直線を引いたときにそれぞれの点からの差(残差)の2乗して足したもの(平方和)が最も小さい時の数式が回帰直線
決定係数
相関係数を二乗すると求められる数式によって説明できる割合を示す。(寄与率とも)
つまり高ければ高いほど数式で説明出来ることになる
デモページ(P182例題35)補足
変数の定義独立変数・・・input(コントロール出来る)
従属変数・・・output(系によって決まる)
到達度確認
1)P11複雑な調査データのBMIとTGの相関係数を求めよ2)1)の回帰直線および決定係数、回帰直線の周りの標準偏差を求めよ
補足
本日の余談人口減少/競争社会について
テニスに行く予定があるのに、アンコールで想定していた時間をオーバー・・・ タクシーが運よくつかまり運転手と話をしながら・・・ 15時からコンサートをしていたこと、誰のコンサートか、想定終了時間も教えてくれた(私たちの予想+1時間) 運転手さん情報をもとに付近をウロウロしていた模様。→関西国際空港に行く人をgetできたら 残念ながら私たちは違ったが、それでもアンコール途中で抜け出す人は急いでいるわけですから。 50ccバイクの件 50tバイクもニーズの減少と排ガス規制と 目前に迫った50ccバイクの滅亡(ITmedia ビジネスオンライン) http://www.itmedia.co.jp/business/articles/1705/08/news040.html 電動化の話。かたちを変えながらその環境(求められているもの)にあったものを提供しなくてはならない (余談)50ccの制限速度は30km/hです。気をつけて運転しましょう (余談)自転車も取り締まりが厳しくなっています。みなさん自転車でも安全運転を ケガには気をつけましょうの話 その後のテニスにて・・・。 若いうちは大丈夫ですが年齢とともに入念な準備を(運動神経の優れている方ほど肉体的なものと感覚が乖離するであろう) 教科書該当ページ第1章(P17)第9章(P174-179,195-202) 授業補足有意差の話は、第8回 検定の原理で説明する予定ですので、今回のところはスルーします (教科書P180r表の話などはその時に) 到達度確認あれこれ教科書P198演習19が近しい問題(解答はP261) |
第6回 感度・特異度・ROC曲線
到達目標6−1判別特性値の計算が出来る
6−2評価結果よりROC曲線を作成し評価やカットオフ値の検討が出来る
検査法の診断的有用性を評価する話
有病率の影響を受ける指標、受けない指標を整理しておくこと
「率」ではあるが実際には割合。時点有病率ともいう(期間有病率は時点有病率に期間中の罹患を加えたもの) 比と率と割合の違いについて 比・・・異なるものを比較(無単位になる場合もあるが) 率・・・比だが時間と比較(単位は/sec /min /hr となる) 割合・・全体と一部(同じもの)を比較(無単位) 以下参考にしてください 第13回 医療統計(U)−比と率と割合(大阪保健医療大学 医療情報学2016) http://www.medbb.net/education/ohsumedinfo2016/#13 |
感度と特異度
教科書(P116)感度=P(陽性|D) 疾患群における真陽性の割合
偽陽性率=P(陽性|Dc) 非疾患群における偽陽性の割合
特異度=1−偽陽性率 非疾患群における真陰性の割合
予測値
有病率の影響を受ける
陽性的中率=P(D|陽性)
陰性的中率=P(Dc|陰性)
検査法の評価指標
尤度比=感度/偽陽性率
オッズ比=教科書参照 検査の有用性
ROC−AUC=ROC曲線を描いて算出 検査の分別能
何でも陽性と判断する検査は感度も偽陽性率も1になる
(なんでもかんでも、あります!! のノリ)
ROC曲線
教科書(P119)判別度の分析
感度と偽陽性率(1−特異度)を用いて曲線を描く
例題21でEをカットオフ値としたときの陽性的中率=7/9 陰性的中率=8/11
到達度確認
1)なぜ予測値(例えば陽性的中率)は有病率の影響を受け、感度は影響を受けないか簡潔に述べよ2)次のマンモグラフィの検査結果からROC曲線を描き、AUCを(小数点以下2桁まで求め四捨五入)求めよ
<参考>
森本 忠興,日本の乳癌検診の歴史と課題,日乳癌検診学会誌,18(3)211-231,2009
https://www.jstage.jst.go.jp/article/jjabcs/18/3/18_3_211/_article/references/-char/ja/
3)P124のCKのカットオフ値をそれぞれ
<参考>
学生用共通基準範囲(日本臨床検査医学会設定、2011)(日本臨床検査医学会)
http://www.jslm.org/committees/standard/ref_2011.html
異常なし(1) | 良性(2) | 悪性を否定できない(3) | 悪性の疑い(4) | 悪性(5) | 計 | |
---|---|---|---|---|---|---|
疾患群 | 0 | 4 | 14 | 12 | 10 | 40 |
非疾患群 | 20 | 20 | 12 | 8 | 0 | 60 |
補足
本日の余談の前の余談母の日の話昨日は大阪市内(天六)に寄ってから・・・ チャリウッド2017 http://www.mbs.jp/challywood/index.shtml http://www.mbs.jp/challywood/event/ サイエンスショー(ボルトボルズ 笑ってタメになる!サイエンスショー)をみました。 SNSに動画はダメとおっしゃっていたので静止画で一枚だけ上げました。 子どもたちは大喜びでした
空気砲の原理(院内課外活動教材ライブラリー 企画:財団法人 民間放送教育協会) http://www.tokiwa.ac.jp/~kudou/experiment/s3003.php 学園祭などで皆さんも一般の方々に興味を持ってみていただけるような工夫を。 どのようなグッズを配っているかも参考になると思います 本日の余談アニサキスによる食中毒を予防しましょう(厚生労働省)http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000042953.html 食中毒統計調査(厚生労働省) http://www.mhlw.go.jp/toukei/list/112-1.html 食中毒統計作成要領 http://www.mhlw.go.jp/stf/shingi/2r9852000002xk88-att/2r9852000002xkjo.pdf アニサキス食中毒が急増、渡辺直美「激痛すぎて泣いた」 対処法は?(The Huffington Post Japan) http://www.huffingtonpost.jp/2017/05/13/anisakis_n_16599196.html 以下記事より引用 「医療機関に積極的な報告を求めて以降、報告は増加傾向」 「報告されないケースも多く、患者は推計で年間7000人以上になるとみられている」 「魚介類の流通事情が変化し、冷凍でなく生の状態で取引されるケースが増えたことも被害増加の要因と推定」 統計データの信頼性の話と、社会の環境変化の話と 教科書該当ページ第6章(P116-124)到達度確認あれこれ1)有病率が上がるとa↑c↑b↓d↓2)AUC=0.85 3) a 真陽性 27 b 偽陽性 6 c 偽陰性 3 d 真陰性 14 感度 27/30=0.9 特異度 14/20=0.7 尤度比 0.9/0.3=3 オッズ比 (27/3)/(6/14)=21 |
第7回 相対危険度
到達目標7−1相対危険度を示す指標にどのようなものがあるか説明できる
7−2症例対照研究では相対危険をオッズ比で算出する理由を説明できる
相関は関連がどの程度あるか
判断分析は、検査結果を基にどのように判断していくのか(検査結果と疾患の話)
相対危険度の話は、疾患(結果)が曝露(原因)の影響をどの程度受けているのか
指標は数字として計算出来る限り結果が現れるのだが、それの解釈を誤らないようにすることであったり、そもそも解釈しようが無いので出しても意味なしの場合もある
この授業では相対危険度=Relative Risk は一般的な用語であり、その算出指標の一つに相対危険=リスク比(Risk Ratio)があると整理します
一般的にはここらへんの言葉ゴチャゴチャです。
研究手法の話
教科書P220参照・・・観察研究では群間比較に有意差を使えない?実態(現状)を明らかにしたところで、その事実を単純に拡張できるわけではない。
実態に基づく話は実効性が高いものの、誤った解釈に向かってしまい水平展開ができなくなったり。
観察研究(Observational study)
横断研究(Cross-sectional study)曝露と疾患を同時に評価
時間軸がない場合が多く(例外は性別など)因果関係までは不明になってしまいやすい
コホート研究(Cohort study)
対象に曝露している人々を把握し、その中から曝露群と非曝露群を設定、追跡調査していくスタイル
通常前向きだが、後ろ向きにみる回顧的コホート研究というのもある。(後々でも曝露群に関する情報がある場合)
症例対照研究(Case-control study)
ある状態(例えば病気に罹患している)群と、罹患していない群を設定、時間を遡って調査していくスタイル
後ろ向きにしか行えない(前向きだと曝露→疾患の順がおかしくなる)
実験的研究(介入研究)(intervention study)
コホート研究の場合、曝露群(介入群)を研究者が割り付ける → 被験者に対する倫理的配慮が肝要無作為に割り付けることが出来る場合は交絡因子を制御できる(ことが期待される)
倫理的に考えると非介入群の方が不利益になってしまう可能性が高いので、配慮した研究デザインが求められる
説明用データ
疾病発症 | 疾病無 | 計 | |
---|---|---|---|
曝露有 | A | B | A+B |
曝露無 | C | D | C+D |
計 | A+C | B+D |
相対危険
Risk Ratio(RR)「リスク比」と言った方がわかりよい(と思うが)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら
A〜D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)
曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
リスク比≒A/B/C/D=AD/BC
オッズ比
Odds Ratio(OR)「リスク比」を出せない場合でも出せる(リスク比はそれぞれの群のリスクがわかっていないと出せない)
危険な事象が起きた場合と起きなかった場合度数の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの
発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
=AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる
到達度確認
コホートと症例対照研究両方で行っていたものとする。1)それぞれから相対危険度(リスク比もしくはオッズ比)を求めよ
2)リスク比とオッズ比が近似値となる条件を述べよ
3)症例対照研究ではなぜリスク比を求めても相対危険度としての指標として適切ではないのか。簡潔に述べよ
4)介入研究では倫理的な問題に注意しなくてはならないがナゼか?自分の考えを簡潔に述べよ
5)P110例題19のデータを用いて基準範囲をM:10〜50 F:10〜30 とした時の相対危険度を求めよ
<参考>
学生用共通基準範囲(日本臨床検査医学会設定、2011)(日本臨床検査医学会)
http://www.jslm.org/committees/standard/ref_2011.html
コホート研究
不整脈あり | 不整脈なし | 計 | |
---|---|---|---|
曝露群 | 100 | 1900 | 2000 |
非曝露群 | 50 | 1950 | 2000 |
計 | 150 | 3850 | 4000 |
不整脈あり | 不整脈無し | 計 | |
---|---|---|---|
曝露歴あり | 50 | 30 | 80 |
曝露歴無し | 50 | 70 | 120 |
計 | 100 | 100 |
補足
今日の余談世の中は狭い話広いと(思う)ところに出ることで狭さを知る→6次の隔たり
本学にいる皆さんのメリットの一つとして、医学医療に関するところでその狭さを実体験できるところ なので繋がることに注力するのではなく、繋がった時に自身の能力を十分発揮できるよう日々過ごしてください。 ちなみに、前に座っていた先生とは学生時代から存じ上げているが、緩いつながりの先生 私の指導教員のボスからの繋がりと思っていたのですが(それも間違っていないのですが)指導教員とは異なる恩師の先生の弟先生からのラインと説明した方が正確なようで。 プログレロックのバンドメンバーの変遷を思い浮かべていました <参考>女子カーリングのプログレッシブ・ロックな世界(スミルノフ教授公式ウェッブログ日本語版) http://sueme.jugem.jp/?eid=1598 ちなみにですが、改正個人情報保護法に関して興味のある方は連絡ください。 到達度確認あれこれ1)(コホート)相対リスク比 (100/2000)/(50/2000)=2.0(症例対象研究)オッズ比 (50/50)/(30/70)=2.3 ちなみに (コホート)オッズ比 (100/50)/(1900/1950)=2.05 (症例対象研究)相対リスク比 (50/80)/(50/120)=1.5 2)略 3)略 4)略 5)危険率(割合)が程よい推定と言えるか否か 今回の対象集団は暴露群(男性)非暴露群(女性)と考えるとそちらの追跡で得られた値でそれぞれの危険率は程よい推定といえる。 オッズ比と考える場合は わからないときは喫煙有 喫煙無 と読み替えたときに成立するか否か(授業後の質問に怪しい(紛らわしい)答え方をした記憶があるので注意) 前立腺がん検診の有効性と適切な受診間隔を検討するためのケース・コントロール研究(日本泌尿器科学会雑誌 Vol. 89 (1998) No. 11 P 894-898 ) https://www.jstage.jst.go.jp/article/jpnjurol1989/89/11/89_11_894/_article/-char/ja/ |
第8回 検定の原理
到達目標8−1確率がどのような意味合いのものか理解する
8−2仮説検定の論理構成を説明できる
教科書第三章P46〜
確率
ある事象が起こることが期待される度合い(割合)ある個体に事象が起こる/起こらないのいずれかとして、確率をそのまま提示しても答たことにはならない
試行 サイコロを振って3の目が出る(y or n)
確率 サイコロを振って3の目が出る(1/6)
繰り返し試行を行うと頻度割合はその事象の確率へ収束していく
生物を対象とした場合試行を繰り返せる?→無理な場合が多い→条件を近づけて繰り返したと見做す
条件が近くないと単純に比較できない→(再掲:教科書220)
試行の結果は事実で正しい。かといってそれが常に正しい(真)とは限らない
次の試行以降で異なる結果がでる可能性を排除できない→永遠に試行を繰り返さないとならず法則が出せない
(故に異なる現象の起こる確率にたいして閾値を定めて、なかったことにして一般性を主張するスタイル)
事象の起こる確率が著しく低くても、実際に起こらないわけではない。
参考
デジタル絵本 かっぱの雨乞い (札幌平岸高校デザインアートコース)
降るまで雨乞いをするので「雨乞いをすれば雨が降る」となってしまう
NHKも民放も真央会見生中継 注目テレ東はジミー出演の「昼めし旅」(デイリースポーツ)
https://www.daily.co.jp/gossip/2017/04/12/0010088761.shtml
参考
まさに歴史的瞬間、オバマ大統領の被爆地ヒロシマ訪問にさすがのテレビ東京も特別番組で生中継
http://kabumatome.doorblog.jp/archives/65863513.html
背理法
命題の否定を仮定して話をすすめて、その矛盾を示すことで命題が成り立つとする論法仮説検定
教科書P46-<大前提>やみくもに検定するのではなく、検定する理由・確信があるから確かめる という感じで
手順1:仮説をたてる(帰無仮説H0および対立仮説H1)
背理法に基づく証明をしている。
(差がない仮説が証明できないので、その対立である差がある仮説を採択する)
手順2:検定統計量を計算する
その事象の起こる確率を計算していることになるが、用いる確率分布によって計算式が異なる。
手順3:有意水準を決める
確率的に必然と偶然を切り分けている。一般に5%で分けているが1%の時もある
手順4:有意水準と比較し、仮説を棄却採択する
例)帰無仮説H0を棄却し対立仮説H1採択
注意
区間推定の話の延長線上が検定(P70とP51を比較)
仮説検定がしっくりしないそもそも
命題の否定と言うものの「ある」か「ない」かって世界は乱暴じゃないの
対立仮説(ある)の否定は帰無仮説(なし)では(なし)の反対は?(ある って何が?)
そもそも「関心がある」の反対は「関心がない」。だから「好き」の反対は「関心がない」。でも「嫌い」の反対も「関心がない」
不完全な帰納法で導くのって危険じゃないの
エラーを起こすことが前提の帰納法(とりあえず結論を早く出せるものの)αエラー βエラーが存在する
エラーを気にしなければいつの日か、都合の良い結論が得られるかもしれない → 雨乞い
故にやみくもに検定するのではなく、至るまでのストーリーが大切
しっくりするポイントは勝手に拡大解釈しないことで、仮説検定は用法を守り正しく使いましょう
エラー
教科書P215第一種の過誤(αエラー)・・・誤って違うと判定する確率
第二種の過誤(βエラー)・・・誤って一緒と判定する確率
<参考>
正しく「同じ」と判定する確率・・・1−α
正しく「違う」と判定する確率・・・1−β
到達度確認
1)P50例題6のクラスの人数が81人、平均138.5cmとしたときに、それぞれ全国平均と比べたとき全国水準と違うと言えるか。有意水準は1%及び5%として検定せよ1’)P50例題6のクラスの人数が64人、平均141.5cmとしたときに、それぞれ全国平均と比べたとき全国水準と違うと言えるか。有意水準は1%及び5%として検定せよ
補足
余談学生から社会人になると、自分で判断して行動することが求められる新たな役割が発生します。行動指針など勝手に天から舞い降りてくることはないので、自分で成長してつかみ取ってください。
教科書該当ページ 第3章(P46-51) 配付資料該当ページ 心理学的研究における統計的有意性検定の適用限界,葛西俊治,札幌学院大学人文学会紀要79,P45-78, 2006 http://ci.nii.ac.jp/naid/110004812630 配布したのはP50-58 到達度確認あれこれ有意水準の解釈が怪しい人が複数いるので注意有意水準1%で対立仮説を採択する状況ならば5%でも対立仮説を採択 有意水準5%で対立仮説を採択する状況の場合1%だとどちらもありえる 有意水準5%で判定保留ならば1%でも判定保留 検定統計量(今回の場合はzスコア)で話をした方が理解しやすいと思います。 |
第9回 パラメトリック検定
到達目標9−1パラメトリック検定の頑強性robustnessを説明できる
9−2t検定を行うことができる
パラメトリックとノンパラメトリック
教科書P44分布の形状(母数)に依存する統計量(平均値 標準偏差・・・量的変量)
分布の形状(母数)に依存しない統計量(順位 中央値 パーセント値・・・質的変量)
教科書P4-7,204
パラメトリック検定・・・計測値の分布が正規分布であることを仮定
正規確率紙法・・・Q-Qプロット
データを順序尺度的に用いてその順序からパーセンタイルを求めて、その値を確率分布(正規分布)に代入して期待値を算出して比較する。
P11複雑な調査データTGを用いて
<参考>正規確率プロットの作り方(統計WEB 社会情報サービス統計調査研究室)
https://software.ssri.co.jp/statweb2/tips/tips_8.html
適切な統計処理に必要な考え方
P203-216・分布の正規性
→そんなに気にしていない
分布の正規性について「データ数が大きくなると制約無し」・・・どの程度 パラメトリックの場合→結局妥当な話になってしまう ・検定法によって判定が異なる場合
→データが出てから検定法を選択するのは適切ではない
・片側検定,両側検定
→両側検定が妥当
・有意差検定の有意水準は0.05でよいの
・有意差検定が無意味な場合
→統計的有意差と臨床的有意差の話 教科書の効果量に対する必要データ数を可変させたものが以下
各群10データで検定すると10kg程度となるが、そこまで体重が変化しているとなにか違う出来事が起こっている気がする
各群1000データぐらいで検定すると1kg程度で有意な結果となるが、本当に意味あるのか気になる
<参考>その治療は臨床的に有益か(PEDro)
https://www.pedro.org.au/japanese/tutorial/is-the-therapy-clinically-useful/
<参考>統計的有意性とP値に関するASA声明
http://biometrics.gr.jp/news/all/ASA.pdf
以下抜粋しました
1. P値はデータと特定の統計モデルが矛盾する程度をしめす指標のひとつ
2. P値は、調べている仮説が正しい確率を測るものではない
3. 科学的な結論は、P値がある値を超えたかどうかにのみ基づくべきではない
4. 適正な推測のためには、すべてを報告する透明性が必要
5. P値は、効果の大きさや結果の重要性を意味しない
6. P値は、それだけでは仮説に関するエビデンスのよい指標とはならない
・データ数大きい場合は区間推定のほうが意味ある。
教科書P6テーブル(適用要件による使い分け)
1標本t検定・・・空白2標本t検定・・・2群の等分散性
空白の意味は、データ元が同じところなので問題にならない
2群の等分散性に関しては、ぞれを前提として検定が成り立っているので(以下に紹介する(スチューデントの)t検定は
無論、等分散ではない場合に用いる検定(ウェルチのt検定)もあるのですが、そちらを最初から使った方が良いという話もあります。
ノンパラかパラメトリックの話と同様ですが、どちらでやろうとも有意差が出てるぐらい明確なものが理想ではありますが
関連2群の差の検定
1標本t検定
教科書P58P60例題8を見ながら
関連する2群(ペア)・・・一つの群を2回測定している
前後の差を見る
t値(標準化された検定統計量)・・・2群のペアの差の平均を標準誤差で正規化したもの
帰無仮説は前後の差がゼロ
検定統計量と有意水準αのt値を比較する。
2標本t検定
教科書P82〜 P84例題12 P87例題13こちらの場合は、F検定(P86)で等分散を確認してからの手順になる。
一標本との違いは分散が2種あること(一標本はペアの差をとるので一つ)
そのため合成する
t値・・・それぞれの群の平均の差を標準誤差で正規化したもの
到達度確認
1)P11複雑な調査データよりTGが性別による差があるか有意水準5%で検定せよなお2群の分散が等しいとみなせることとする
補足
今日の余談名物焼きそば「急行」閉店 88歳店主、厨房で倒れ死去(朝日新聞)https://headlines.yahoo.co.jp/hl?a=20170604-00000015-asahi-soci ・最期まで現役でいられる社会 ・急行でも止まればいいのに→超特急止まる >Studentのt検定という名の由来教科書にキチンと載っていると勘違いしておりました。別の本でした。この教科書もチラッと載っているのでその時に軽く話をしたような気もしますが(P82) 下記のページご覧ください 統計で疲れたらビールで乾杯?! スチューデントのt検定とギネスビールの関係(みてみて実感! 心理学史 -第17回- 日本心理学会) http://www.psych.or.jp/interest/mm-17.html 到達度確認あれこれやみくもに検定するのではなく、ある仮説があってそれを証明するのだから判定保留とするのが筋。もしくは弱弱しく「差がみられなかった(´・ω・`)」という感じで |
第10回 ノンパラメトリック検定
到達目標10−1パラメトリック検定とノンパラメトリック検定の違いを説明できる
10−2ノンパラメトリック検定を行い判定することが出来る
一標本Wilcoxon検定
ウィルコクソンの符号付順位和検定教科書(P6)・・・分布型,計測尺度,分散の制約なし
教科書(P74)
1:ペアのデータの差dを求める
2:dの絶対値よりそれぞれの差(d)の順位(昇順)を求める
同順位の話・・・教科書P76参照
3:検定統計量Tは+,−別に順位を足したもので小さい方
有意確率については直接計算出来るが(P75)延々と計算していくのは大変
n≦25まではWilcoxon検定表を使ってください(P274)
N数が少ないと(空白の部分)判定保留にしかならない
教科書P78参照のこと
n>25は正規分布に近似と見なしてz値を求める方法で検定
平均値
平均値となっているが期待値(中央値)Σk=n(n+1)/2の1/2
連続補正
順位は順序尺度で離散量このまま扱うと正規分布と合わないのでそれぞれ0側に向かって0.5だけシフト
P76(例題10)参照
Mann-Whitney検定
二標本になるとややこしくなるのはパラメトリック検定と同じP102参照
検定統計量
自群の個々について、それよりも他群で大きい個体数の総和を求めて検定統計量としている
1:ある群(A)の値それぞれがもう一方の群(B)に入ったとしたときに(Aの)その値よりも(Bの群のなかで)値が大きい個数をカウントする。(A群の)全てについて行い和をとる。(順位-1の話)
2:AとBを入れ替えて1:と同様の計算をするか、公式でB群の和を求め小さい方を検定統計量Uとする
同順位の話・・・教科書P103参照
こちらも標本数が多くなると正規分布の話が出てくる
P104例題17・・・t検定(ウェルチのt検定でP=0.032)
(先週二標本t検定を行いましたが、実際には等分散か否かに関係なくウェルチのt検定を行うのが近年の流れです)
但し本授業で二標本t検定を行う場合は、教科書的な都合もありますので・・・(電卓で計算するのもややこしいですし)
到達度確認
1)76例題10についてパラメトリック検定を行い、ノンパラメトリック検定の結果と比較せよ。正規確率紙法
2)P63演習4についてノンパラメトリック検定を行い、パラメトリック検定の結果と比較せよ。
3)P84例題12についてノンパラメトリック検定を行い、パラメトリック検定の結果と比較せよ。
4)1〜3)までの比較から検定手法の選択、結果の解釈、パラ/ノンパラの特性について考察せよ
補足
到達度確認あれこれ1)dbar=8.75 Sd=1.118 t=2.7672)一標本Wilcoxon検定 検定統計量は7.5 nは10で 3)Mann-Whitney検定 検定統計量は6.5 今日の余談落とし物したことありますか?注意しましょう落とした場合再発行しても番号が変わったり、履歴が残るタイプもあります 12桁の運転免許証番号は何を意味するのでしょうか?(みんなの知識 ちょっと便利帳) http://www.benricho.org/drivinglicense/ AIにまつわる二つの話 将棋 14歳・藤井聡太四段、歴代単独2位の25連勝!…4日で5勝の快進撃(スポーツ報知) http://www.hochi.co.jp/topics/20170610-OHT1T50148.html 現役名人がコンピューターに負けた。将棋電王戦が、人間同士と違う部分。(Number Web) http://number.bunshun.jp/articles/-/827817 【第2期電王戦】今回で幕、名人有終の美飾れず 「先人の知恵に感謝」「AIが示した可能性を追求」 http://www.sankei.com/west/news/170520/wst1705200089-n1.html 人間同士の戦いの世界であることがより鮮明になるでしょう。 自動車 東名事故 ガードレール接触後、跳び越えた可能性(毎日新聞) https://mainichi.jp/articles/20170612/k00/00e/040/141000c 日産エクストレイルに自動運転機能 セレナに続き第2弾(朝日新聞) http://www.asahi.com/articles/ASK683SMLK68ULFA00H.html これから先自動運転が普及していくことでしょう。但し今回のバスが自動運転だったとしたら・・・ 試験の持ち込みの話不正行為と疑われないように の話 |
第11回 計数値データの検定
到達目標11−1二項分布と正規分布の関係を説明できる
11−2カイ二乗分布と正規分布の関係を説明できる
計量値と計数値
計量値・・・量を測定計数値・・・頻度を測定(名義尺度)
量的変量は頻度の測定も出来る
二項分布
標本の大きさ=n事象の起こる確率=p
r=np=n回試行を繰り返したときに事象の起こる回数(期待度数)
二項分布→npが5よりも大きい(nが十分に大きい場合 教科書ではnp≧10 and n(1-p)≧10)正規分布に近似(P135)
χ2乗分布
教科書P142χ2乗分布・・・母分散を推定できる確率分布
自由度とともに分散も増加する
正規分布から上側確率を計算
バラツキの話なので下側の確率はバラつきすぎていない確率
→ 正規分布の両側5%(両側2.5%ずつ)はカイ二乗で上側に集約される
χ2乗検定
出現度数Oiと期待度数Eiのズレを検定期待度数は与えられた情報から推測した理論的に求めた度数
独立性はそれぞれの要因を用いて推測
期待度数が低い場合、そのまま使えないが、計算は楽
Fisherの直接確率法はいつでも使えるが計算大変
(コンピュータを使える時代)
故に教科書では2×2表以外出てこない(考え方は一緒)
よくある?間違え
度数なのに比率(100%)に直してから検定とか
到達度確認
1)イチロー選手の現時点(2016年度終了時点)でのレギュラーシーズン安打数はNBP1278安打(3619打数)MLB3030安打(9689打数)ある。打率の95%信頼区間を求めよ。<参考>プロ野球の生涯打率3割は史上24人。イチローが1位じゃない理由は……。(NumberWeb)
http://number.bunshun.jp/articles/-/827826
<参考>イチロー(Wikipedia)
https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%81%E3%83%AD%E3%83%BC
2)イチローが日米通算で14053打数(ピート・ローズの生涯打数(安打数は4256))に達したとき、何本安打数を重ねているか95%信頼区間を求めよ
<参考>ピート・ローズ(Wikipedia)
https://ja.wikipedia.org/wiki/%E3%83%94%E3%83%BC%E3%83%88%E3%83%BB%E3%83%AD%E3%83%BC%E3%82%BA
3)P146例題29の計数値をすべて半分にして検定し例題29の検定結果と比較せよ
4)以下の治療法と生存死亡数の関係から治療法により転帰が異なるか検定せよ
治療法A | 治療法B | ||
---|---|---|---|
生存 | 10 | 8 | 18 |
死亡 | 2 | 10 | 12 |
12 | 18 |
補足
到達度確認あれこれ推測はあくまでも過去の延長線上で夢を奪う一面があることを安打数の推定で思ったのではないでしょうか。
1) 観察比率Po=(1278+3030)/(3619+9689)=0.3237 0.3237−1.96*(0.3237*(1−0.3237)/(3619+9689))^(1/2)<P<0.3237+1.96*(0.3237*(1−0.3237)/(3619+9689))^2 0.3158<P<0.3317 2) 14053−3619−9689=745打数 745*0.3237−1.96*(745*0.3237(1−0.3237))^(1/2)<r<745*0.3237+1.96*(745*0.3237(1−0.3237))^(1/2) 216.1<r<266.2 (注意) P136例題25の場合は(1)(2)ともに100例なので再発率の推定からそのまま再発症例数を出せるが、こちらの場合は打率の推定と安打数の話は打数が違うのでそのままではダメ 3) χ2=3.75 4) 期待度数を求めると a=7.2 b=10.8 c=4.8 d=7.2 Fisherの直接確率計算法で求める 今日の余談父の日をセルフサービスで楽しみましたが、母の日でカーネーション代やプレゼント代を自分で払ったという事例はまだ聞いたことがないです。
奈良医大の良いところの話 どうぞよろしくお願いいたします。 到達度確認は12回目までの予定 13回目の授業の時にそれまでの提出状況を返します。間違いなど異議のある方は14回目もしくは15回目の授業修了後に来てください。 |
第12回 独立多群間の比較
到達目標12−1F分布とカイ二乗分布の関係を説明できる
12−2分散分析と多重検定の違いを説明できる
F分布
カイ二乗分布と同じく分散に関する確率分布それぞれの群のカイ二乗値の比=分散の比・・・F値(FはフィッシャーのF)
F分布とカイ二乗分布の関係
χ^2(ν)=ν×F(ν,∞)
F検定の話
等分散性の検定・・・分散比を求めてF値より判定「2群の分散は異なるとは言えない」・・・帰無仮説を棄却できない(保留)
「2群の分散に差が無いとは言えないとは言えない」という日本語になる
<参考>
話題の「悪魔の証明」を例を挙げて説明してみた (NAVERまとめ)
https://matome.naver.jp/odai/2136251918746186001
多群間の比較
教科書P154群分け・・・順序尺度以上でその関連をみたい→同時比較
群分け・・・名義尺度or関連を見るわけではない→多重比較
同時比較して差があったから多重比較するというのは、何を述べたいかによるが・・・
同時比較
これまでと同じように正規分布に従うか否かの話になる→P172(P111と対比させながら)一元配置分散分析
群間分散と群内分散の比をとるKruskal-Wallis検定
教科書P164P166例題33のデータで極端値の話
多重検定
教科書P217ポイントとしては、それぞれの検定が独立した仮説にもとづいたものと考えて良いか否か。良いのであれば多重検定にならない
一連のものであれば対立仮説を考えたときに有意水準が5%と言いながら5%になっていないのでは?
多重に検定することでどれかあたれば帰無仮説は棄却できるので例えば3群総当たりだと有意水準0.05で多重検定(6通り)すると有意水準が0.265になってしまう。(からよくない)
有意確率補正法
Bonferriniの場合は6通り検定するのであれば、一検定あたりの有意水準だと0.05/6=0.0083となる。全体では1-(1-0.00833)^6=1-0.95103=0.0490Sidak補正の場合は同様に1-(1-0.05)^(1/6)=0.008512 1-(1-0.008512)^6=1-0.95=0.0500
多群になるほど検定あたりの有意水準が下がる→差が出にくい
多重比較法
パラメトリック法Tukey法・・・各ペアに対する平均値の差の検定
Dunnett検定・・・一つの対象群との対比
ノンパラメトリック法
Dunn法
到達度確認
1)P163演習14で60dB〜80dBのデータを一元配置分散分析をした場合どのような結果になるか求めよ2)P158例題31についてKruskall-Wallis検定を用いて判定せよ
3)P171演習16について一元配置分散分析を用いて判定せよ
4)曜日別に検査の管理用資料を測定した。それぞれ総当たりで二標本t検定を行た。有意確率を補正し有意水準5%で判定し有意な組み合わせをすべて記せ
補足
教科書P157 誤 F=(sA2/dfA)/(sE2/dfE) 正 F=(SA/dfA)/(SE/dfE) と書いたのですが、これ、Sとsがこんがらがってややこしい直し方です。下のように再訂正 正 F=sA2/sE2 ちなみに Fそれぞれの群のカイ二乗値の比をとったもの =(χ12/df1)/(χ22/df2) =(s12/σ12)/(s22/σ22) 母集団が等しいとすると =s12/s22 =分散の比 到達度確認あれこれ1)総平均27.88SA=10*(22−27.88)2+7*(27−27.88)2+8*(36−27.88)2 =878.64 SE=1032−(81+49+9+1+4+9+36+49)=794 群間不偏分散=878.64/2=439.32 郡内変動=794/22=36.09 F値=12.17 多重比較法の時は特に「差が無いではなく判定を保留・・・帰無仮説がなかなか棄却できなくなるから」 多重検定は帰無仮説の立て方の問題 電卓の件(その2)以前試験持ち込みでプログラマブル電卓はダメなどの話をしていましたが、「土地家屋調査士試験」を参考に持ち込みの可否を決めますので基準をよく読んで準備しておいてください。 平成29年度土地家屋調査士試験の筆記試験における電卓の使用について(法務省) http://www.moj.go.jp/content/001227288.pdf 参考資料 分析法の妥当性確認に関するガイダンス(農研機構)より http://www.naro.affrc.go.jp/org/nfri/yakudachi/datosei/pdf/F_and_Chisquare.pdf F分布とは何か?(ようこそ、化学標準物質の不確かさへのいざない (産業技術総合研究所)) https://staff.aist.go.jp/t.ihara/f.html F分布について|Excel(エクセル)で学ぶデータ分析ブログ(ナレッジデータサービス) http://kdsv.jp/news/archives/778 |
第13回 生存時間分析
到達目標13−1カプランマイヤー法による生存率を計算することが出来る
13−2ログランク検定による生存率の差の検定を行うことが出来る
生存時間分析は治療法等の評価に時間軸を含めたもの
イベント発生までの時間による分析
生存率
生存率には計算方式が複数電算機の普及によりKaplan-Meier法でも容易に計算出来る時代
そもそも率は比の特殊な形態で単位時間あたりのイベント数を表わす
(第6回の授業で比率割合取り上げました)
Kaplan-Meierで求める非イベント発生(生存)率=1-イベント発生(死亡)率は、率では無く時点イベント(死亡)割合なので注意
<参考>
患者の生存率(地域がん登録全国協議会)
http://www.jacr.info/about/survival.html
直接法は割合。中途打ち切りがあると困る
生命保険数理法も割合。中途打ち切りについては1/2を観察期間に含めているがイベント発生(死亡)者の観察期間を考慮していないので率では無い(考慮していたら人年あたり(率)になる)
カプランマイヤー法によるイベント発生率の計算
個票データ患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 | 患者ID | 診断名 | 再発時期 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | b | 3 | 11 | a | 8 | 21 | b | 9 | 31 | b | 24+ | 41 | a | 3+ |
2 | b | 5 | 12 | b | 14 | 22 | b | 18 | 32 | a | 12 | 42 | b | 8 |
3 | b | 6 | 13 | b | 9 | 23 | a | 12+ | 33 | a | 3+ | 43 | b | 24+ |
4 | b | 14 | 14 | a | 1 | 24 | a | 3 | 34 | b | 13 | 44 | a | 5+ |
5 | a | 7+ | 15 | a | 2 | 25 | b | 17+ | 35 | b | 17 | 45 | b | 14 |
6 | a | 14 | 16 | a | 3 | 26 | a | 7 | 36 | a | 3 | |||
7 | a | 17 | 17 | a | 13 | 27 | a | 8 | 37 | b | 15 | |||
8 | b | 21 | 18 | b | 21 | 28 | a | 12 | 38 | b | 13 | |||
9 | b | 21 | 19 | b | 16 | 29 | b | 12+ | 39 | a | 21 | |||
10 | b | 16 | 20 | b | 24+ | 30 | a | 1 | 40 | b | 18 |
実測正常率の計算
疾患a診断からの月数 | 月開始時の正常数 | 発症数 | 中途打ち切り数 | 発症割合 | 正常割合 | 累積正常率 |
---|---|---|---|---|---|---|
1 | 20 | 2 | 0 | 0.100 | 0.900 | 0.900 |
2 | 18 | 1 | 0 | 0.056 | 0.944 | 0.850 |
3 | 17 | 3 | 2 | 0.176 | 0.824 | 0.700 |
5 | 12 | 0 | 1 | 0.700 | ||
7 | 11 | 1 | 1 | 0.091 | 0.909 | 0.636 |
8 | 9 | 2 | 0 | 0.222 | 0.778 | 0.495 |
12 | 7 | 2 | 1 | 0.286 | 0.714 | 0.354 |
13 | 4 | 1 | 0 | 0.250 | 0.750 | 0.265 |
14 | 3 | 1 | 0 | 0.333 | 0.667 | 0.177 |
17 | 2 | 1 | 0 | 0.500 | 0.500 | 0.088 |
21 | 1 | 1 | 0 | 1.000 | 0.000 | 0.000 |
診断からの月数 | 月開始時の正常数 | 発症数 | 中途打ち切り数 | 発症割合 | 正常割合 | 累積正常率 |
---|---|---|---|---|---|---|
3 | 25 | 1 | 0 | 0.040 | 0.960 | 0.960 |
5 | 24 | 1 | 0 | 0.042 | 0.958 | 0.920 |
6 | 23 | 1 | 0 | 0.043 | 0.957 | 0.880 |
8 | 22 | 1 | 0 | 0.045 | 0.955 | 0.840 |
9 | 21 | 2 | 0 | 0.095 | 0.905 | 0.760 |
12 | 19 | 0 | 1 | 0.760 | ||
13 | 18 | 2 | 0 | 0.111 | 0.889 | 0.676 |
14 | 16 | 3 | 0 | 0.188 | 0.813 | 0.549 |
15 | 13 | 1 | 0 | 0.077 | 0.923 | 0.507 |
16 | 12 | 2 | 0 | 0.167 | 0.833 | 0.422 |
17 | 10 | 1 | 1 | 0.100 | 0.900 | 0.380 |
18 | 8 | 2 | 0 | 0.250 | 0.750 | 0.285 |
21 | 6 | 3 | 0 | 0.500 | 0.500 | 0.143 |
24 | 3 | 0 | 3 | 0.143 |
疾患a:青線
疾患b:赤線
ログランク検定
カイ二乗分布による検定を行う(期待度数と比較してバラツキがあるか否か)
イベント発生毎のクロス表(カッコ内は期待度数)
1ヶ月発症数 | 健常数 | 合計 | |
症例a | 2(0.889) | 18(19.111) | 20 |
症例b | 0(1.111) | 25(24.889) | 25 |
合計 | 2 | 43 | 45 |
発症数 | 健常数 | 合計 | |
症例a | 1(0.419) | 17(16.581) | 18 |
症例b | 0(0.581) | 25(24.419) | 25 |
合計 | 1 | 42 | 43 |
実測罹患率及び期待度数
診断からの月数 | a観察度数 | a打ち切り数 | a総人数 | a期待度数 | b観察度数 | b打ち切り数 | b総人数 | b期待度数 |
---|---|---|---|---|---|---|---|---|
1 | 2 | 0 | 20 | 0.889 | 0 | 0 | 25 | 1.111 |
2 | 1 | 0 | 18 | 0.419 | 0 | 0 | 25 | 0.581 |
3 | 3 | 2 | 17 | 1.619 | 1 | 0 | 25 | 2.381 |
5 | 0 | 1 | 12 | 0.333 | 1 | 0 | 24 | 0.667 |
6 | 0 | 0 | 11 | 0.324 | 1 | 0 | 23 | 0.676 |
7 | 1 | 1 | 11 | 0.333 | 0 | 0 | 22 | 0.667 |
8 | 2 | 0 | 9 | 0.871 | 1 | 0 | 22 | 2.129 |
9 | 0 | 0 | 7 | 0.500 | 2 | 0 | 21 | 1.500 |
12 | 2 | 1 | 7 | 0.538 | 0 | 1 | 19 | 1.462 |
13 | 1 | 0 | 4 | 0.545 | 2 | 0 | 18 | 2.455 |
14 | 1 | 0 | 3 | 0.632 | 3 | 0 | 16 | 3.368 |
15 | 0 | 0 | 2 | 0.133 | 1 | 0 | 13 | 0.867 |
16 | 0 | 0 | 2 | 0.286 | 2 | 0 | 12 | 1.714 |
17 | 1 | 0 | 2 | 0.333 | 1 | 1 | 10 | 1.667 |
18 | 0 | 0 | 1 | 0.222 | 2 | 0 | 8 | 1.778 |
21 | 1 | 0 | 1 | 0.571 | 3 | 0 | 6 | 3.429 |
今回は二つの群の比較・・・自由度k=n-1=1
O1=a観察度数の総和=15
E1=a期待度数の総和=8.549
O2=b観察度数の総和=20
E2=b期待度数の総和=26.451
検定統計量χ^2=6.441
χ^2(1,0.95)=3.8415
故に帰無仮説を棄却し対立仮説を採択する(a,bの再発率に差がある)
補足
第14回 多変量解析
到達目標14−1相関係数と偏相関係数の違いを理解する
14−2重回帰分析においてどのように変数が選ばれているか説明できる
多変量解析について
教科書P5多くの変量を用いて探索的に 分類・予測・・・(重回帰分析)
要約・・・外的基準がない(主成分分析)
「関係ありそうなデータを集めたけどどうしたらまとまるのやら」という悩みを解決してくれる夢を見やすい
重回帰分析
教科書P223(回帰直線の話を思い出す→単回帰分析)
回帰・・・元に戻る・・・何らか(定理や関係)に基づき戻っていく
単回帰分析
教科書P195回帰係数・・・Y=a+bXのb
<復習>rは共分散
単相関係数の検定・・・(有意に相関があるか否か)教科書P181例題35
同様に 回帰係数の検定
Ti=b/SE
自由度=n-2のt分布
同様に検定できる
SE=SQRT((Syy−S2XY/SXX)/((n−2)SXX))
=SQRT((29.5−21^2/28)/((8−2)×28)) =0.286 Ti=0.75/0.286=2.62
相関係数と回帰係数
回帰直線の場合は従属変数と独立変数の関係をa項とb項(回帰係数)に分離させて考える相関係数は分離させずにそれぞれのバラツキを基に求めている
XとYを入れ替えると回帰係数は変わる。相関係数は変わらない(X,Yのどちらを説明するかで誤差がどちらにあるのか異なる)
偏相関係数と偏回帰係数
相関行列 単相関と偏相関
実態としては相関関係で構わないが、それぞれの変量の関係性を明らかにするには偏相関多くの変量に対する相関→相関行列
P184演習17に(豪快に)年齢を入れて分析すると・・・(ID1〜5を9歳 6〜10を10歳 11〜15を11歳)
肺活量の話なのに・・・
5.2 偏相関とは(アイスクリーム屋さんで学ぶ楽しい統計学──相関から因子分析まで──)
http://kogolab.chillout.jp/elearn/icecream/chap5/sec2.html
重回帰分析の概要
Y=b0+b1x1+b2x2+(中略)+bnxn補正 R2・・・自由度修正済み決定係数・・・1に近いほど良好なモデル。
t値・・・係数が0か否かの検定
多重共線性
通称:マルチコ説明変数の間に相関があるとおかしくなる(上の話もそれ)
相関のある変数を一つにまとめるなど・・・
<研究例>
佐野 洋史 石橋 洋次郎,医師の就業場所の選択要因に関する研究,季刊社会保障研究 45(2), 170-182, 2009
http://www.ipss.go.jp/syoushika/bunken/data/pdf/19114708.pdf
http://www.ipss.go.jp/syoushika/bunken/sakuin/kikan/4502.htm
コンジョイント分析をしている。最適な組み合わせを求める(ここでは医師がどのような就業場所を好むか)
<参考>
石村貞夫 盧志和 石村 友二郎,コンジョイント分析についての考察,鶴見大学紀要. 第4部, 人文・社会・自然科学編 Vol.47 page.21-23,2010
http://library.tsurumi-u.ac.jp/metadb/up/admin/pt4_04_ishimura.pdf
補足
試験の話(配点)昨年度の配点は大体ですが以下のような感じでした00 第1回 オリエンテーション 15 第2回 尺度・度数分布 06 第3回 代表値・散布度 01 第4回 平均値の推定 15 第5回 相関係数・回帰直線 16 第6回 感度・特異度・ROC曲線 04 第7回 相対危険度 00 第8回 検定の原理 10 第9回 パラメトリック検定 01 第10回 ノンパラメトリック検定 10 第11回 計数値データの検定 01 第12回 独立多群間の比較 21 第13回 生存時間分析 00 第14回 多変量解析 講義聞いていると今年度の出題領域もわかるのでは?(変わる部分変わらない部分) |
第15回 まとめ
到達目標15−1授業で出た問題を全て解ける
15−2履修後も統計を自己学修する意欲を持つ
試験の際の注意事項でカレーの作り方の話をしましたが、その中で話にでたtweetは以下です。
昔から工学系や医療系では,試験答案にカレーの作り方みたいな無関係なことを書くと不合格になることがある.「質問の答えがわかんなかったので,関係ないけど知ってる操作をやっときました☆」を認めることは,工場が爆発したり,患者が死亡したりっていう事故リスクを高める第一歩になるから. https://t.co/ljXGJJF9dX
— 野島 高彦【化学】 (@TakahikoNojima) 2017年7月16日