奈良県立医科大学 生物統計学2024
(医学部医学科)

2024年度開講にあたって
https://medbb.net/education/2024init/
困った時,オンラインでのサポートやなにかありましたら以下からご連絡ください
私へ連絡・オンラインオフィスアワー予約

課題の提出状況については,出欠システムのところで表示するようにします.
9/1の1時限目 1回目の授業の課題
9/2の1時限目 2回目の授業の課題

評価は問題無しが○ ちょっと問題ありが△ 未提出が×で入力しています.それぞれ(出席)(遅刻)(欠席)と表記されると思いますがご注意ください
授業への出席は開講期間の部分でご確認ください 開講期間外の9月分はあくまでも上記のように課題の提出状況を示していますので勘違いされない様よろしくお願いします

なお,例年例題について回答が欲しいという声があるのですが,授業中に示したとおりですのであらためて掲載はしておりません.

課題提出フォーム

https://forms.gle/GFakVm7EbcneXmkT8

授業メニュー



第01回 科学と統計

第02回 記述統計(1)尺度,度数,代表値

第03回 記述統計(2)散布度

第04回 推測統計(1)点推定(平均と分散)

第05回 推測統計(2)区間推定(正規分布)

第06回 推測統計(3)平均値の区間推定(正規分布とt分布)

第07回 推測統計(4)母比率の区間推定(二項分布と正規分布)

第08回 【AB合同】中間まとめ(小テスト)

第09回 推測統計(5)パラメトリック検定

第10回 【AB合同】推測統計(6)ノンパラメトリック検定

第11回 相対リスク

第12回 ROC解析

第13回 相関係数,回帰分析

第14回 【AB合同】生存時間分析

第15回 【AB合同】まとめ

第01回 科学と統計

【GE-01-04-01】根拠に基づいた医療(EBM)の 5 つのステップを列挙できる
(教科書1章1,2)

授業の進め方

授業中は課題について廻りに相談せず各自で取り組んでください.不明点は私に質問してください.その内容をみなさんでシェア出来たらと思っています.
この授業は,2グループ制で行いますが,一部合同で行う回(第8回ミニテスト,第10回,第14回,15回)もありますのでご注意ください.
オフィスアワーは特に設けていないので,気になった時にTeamsからご連絡ください.

なぜ統計が必要なのか?

私たちはデータを取得して物事を判断し次の行動につなげている.
nmuhlthstat1_2024-0101.png(303517 byte)

科学

科学が日常生活を豊かにしていることは明らかであるものの,科学者の想いによらない使い方もされたり,世の中全てを科学で説明できない
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm
【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf
実証性
検討することのできる仮説が無いことには始まらない
再現性
同一の実験条件では同一の結果が得られる
客観性
多くの人々に承認される
chatGPTによる実証性に関する質問
「検討することのできる仮説とは」
ChatGPT3.5
検討することのできる仮説は、研究や分析の目的に基づいて多岐にわたります。仮説とは、観測された現象を説明するための仮定や推測であり、実験やデータ分析を通じて検証可能でなければなりません。(以下略)
「検討することが出来ない仮説とは」
ChatGPT3.5(纏めると)
検討することができない仮説にはいくつかの特徴があります。科学的な文脈で、仮説は観察や実験を通じて検証可能でなければなりません。
検討が難しい仮説の特徴
検証不可能,曖昧な定義,超自然的な要素,因果関係の証明が不可能,非現実的な条件

EBM

Evidence-Based Medicine
根拠に基づいた医療
「根拠」・・・科学的根拠と表現されているケースも多い・・・(経験則だけに基づかないようにという意味合いを込めてというところかな)

医療提供における「根拠」以外の要素

意思決定における3要素・・・根拠,価値観,資源
価値観は人によってさまざま
現有(もしくは調達可能な)資源で出来ることしかできない
医療資源
joho20140730-01.png(104237 byte)
不足の観点からみる医療2.0β より)
「根拠に基づく医療」(EBM)を理解しよう(厚生労働省eJIM(イージム「統合医療」情報発信サイト))
https://www.ejim.ncgg.go.jp/public/hint2/c03.html

EBMの5つのステップ

1.問題の定式化
PICO
P(Patient)どのような患者さん(対象)なのか
I(Intervention)どのような介入を適用しようとしているのか
C(Comparison)介入しない場合(もしくは他の介入)と比較して
O(Outcome)どのような結果になるのだろうか
2.問題についての情報収集
掲げた問題に相当するような情報(世の中にある研究論文など)を探す
3.情報の批判的吟味
情報そのものがどの程度信頼出来るのか,効果があるのか.
4.情報の患者への適用
今回の患者さんと情報で得られた患者像を同じと見做し適用して良いか,問題あるのか
5.1~4 のstepの振り返り
研究の場合もPICO/PECO(E(Exposure) 治療などの介入ではなく曝露)で整理し目的を明確化します.
EBMはある患者さんに医療を適用するために情報を検索という流れですが,研究はある仮説を明らかにするために目的を明確化してデータ収集・分析となります.
南郷栄秀,Evidence-based medicine:診療現場でのプロブレムの解決法 日内会誌 106:2545~2551,2017
https://www.jstage.jst.go.jp/article/naika/106/12/106_2545/_article/-char/ja/
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)

EBMの5ステップと意思決定の3要素

EBM1~3ステップが根拠の部分
根拠とする情報に実証性と再現性と客観性があったほうが良いというところは理解できるかと(つまり科学としての基本的な条件を満たしている方が良いだろう)
研究の方法によって,グレードが変わるのはそれらの要素が方法によって異なってくるので
ステップ4においては価値観と資源を含めた形となる
提出課題
1:あなたが思う「らくたん」を漢字で示せ
2:根拠に基づかない医療とはどのようなものかお考えを教えてください(短文で)
締め切りは授業日の22時00分までとします.
提出いただいた内容は例えば以下のような形で可視化した格好で示せたら良いなと思っています
(正直どうなるのやらわかりませんが)
futuremed20190406-02.png(165988 byte)
保健医療分野におけるフューチャー・デザインの可能性 より)

課題の感想等

1)
漢字 度数 コメント
落胆 60 入学したのになぜ落ち込むのだろう.相談乗ります
落単 25 そのようなことにならないことを祈っています
楽単 21 楽しく学修し単位を取得してください
スポーツ実践 1 これを らくたん と読むのか.油断しない様受講して
楽探 1 楽しく探究できるよう私も頑張ります
楽胆 1 楽しんでいただけるのならば何より.でも違うのかもしれないな.相談乗ります
健康 1 体調の問題で無ければ良いのですが.相談乗ります
落単します 1 その宣言を現実にならないようにするのが私の役目です.前向きに取り組みましょう
<参考>楽胆(人間詩人 小説家になろう)
https://ncode.syosetu.com/n2975fr/

2)
nmubiostat2024-0101.png(231577 byte)

第02回 記述統計(1)尺度,度数,代表値

【SO-02-03-01】尺度(間隔、比、順序、名義)について説明できる。
(教科書2章1)
nmubiostat202102-02.png(396280 byte)

統計に用いるデータ

基本どのようなデータでも統計処理は出来る
出来ないのは,どのようなデータであっても一つしか存在しない時

データについて

レコード
症例,個体,被験者単位でまとめられたデータの塊.表の場合一行にその症例のすべてのデータを記していたらそれがレコード
変数(変量)
データの項目名のこと
データ
観測値や測定値のこと(数値)だけでなく性別など文字の場合もある.
コンピュータ処理するとき,文字だと扱いにくい時があるのでその時は数字に置き換える(→コード変換)
例えば都道府県名であれば 北海道→01 青森県→02 奈良県→29
全国地方公共団体コードの上二桁=都道府県番号
<参考>全国地方公共団体コード(総務省)
https://www.soumu.go.jp/denshijiti/code.html
都道府県番号の順序を用いて説明する事柄は存在しない.一方,文字で順列の存在するもの(松 竹 梅)はその法則にしたがった番号を振ることがあるので注意

変量(データ)の分類

変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。
それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)(比率)

1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
nmuhlthstat1_2024-0103.png(363067 byte)

統計量

取りまとめたものを「量で」示したもの.質的変数であっても度数(個数,人数など数えるもの)については「量」として示すことが出来る

度数

どのようなデータでも度数を示すことは可能
度数分布表
この授業では量的変量の度数分布表を作成する場合 A~B は A以上B未満として取り扱う
  それぞれのデータ(変量)の数(出現頻度)をまとめたもの
変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
例題2-1
以下の店名別のみかんの売り上げデータより度数分布表を作成せよ
日付 店名 数量(箱)
9月1日 奈良本店 1400
9月1日 大和郡山店 700
9月1日 大和高田店 450
9月2日 奈良本店 1000
9月2日 大和郡山店 900
9月2日 大和高田店 1100
9月3日 奈良本店 1600
9月3日 大和郡山店 400
9月3日 大和高田店 850

店名 度数 相対度数 累積度数 累積相対度数
 
 
 
 
  1.00
1.00 ----- -----
量的変数の度数分布表
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.
血圧 163.5mmHg 164.2mmHg 162.5mmHg・・・どれも度数を積み上げられない → 区間を設定する
「A~B」は「A以上B未満」と読む格好と思っていたが,分野などによって違うようです
「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように.
階級 階級値 度数 相対度数 累積度数 累積相対度数
130~140 135
140~150 145
150~160 155
160~170 165
170~180 175
----- -----
度数分布図
質的変数・・・縦棒グラフ
nmuhimstat2021-01.png(3771 byte)
量的変数・・・ヒストグラム
nmuhimstat2021-02.png(3656 byte)
棒の間隔が無いのは値が連続している状態であるが故
普通の棒グラフは棒の長さが度数を示すが,ヒストグラムは棒の面積が度数を示す
「階級の幅を等しくすること」と説明している場合があるが,それは幅が変わると高さが変わる故で,実際にはそのような区間設定はよくある
以下の参考資料に区間幅の異なるヒストグラムについても説明なされているのでよろしければごらんください
ヒストグラムーなるほど統計学園(総務省統計局)
https://www.stat.go.jp/naruhodo/4_graph/shokyu/histogram.html

記述統計量(代表値)

代表値と散布度からなる.←駅伝やマラソンの実況中継はこれらを利用しているから状況がわかる
平均(Mean)
算術平均
いわゆる割り勘.xbar=1/n(x1+x2+・・・+xn)
欠点:外れ値があると平均値は分布の中心位置を示さない(←それって代表的な値??)
 → 対処法:外れ値を取り除くか中央値を使うか
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる
加重平均
重みづけ平均
例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの?
度数分布表を用いた平均もこの方法・・・Σ(階級値×階級の度数)/n
中央値
昇順に並べたときに,真ん中の順番のデータ(変数)の値
データの数が偶数だと真ん中のデータは二つになるのでそれらの平均値
最頻値
最も個数が多いデータの値
最頻値は複数存在する場合がある→二峰性
平均値と中央値の考え方の違い
nmuhimstat2021-11.png(10453 byte)
平均値(14.55)
nmuhlthstat202102-01.png(21147 byte)
こちらは分布なんて関係なく中央値(15) データの分布に依存する(パラメトリック)=平均値 と データの分布に依存しない(ノンパラメトリック)=中央値,最頻値の関係がわかるかなと思います
例えば5が0に変わってしまうと平均値は大きく変わりますが,中央値は変わりません
パラメトリック・・・数値に依存する(数値の分布によって値が影響を受ける)というとイメージしやすいのかな?
例題2-2
以下の個票データより
ID 身長(cm)
1 163
2 158
3 166
4 155
5 165
6 168
7 156
8 161
9 150
10 167
11 162
階級 階級値 度数 相対度数 累積度数 累積相対度数
150~155
155~160
160~165
165~170
170~175
----- -----
1)平均値(個票データ),中央値,最頻値を求めよ
2)平均値よりも中央値が大きくなる時のデータ分布の特徴を述べよ
3)平均値よりも最頻値が大きくなる時のデータ分布の特徴を述べよ
4)個票データによる平均値よりも度数分布表による平均値の方が大きくなる時のデータ分布の特徴を述べよ
5)今回の度数分布表では,個票データにより求めた平均値と度数分布表による平均値に最大どの程度の差が生ずるか述べよ
Aクラスは1)の解説まで
共通)度数分布表による平均値は階級値の話もしながら解説で
提出課題
本日の授業を受講したうえで,以下の2つの質問
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする

課題の感想等

氏名の記入など

学籍番号についてアルファベット不要などのお願い(含む半角での学籍番号)をお願いします.
学籍番号欄に氏名を入れている方もいるのですが,間違えないよう.
データの前処理で無用な時間が発生しないようにするためです.ご協力ください

本日の講義内容は何を目的としていたのか?

Ans.データを適切な形で取り扱うため

有効数字の桁数=有効桁数について

込み入った話はブログで説明しようとしておりますが下書き中.以下あっさりと
有効桁数は値が信頼出来る値の桁数を示します.
ポイントは 1)指数表記すると有効桁数が把握しやすくなる
1.33×10=1330 (有効桁数は3桁)Excelでは1.33E+03と表記します
2)間隔尺度(+-)の世界と比例尺度(×÷)では取り扱いの考え方が違うというところでしょうか.
説明用のデータは以下ですが有効数字で示した状態です
A,48.8kg 身長1.63m
B,53.25kg 身長1.721m
足し算引き算
こちらは有効桁数そのものではなく有効数字の位に基づいて求める形になります
(計算した数値の中でそれぞれ有効な桁の一番低い位の中で一番高いものが,その計算における信頼できる最も低い位となります)
ABの二人の体重を合算すると48.8+53.25=102.05kgとなります.
Aの有効な桁の一番低い位は少数1桁,Bは少数2桁ですので,この計算では少数1桁となります.
有効な桁から外れた桁の端数(丸め)処理ですが,計算後に行う方が丸め誤差の発生を抑えることが出来ます
四捨五入で行った場合102.05→102.1kgとなります(有効桁数4桁)
ちなみにBからAの身長を引いた場合は1.721-1.63=0.091となりますが,有効数字は0.09kgとなります(有効桁数1桁 9×10-2
掛け算割り算
こちらは有効桁数そのもので求める形になります
(計算した数値の中でそれぞれ有効数値の一番少ないものが結果の有効桁数になります)
AのBMIは計算すると18.36727013 有効桁数は全て3桁なので端数処理で四捨五入すると18.4
BのBMIは計算すると17.97868285 有効桁数は全て4桁なので端数処理で四捨五入すると17.98
AとBの身長を掛け合わせると2.80523 有効桁数が一番少ないのはAの3桁なので四捨五入すると2.81

感謝のお言葉(お礼する相手は私ではなく,私の講義を受講している学生さん皆さんに)

帰宅が夜10時頃で疲弊してすぐ意識を失ったので、提出期限を翌朝10時にしてもらわなかったら確実に未提出でした。ありがとうございます。

尺度による捉え方

比と順序では変量が異なるのに、どちらの方が有能であるのかを比較することは可能なの?
Ans.用いている単位系が何を示したものかによりますし,どのように解釈するのかによります

度数とは

例題2-1のみかんの売上個数は変数では?
Ans.仰る通りで,一日の売上個数は複数の伝票からなっており,その伝票の中で・・・

出現頻度とは

度数が出現頻度と書いており,出現頻度は「頻度」という言葉があったので,確率のような考え方だと思いました.出現頻度の「頻度」は,どういうことを意味しているのでしょうか?
Ans.頻度って度数としてつかっていますが,確かに頻度が高い となると 確率の事を示しますよね(単位時間当たりの度数が多い/少ない という形で)

累積度数はなんのため

Ans.特に名義尺度の時によく使う印象ですが,自動車の会社別売り上げ台数とか

感想(なるほどと思った)

高校数学のデータの分析を多少深めた内容

Excelについて

今回はExcelのsumなどを使って楽に計算しましたが、試験等でこれを手計算(または電卓)でしないといけないと思うとつらい
Ans.授業中に答えを表示するためにエクセルで計算して表示していますが,皆さんは手計算で行ったほうが良いかなと思っていますが(試験はエクセル禁止なので),授業中エクセルで行うことを妨げておりません.
そこでエクセルの関数などの解説についてのご要望もいくらか頂いておりますが,述べた通り授業の内容と離れてしまうものの,ある程度ニーズ(知りたい)があるように思います.
無論本授業と離れるので,一般的なオンライン講義の形態で参加したい人だけ参加するという恰好が落ち着くかなと思っています
行うとしたらオンラインでどこかの時間でExcel初級講座(他学の受講生も参加できるようにするかも)
ちなみに過去は統計の基礎(ちょうど皆さんが習う部分)というのを同様に行っています.授業外で一般の方も含む可能性があるのでpeatixで管理しています.
以下ご参考までに
統計学2023
https://medbb.net/education/medbbstat2023/index.php

第03回 記述統計(2)散布度

【SO-02-03-02】データの分布(欠損値を含む)について説明できる。
(教科書2章1)
「範囲」とはある点Aからある点Bとの間をさす

範囲

範囲

一般的に範囲と言えば 最大値と最小値の差 のことを指す
例題3-1
例題2-2の個票データより,範囲を求めよ
例題3-2
散布度として範囲を用いることの利点と欠点を考えよ

四分位範囲

順序尺度の性質を用いた散布度
小さい順(昇順)に並べて集団を4等分
分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3)
また第1四分位数は25%タイル値,第2四分位数=中央値=50%タイル値,第3四分位数=75%タイル値とも呼ばれます
大きい方が第3四分位数なのですが,間違える方も一定数いますが100%タイル値=最大値ということを理解していたら大丈夫でしょう
四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の算出方法は数多くあります
高校数学で習われたものは文部科学省が推奨した方式で,高校数学以外では見掛けない方法です.
一番わかりやすい四分位数の出し方はヒンジ値になります
nmubiostat2024-0301.png(438054 byte)
以下のブログを見ていただくと数種類出来てしまうのも頷けるかと思います
ダンゴ包丁理論(tukeyのヒンジ)(Medbb's blog)
https://medbb.hatenablog.com/entry/2020/12/12/091240
考え方としては理解しやすいと思いますがtukeyのヒンジとは少し値が異なるケースもあります

<参考>四分位数の定義(奥村 晴彦 (Haruhiko Okumura))
https://okumuralab.org/~okumura/stat/quartile.html
<参考>■四分位数の定義-教科書の内容に関するQ&A(数研通信(78号)数研出版)
https://www.chart.co.jp/subject/sugaku/suken_tsushin/78/78-10.pdf

箱ひげ図
四分位範囲をグラフ化
nmuhimstat2021-09.png(8898 byte)
例題3-2
散布度として範囲と四分位範囲を比較した時それぞれの利点と欠点について考えよ

偏差

「偏差」とはある点と基準点とのズレをさす
「偏差」とだけ記述されてると基準点は平均値として捉えられるケースが多い

四分位偏差

順序尺度の性質を用いた散布度
QD(quartile deviation)=IQR/2=(Q3-Q1)/2
四分位範囲を2で割ると求められるが,意味的には第3四分位数と第2四分位数の偏差と第2四分位数と第1四分位数の偏差の算術平均
QD=((Q3-Q2)+(Q2-Q1))/2=(Q3-Q1)/2

(平均値との)偏差

集団の平均値と個々の値の偏差を求めその平均をとることでその集団のバラツキ具合を算出
例題3-3
各々の値について,その集団からもとめた平均値との偏差を求めた場合,その偏差の平均は必ず0になる.証明せよ

分散

間隔尺度の性質を用いた散布度
平均値から求めた偏差の平均は常に0になってしまうので意味が無い.
平均値から求めた偏差の平均を求めればよいが,計算が面倒だった模様です.(近年PCを使えば簡単なので と思わないように)
分散は偏差平方の算術平均
nmubiostat2016-0302.png(3064 byte)
利点は,偏差を基にした散布度を算出できること
欠点は,求めた散布度の単位が対象とするものを二乗した格好になっている

標準偏差

間隔尺度の性質を用いた散布度
利点:対象とする集団の平均値と同じ単位になっている.
欠点:あくまでも平方根を用いて求めているので注意する点がある
(分散と標準偏差は線形の関係に無い)
nmubiostat2024-0302.png(144702 byte)
例題3-3
ある集団Aテストの点を平均と分散を求めたところそれぞれ60点と16だった.
集団Bも同様に求めたところ67点と4だった.
集団Aの得点のバラツキ具合は集団Bと比べたらどの程度大きいか示せ.
例題3-4
例題2-2のデータより 散布度(四分位範囲,四分位偏差,分散,標準偏差)を求めよ.
なお四分位数については,文部科学省の示した方法及び,tukeyのヒンジ値両方で求めること

想定していないデータ

大量にデータを取り扱うと様々な理由(入力ミス,測定していない,装置の利用方法を誤る)で想定外のデータが出現する
無論想定が甘いと正しいデータの場合もあり得る
とりまとめると異常値と欠損値についてはデータの取り扱いについて考慮しなくてはならない

外れ値

想定している範囲外のデータを指す
異常値
外れ値の中で人為的なミスや機器の故障など測定や入力が適切にされていないためにおこるもの

欠損値

値が欠損している状態で,測定できなかった場合や回答してもらえなかっただけではなく異常値と同様に人為的なミスや機器の故障など測定や入力が適切にされていないためにおこったものを含む
<参考>データクレンジング(用語集 bodais)
https://bodais.com/info/glossary/id0900000272

例題3-5
測定したデータから記述統計量(度数,代表値,散布度)をそれぞれ用いることで,どのような想定しないデータを検出することが可能か考えよ

本日のポイント.雑談含む

(異常値の話の件で)米騒動
<参考>今年の共通テストの数学は…(網重塾)
https://amishige-jyuku.amebaownd.com/posts/31726305/
(四分位範囲の件で)試験に出すとしたらtukeyが良いか文部科学省が良いか
(最初の入りあたりで)部分点の話,答えそのものより,考え方のところが重要ですよね.だって新たな知見を求めていくわけですから
(例題のあたりで)ダンゴ包丁は四分位数の考え方を理解するためのものということで(簡単に分かりやすく互換性を持たせるのって難しい)
(最後時間が無くなって)例題2-2の解説時間が無くてできませんです
提出課題
本日の授業を受講したうえで,以下の2つの質問
1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする

【工事中】第04回 推測統計(1)点推定(平均と分散)

(教科書2章1)

【工事中】第05回 推測統計(2)区間推定(正規分布)

【SO-02-03-03】正規分布の母平均の信頼区間について説明できる。
(教科書2章1,2,3)

【工事中】第06回 推測統計(3)平均値の区間推定(正規分布とt分布)

(教科書3章2標本平均の理論分布と標準誤差(SE),4章1正規分布とt分布の違い,2)

【工事中】第07回 推測統計(4)母比率の区間推定(二項分布と正規分布)

【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。
【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
(教科書7章1)

【工事中】第08回 中間まとめ

(小テスト)

【工事中】第09回 推測統計(5)パラメトリック検定

(教科書4章1,5章1,教科書8章1,3,10章1Q7)

【工事中】第10回 推測統計(6)ノンパラメトリック検定

(教科書4章3,5章4,8章2)

【工事中】第11回 相対リスク

【GE-01-04-02】PICO(PECO)を用いた問題の定式化かができる。
【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。

【工事中】第12回 ROC解析

(教科書6章1,2,3)

【工事中】第13回 相関係数,回帰分析

【SO-02-03-04】相関分析、平均値と割合の検定等を実施できる。
【SO-02-03-05】多変量解析の意義を理解している。
(教科書9章1,2,3)

【工事中】第14回 生存時間分析

【SO-02-02-02】割合・比・率の違い及び代表的な疫学指標(有病割合、リスク比、罹患率等)を理解している。

【工事中】第15回 まとめ