大阪保健医療大学 統計学2015
(保健医療学部リハビリテーション学科 理学療法学専攻・作業療法学専攻)

シラバス

本講義の基礎統計医療統計と統計学の関連について
大阪保健医療大学では医療情報学は必修科目、統計学は選択科目となっております。全ての学生が統計学を受講しないことを鑑みて、統計および医療統計の基礎的な部分については必修科目の医療情報学で行います。
統計学では実際にPC上でデータの処理を行いながら、その中で覚えていて役立つテクニック的な話も紹介しますが、実際に出てきた数値を元にしてどのような意味を持つのか学んでいく形式になります。

計算結果で出てきたらなにやら客観性がある気分になってくるが、その計算過程での特性を把握しておくこと
そのようなセンスを身につけておいてください。
第一回の授業であれば中央値のくだりで教科書を見て気がつくか

第1回 データ整理(1)−代表値

代表値

average
集団を代表する値
必ずしも標準的な値が代表値とも限らない (例)サッカー日本代表が日本のサッカーをする人々の標準?

平均値

mean
算術平均・・・いわゆる平均
中間項平均・・スキージャンプの採点は審判員5人中最高最低が除かれる
幾何平均・・・積の累乗根で求める(算術平均は和を構成数で除することで求められる)
調和平均・・・調和を鑑みた加重平均

中央値

median
教科書はややこしいことを書いているがシンプルに考えると、出現した値を順番(昇順・降順どちらでも一緒)に並べたときに真ん中にくる値

・教科書の例はヒストグラムの面積を二分割する点と書いてあるが、それならば4.3333が正解
(n=面積=7なので面積3.5のところ) (3,4,4,4,5,6,7)だから度数4のところ(面積3)から2.5取れる地点
2.5/3=0.83333 ヒストグラムで書くと4の部分の下限は3.5だから3.5+0.8333=4.3333
・数式はシンプルに出した中央値に対して上側と下側の度数の差を元に按分したもの。
考え方としては階級の幅をその階級の度数の2倍で標本化しているだけなので、丸められた格好になる
ヒストグラムの面積を二分する値を簡易に出せる近似式として理解するのが良いかと
なぜ授業前の準備時にそんなことを思ったのか定かではないのだが、普通に考えると教科書通りでよい

最頻値

mode
多数決で決める話
離散した値であれば大丈夫な場合もあるが連続量だと区間を決める必要がある
5段階評価の最頻値と100点満点のテストの最頻値
最も度数の多い階級が二つあった場合はどちらも最頻値(二峰性)3つ以上あった場合は多峰性という


教科書に書いてあることを納得できない場合でも、とことん突き止める時間が学生にはあります

第2回 データ整理(2)−散布度

散布度

dispersion
集団のバラツキ具合を表す値
散布度が小さければ精度の高い集団ということになる

範囲

range
最大値と最小値の差
エクセルではmax関数とmin関数

分散

偏差(平均からのズレ)平方和を標本の大きさ(要素数)で割ったもの
エクセルではvarp

不偏分散

偏差(平均からのズレ)平方和を標本の大きさ(要素数)-1(=自由度)で割ったもの
エクセルではvar
なぜ必要なのかについて・・・

標準偏差

SD(Standard deviation)
分散の正の平方根をとったもの
母標準偏差(分散の平方根)と標本標準偏差(=不偏標準偏差=不偏分散の平方根)がある
エクセルではそれぞれSTDEVPA,STDEVA


関数名を暗記するのでは無くそのようなことが出来る関数があるはずと考えれば、ソフトの違いによる関数名の違いは怖くない。要は何をしている関数か見つけるだけなので、何をしたいかきちんと整理すること。自由度のくだりの話は自分たちの知っている世界というのは全てでは無く、もしそう思ったならばその時点で自由じゃ無くなっているという話

第3-5回 データ整理(3)−度数分布表・図

度数分布表

量的変量の場合、度数をとるには数値にある程度の幅を持たせないと集計できない場合が多い(階級値・階級幅)
度数分布表・・・度数、累積度数・相対度数・累積相対度数

度数分布表を図にしたものが度数分布図
量的変量のものを「ヒストグラム」という。棒の面積が度数になる

第3回 図や表にも表現者の意図が入ってくる。伝えるべき事を分かりやすく表現するのであればよいが、意図が入ってしまうとややこしくなる

第4回 人生次のステップへはエレベータでも階段ではなく、スロープのようなもの。度数分布表も着実に作成しましょう

第5回 度数はなるべくエクセルにcountさせる累積度数を上手く活用。連続変数への階級コードの振り方は規則性を持たせられればint関数やround(down)を使えば簡単に 以上未満の話に引っかかって誤コードにならないように

第6回 確率と分布(1)−確率とは

試行をに対して事象がどの程度起こるのかの割合を求めたもの
ちなみに試行の単位が時間であれば率
負の確率は定義されていない
独立な事象と独立ではない事象

課題

くじの話をランダム関数を使ってシュミレーションせよ


第6回 比・率・割合の違い 確率により人を納得させる可能性が高くなる

第7-8回 確率と分布(2)−確率分布とは

組み合わせ
第7回 組み合わせでは、時間軸を取り去った格好で考える。私が答えに興味が無い授業をするのは過程(思考)を重視するのが高等教育と考えているから。答えは表出してきた一つであって絶対的なものでは無い
二項分布
第8回 エクセルでの数式の立て方のポイントは、表を作るときどれだけ法則性を意識してまとめるかでしょうか。セル結合は極力使わないほうが良い
正規分布
第9回 正規分布と二項分布の関係を整理。極限なので確率が裾にいっても確率は0にならない。「絶対に」起こらないことはない世界

第10回 中心極限定理

どのような事象であっても、その試行を平均した分布は正規分布に近づく
本当に正規分布に近似しているか正規分布表と比較したら、まぁまぁでした

第11回 推定と検定(1)−t分布を使った母平均の推定

自由度の話は理解しておくこと。標本の代表値(平均値)は母集団全体のもの という考え方

第12回-14回 推定と検定−t検定

第15回 まとめ