大阪赤十字看護専門学校 情報科学2016
1.情報とは
この回の授業概要の資料は全て二次データで作成引用元
1)「よりよい医療に貢献する医療情報技師の役割」講演会(主催 大阪情報専門学校)
2)「地域と医療の統合に資する 情報活用の考え方−不足の観点からみる医療2.10−」瀬戸内医療情報ネットワーク(せとねっと)第14回勉強会・第2回医療情報に興味のある事務系スタッフ様向け勉強会 記念講演
総称して情報と呼ばれることが多い。 人間は忘れる生き物だから、きちんとした知識にしておくことが必要
情報取得から行動まで
知識構造は様々
構造体であれば欠損した部分を補完できる
感情で行動することも素敵なことではある、想いが人それぞれなわけで
医療における情報
医療の目指すところと医学が目指すところの違いについて考えさせられるが「医療」情報ですので、研究(治験)では医療の目的から逸脱しないように進めている
地域における情報の活用による保健医療
病院の枠を超えた地域単位での保健医療の実現には、生活の場を成立さすための情報活用が鍵となる
-----
2.情報量
情報量の定義
yes/Noを区別(選択肢2つから1に)させる情報・・・1bit選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。
対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる
選択肢の逆数は偏りがない場合、その選択肢を選ぶ確率になる(選択肢4つならば、ある一つの選択肢を選ぶ確率は25%)
4つの選択肢から2つの選択肢にさせる情報=1bit(ある一つの選択肢を選ぶ確率は25%→50%)
余談
確率は事前情報によって変化する→ベイズ理論モンティホール問題
ネコでもわかるモンティホールジレンマ(DOFI-BLOG どふぃぶろぐ)
文字の情報量
英数字・・・7bit+カナ・・・8bit=(1byte)半角文字
漢字は倍の2yte(全角文字)
情報量は文字数×1文字あたりの情報量
(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)
色の情報量
光の3原色・・RGBそれぞれ256階調で表わすと、一色あたり8bit
8×3色で24bit
情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
-----
補助単位
補助単位はキリのいい数字・・・切りの良い数字とは?十進数の世界と二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000
切りの良い数字が異なる確認→基数変換の方法
10進数→n進数の場合・・・ひたすらnで割れるまで割り数字を並べるとあら不思議n進数→10進数の場合・・・位に重み付け(n^桁数)して全て足す
あらためまして補助単位
K→M→G十進数の場合は1000
二進数の場合は2^10=1024≒1000
キロ・・・kとKの話
音の情報量
空気の振動(粗密波)Hz
人間の可聴域は20Hz〜20kHz
(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)
サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz
情報量は音信号の情報量(16bit×2チャンネル=4bit)×1秒あたりのサンプリング数×曲の長さ(秒数)
-----
情報の伝送
情報の速さ
自動車のスピード km/h(単位時間あたりの距離)情報の場合はモノじゃなくメディアに依存するので距離では示せない
(余談)声で情報 約340m/sec → 超音波検査では音の反射の時間を距離に変換して可視化
(余談)光 約3×10^8m/sec
単位・・・bps(bit per second)1秒あたりのビット数
(余談)私が初めてネット回線を体験したのは300bpsの時代
暗号化通信
技術的な話
インターネットの世界は公共の場 → トンネル → 暗号化通信 例:SSL通信(https)平文→暗号文 暗号化
暗号文→平文 復号化
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/structure/02.html
暗号法
転置式暗号・・・文字の並べ替え・・・アナグラム(クイズ番組)換字式暗号・・・ポリュビオスの暗号表・・・ポケベル
エラー訂正
チェックデジット・・・その情報が正しいものか検出するための付加情報デジタルデータも誤ってしまう要因は色々ある
バーコードなどで用いられる。あとは学籍番号など人のエラーにも対応出来る
本についている番号(ISBN)
ISBN・数字の秘密(TRCデータ部ログ) http://datablog.trc.co.jp/2007/01/30133853.html
-----
統計(T)尺度・度数分布
統計とは
私の考える統計学
『気づかせてくれるもの。うすうす気づいていることを確認するもの』統計の分類
記述統計と推測統計に分類される記述統計とは
・収集したデータを要約してその集団の状況を表す・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度など
推測統計とは
事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。推定とは
・収集したデータを基にしてその集団の状況を表す・そこにあるデータは一部(標本)
・点推定・区間推定
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1名義尺度
2順序尺度
3間隔尺度
4比例尺度
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
累積度数・・・上位の変量の度数もあわせた度数
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積相対度数・・・累積度数の相対版
度数分布図
度数分布表をグラフ化したもの縦棒グラフだが量的変量に限っては「ヒストグラム」その棒の部分の面積が度数を示している
-----
代表値
その集団がどんなものか一つの数字で表す平均値
average関数全部足して構成数で割るのでよさげだが
中央値
median関数上から数えても下から数えても丁度中央に来るところの個体の値
最頻値
mode関数階級幅、階級値を決めておかないと個数が・・・
散布度
その集団のバラツキ具合を一つの数字で表す範囲
最大値max関数と最小値min関数の差四分位範囲
PERCENTILEでもよいしquartile関数でも良いし。75%-25%標準偏差(分散)
偏差の平均が出せないから分散を求めて標準偏差を算出偏差値の計算