大阪赤十字看護専門学校 情報科学2019
情報とは
引用元
1)「よりよい医療に貢献する医療情報技師の役割」講演会(主催 大阪情報専門学校)
2)「地域と医療の統合に資する 情報活用の考え方−不足の観点からみる医療2.10−」瀬戸内医療情報ネットワーク(せとねっと)第14回勉強会・第2回医療情報に興味のある事務系スタッフ様向け勉強会 記念講演
総称して情報と呼ばれることが多い。 人間は忘れる生き物だから、きちんとした知識にしておくことが必要
情報取得から行動まで
知識構造は様々
構造体であれば欠損した部分を補完できる
感情で行動することも素敵なことではある、想いが人それぞれなわけで
医療における情報
医療の目指すところと医学が目指すところの違いについて考えさせられるが「医療」情報ですので、研究(治験)では医療の目的から逸脱しないように進めている
オンライン診療
2018年4月より保険適用オンライン診療は本当に良いことずくめなのか?(ニュースイッチ日刊工業新聞)
https://newswitch.jp/p/12837
不都合な未来〜2025年の医療〜(第29回日本医学会総会2015関西 学術テーマ展示「ITがもたらす情報化社会の新たな医療環境」)
https://www.youtube.com/watch?v=fq8-FQ_T8c4
地域における情報の活用による保健医療
病院の枠を超えた地域単位での保健医療の実現には、生活の場を成立さすための情報活用が鍵となる
ホームドクター2006−近未来の地域医療−(第23回日本医学会総会1991京都)
https://www.youtube.com/watch?v=5Fy17NuNG_k
-----
統計(T)尺度・度数分布
統計とは
私の考える統計学
『気づかせてくれるもの。うすうす気づいていることを確認するもの』統計の分類
記述統計と推測統計に分類される記述統計とは
・収集したデータを要約してその集団の状況を表す・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度など
推測統計とは
事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。推定とは
・収集したデータを基にしてその集団の状況を表す・そこにあるデータは一部(標本)
・点推定・区間推定
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1名義尺度
2順序尺度
3間隔尺度
4比例尺度
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
累積度数・・・上位の変量の度数もあわせた度数
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積相対度数・・・累積度数の相対版
がん検診の都道府県別プロセス指標(国立がん研究センターがん情報サービス)
https://ganjoho.jp/reg_stat/statistics/stat/process-indicator.html
の肺がん検診のがん発見率のグラフより度数分布表を完成させよ
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.01〜0.02 | 0.015 | ||||
0.02〜0.03 | 0.025 | ||||
0.03〜0.04 | 0.035 | ||||
0.04〜0.05 | 0.045 | ||||
0.05〜0.06 | 0.055 | ||||
0.06〜0.07 | 0.065 | ||||
0.07〜0.08 | 0.075 | ||||
0.08〜0.09 | 0.085 | ||||
計 | ----- | 47 | 1.00 | ----- | ----- |
度数分布図
度数分布表をグラフ化したもの縦棒グラフだが量的変量に限っては「ヒストグラム」その棒の部分の面積が度数を示している
今日の問題
空欄部を埋めよ
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.5〜1.0 | |||||
1.0〜1.5 | 6 | 0.325 | |||
1.5〜2.0 | 0.1 | 17 | |||
2.0〜2.5 | 0.65 | ||||
2.5〜3.0 | 7 | ||||
3.0〜3.5 | 0.125 | ||||
3.5〜4.0 | |||||
計 | ----- | 1.00 | ----- | ----- |
平均と標準偏差
平均・・・代表値の一つ標準偏差・・・散布度の一つ
構成数と上記の二つで集団を表現することが出来る・・・マラソン中継
算術平均
mean(算術平均以外にも相乗平均(積して累乗根をとる)などもあります)1/n・Σxi
加重平均
重みづけをした平均1/n・Σmixi
応用 度数分布表を基にした平均値の計算法
Σ(階級値×度数)/観測数
標準偏差
mean偏差
Deviationもともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0
分散
varianceV excel関数はVAR
偏差を二乗したものの平均
分散の正の平方根・・・標準偏差
Standard Deviation記号は標本標準偏差s 母標準偏差σ
s=√V
(故にVはs^2やσ^2で表現する)
偏差値
平均点を50点 標準偏差分の得点を10点 に換算して 異なる試験であっても指標で比較できるようにしたもの問題
以下の個票データより1:度数分布表を完成させ
2:平均値(算術平均および度数分布表からの二通り)
3:標準偏差を求めよ
4:ID5(88点)の偏差値を求めよ
個票
ID | 点 |
---|---|
1 | 45 |
2 | 58 |
3 | 69 |
4 | 52 |
5 | 88 |
6 | 71 |
7 | 64 |
8 | 41 |
9 | 56 |
10 | 66 |
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
40〜50 | |||||
50〜60 | |||||
60〜70 | |||||
70〜80 | |||||
80〜90 | |||||
計 | ----- | 1.00 | ----- | ----- |
情報量
情報量の定義
yes/Noを区別(選択肢2つから1に)させる情報・・・1bit選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。
対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる
選択肢の逆数は偏りがない場合、その選択肢を選ぶ確率になる(選択肢4つならば、ある一つの選択肢を選ぶ確率は25%)
4つの選択肢から2つの選択肢にさせる情報=1bit(ある一つの選択肢を選ぶ確率は25%→50%)
余談
確率は事前情報によって変化する→ベイズ理論モンティホール問題
ネコでもわかるモンティホールジレンマ(DOFI-BLOG どふぃぶろぐ)
文字の情報量
英数字・・・7bit+カナ・・・8bit=(1byte)半角文字
漢字は倍の2yte(全角文字)
情報量は文字数×1文字あたりの情報量
(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)
色の情報量
光の3原色・・RGBそれぞれ256階調で表わすと、一色あたり8bit
8×3色で24bit
情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
-----
補助単位
補助単位はキリのいい数字・・・切りの良い数字とは?十進数の世界と二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000
切りの良い数字が異なる確認→基数変換の方法
10進数→n進数の場合・・・ひたすらnで割れるまで割り数字を並べるとあら不思議n進数→10進数の場合・・・位に重み付け(n^桁数)して全て足す
あらためまして補助単位
K→M→G十進数の場合は1000
二進数の場合は2^10=1024≒1000
キロ・・・kとKの話
音の情報量
空気の振動(粗密波)Hz
人間の可聴域は20Hz〜20kHz
(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)
サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz
情報量は音信号の情報量(16bit×2チャンネル=4bit)×1秒あたりのサンプリング数×曲の長さ(秒数)
-----
情報の伝送
情報の速さ
自動車のスピード km/h(単位時間あたりの距離)情報の場合はモノじゃなくメディアに依存するので距離では示せない
(余談)声で情報 約340m/sec → 超音波検査では音の反射の時間を距離に変換して可視化
(余談)光 約3×10^8m/sec
単位・・・bps(bit per second)1秒あたりのビット数
(余談)私が初めてネット回線を体験したのは300bpsの時代
練習問題・・・ファイルの送信にかかる時間
暗号化通信
技術的な話
インターネットの世界は公共の場 → トンネル → 暗号化通信 例:SSL通信(https)平文→暗号文 暗号化
暗号文→平文 復号化
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/structure/02.html
暗号法
転置式暗号・・・文字の並べ替え・・・アナグラム(クイズ番組)換字式暗号・・・ポリュビオスの暗号表・・・ポケベル
<参考>これ読めますか?「045105110」懐かしのポケベルのメッセージ27選(マネーフォワード)
https://biz.moneyforward.com/blog/business-hack/pocketbell/
(データを「わかりやすく」と「わかりにくく」と −医療分野の情報化− より)
エラー訂正
チェックデジット・・・その情報が正しいものか検出するための付加情報デジタルデータも誤ってしまう要因は色々ある
バーコードなどで用いられる。あとは学籍番号など人のエラーにも対応出来る
本についている番号(ISBN)
ISBN・数字の秘密(TRCデータ部ログ) http://datablog.trc.co.jp/2007/01/30133853.html