大阪保健医療大学 医療情報学2017
(保健医療学部リハビリテーション学科 理学療法学専攻)
90分??15の講義を初めてやる年には「一コマの準備に6時間かかる」でも足りないかも。でも2年目からは講義の改善と一年間で情勢が変わった分の更新で良いので、3時間くらいで済まないか?
— 齊藤明紀 (@a_saitoh) 2017年10月2日
授業内容に関する質問について
次回の授業の冒頭に説明ただし説明しない場合あり(授業範囲を超える場合)・・・その旨言います
質問受付は15回目の授業開始前まで(最終回以降説明・コメントの紹介できないため))
質問の手段はお任せします
自己紹介
http://researchmap.jp/medbb/医療情報の世界 医療情報技師の役割について
http://www.medbb.net/education/joho20150613/index.html
授業メニュー
第1回 情報学(T)−情報とは
第2回 情報学(U)−情報量の計算について
第3回 情報学(V)−ネットワーク技術について
第4回 情報学(W)−情報セキュリティ
第5回 保健医療情報システム(T)−医用画像について
第6回 保健医療情報システム(U)−電子カルテについて
第7回 保健医療情報システム(V)−施設内の情報システムについて
第8回 保健医療情報システム(W)−施設間の情報システムについて
第9回 統計基礎(T)−尺度・度数分布について
第10回 統計基礎(U)−代表値について
第11回 統計基礎(V)−散布度について
第12回 医療統計(T)−病院の統計資料
第13回 医療統計(U)−比と率と割合
第14回 医療統計(V)−相対危険度
第1回 情報学(T)−情報とは
到達目標1−1これからの医療の情報化について考えることができる
1−2データ 情報 知識の違いを説明することが出来る
情報化された医療とは
情報化・・・情報の流通および事柄の記録が増えていくこと逆に情報化されていない医療って何?
不都合な未来〜2025年の医療〜(第29回日本医学会総会2015関西 学術テーマ展示「ITがもたらす情報化社会の新たな医療環境」)
https://www.youtube.com/watch?v=fq8-FQ_T8c4
ホームドクター2006−近未来の地域医療−(第23回日本医学会総会1991京都)
https://www.youtube.com/watch?v=5Fy17NuNG_k
私の思うところ 1991年に思い描く医療と2015年に思い描く医療の差分 医師(専門職)同士のネットワーク → 患者(住民)自身も医師(専門職)にアクセスできるネットワーク 1991年といえばインターネットなんて・・・ そのころ私はPC-VAN(300bps)触らしてもらう(昔は住民個人がネットワークに接続なんて・・・) 現在は何時でも何処からでもアクセスできる ちなみに、現状でも病院に患者さんから相談メールが届いたりします |
データと情報と知識の関係
(よりよい医療に貢献する医療情報技師の役割 より)
データ:
一次データと二次データの違い。
一次・・・ライブ。対象からダイレクト
二次・・・既に記録されたもの。まとめられたもの
情報:
データに意味を付与したもの
ただし受信者の特性に依存
知識:
情報を体系化したもの。
受信者の知性は当然だが、提供されているデータや情報としての理解の度合いや誤解によって知識構造体に違いが出てくる。
まとめるポイント
1)情報技術の進展がもたらした社会生活の変化は2)データと情報の違いとは
3)なぜ知識をそのまま他者に与えられないのか
4)医療分野において情報化は何をもたらしたか
授業後補足
第2回 情報学(U)−情報量の計算について
到達目標2−1情報量bitと確率の関係について説明することが出来る
2−2情報量の計算が出来る
2−3助単位について説明できる
2−4画像や音や文字などどのようにして情報化(デジタル情報化)されているか説明することが出来る
情報の量
bit:シャノンの情報理論AなのかAじゃないのか?明確に指定できる情報・・・1bit
事象の起こる確率によって決まる。確率の低い事象を確定する情報ほど大きくなる
I=-log2P 事象の起こる確率によって情報の量が決まる
それぞれの事象の起こる確率が等しいならば選択肢の数(T)に書き換えると I=log2T → 何が起こるのか想定しないと情報は取り扱えない・・・想定外の事象の情報量は計算できない(無限大)
デジタルの世界では1と0の情報の組み合わせであらゆるデータを取り扱っている
情報量が大きいほどより細かい事柄を表現できる
(情報通信技術の活用による効果的な学修環境の構築について より)
色深度(bpp)
1bit ■ ■ ■ ■ ■ ■ ■ ■
2bit ■ ■ ■ ■ ■ ■ ■ ■
3bit ■ ■ ■ ■ ■ ■ ■ ■
情報量の定義
yes/Noを区別(選択肢2つから1に)させる情報・・・1bit選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。
対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる
文字の情報量
英数字・・・7bit+カナ・・・8bit=(1byte)半角文字
漢字は倍の2yte(全角文字)
情報量は文字数×1文字あたりの情報量
(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)
色の情報量
光の3原色・・RGBそれぞれ256階調とすると、一色8bit
3色で8×3で24bit
情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
補助単位
補助単位はキリのいい数字・・・切りの良い数字とは?十進数の世界ち二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000
K→M→G
十進数は1000
二進数は2^10=1024≒1000
キロ・・・kとK
音の情報量
空気の振動(粗密波)Hz
人間の可聴域は20Hz〜20kHz
(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)
サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz
情報量は音信号の情報量(16bit×2チャンネル=4byte)×1秒あたりのサンプリング数×曲の長さ(秒数)
(参考)なぜ650MBのCD-Rに74分の音楽が記録できるのでしょうか?
http://okwave.jp/qa/q2070273.html
まとめるポイント(到達度確認)
1)全角文字一文字で半角文字何文字の情報?2)ピクセルサイズ1600×1200 24bitカラーの画像データは全角文字で何文字分?
3)CD3分の曲データは2)で求めた画像データよりも大きいか小さいか?
授業後補足
第3回 情報学(V)−ネットワーク技術について
到達目標3−1ネットワークにはどのようなものがあるか挙げることが出来る
3−2コンピューターネットワークの速度の計算が出来る
デジタル化された情報の送受信→音 映像 写真 文字 どのような情報でもデジタル化すれば取り扱える
デジタル信号とアナログ信号の強さの違い
(アナログ)FMラジオ・・・ノイズが入ってもある程度聞こえる
(デジタル)ワンセグテレビ・・・ある程度まで見えていても急に画面が止まる
アナログ・・・連続している・・・情報そのまま(ノイズにより元の情報から変化)
デジタル・・・離散している・・・復号化しなくてはならない(ノイズにより元情報と違うものに変わってしまう恐れ)
ネットワークとは
繋がり(ノードとエッジの関係)世の中には様々な繋がりがある
人間関係・・・様々な情報が集まる
(余談)私のブログ・・・弱いこともいいことだ(御卒業おめでとうございます)・・・当時の卒業生へのメッセージ
http://medbb.exblog.jp/19464438/
電話(音声通信)ネットワーク・・・無線化(携帯電話)により開発国で整備が進む
高速道路ネットワーク
航空ネットワーク・・・ハブ空港の存在
ヨーロッパを舞う飛行機ルートを可視化(Yahoo)
http://videotopics.yahoo.co.jp/videolist/official/others/p2fa7e9e1ddcf091a4586fb2068d46390
東京駅から日本全国への「到達所要時間マップ」 - Yahoo! JAPANビッグデータレポート
https://www.youtube.com/watch?v=WvT8-LKQUJU&t=174s
テレビ局ネットワーク・・・各系列が広範囲に情報を
(余談)腸捻転
https://ja.wikipedia.org/wiki/%E8%85%B8%E6%8D%BB%E8%BB%A
コンピューターネットワーク・・・様々な情報(文字・音・写真・音楽・映像)を流せる
インターネット・・・ネットワークとネットワークが繋がって形成(蜘蛛の巣状)・・・スケールフリーネットワーク →故障に強いが、攻撃には弱い
インターネット上で様々な(人的)ネットワークが作られている・・・LINE Facebook Twitter Mixi etc.
電話回線にも規格が決められているようにインターネットでも規約がある・・・プロトコル
通信速度
bps(秒あたりの情報量)・・・距離は関係ない1200bps・・・1秒当たり全角(日本語)75文字を伝えることができる
(私が最初に経験した300bpsの時代は1秒当たり20文字・・・一行40文字とすると2秒かかってしまう)
携帯電話にみる通信速度の変遷
アナログの世界(通話)→デジタルの世界(通信)
アナログ携帯(第1世代)の通信速度(通話のみ)
https://www.youtube.com/watch?v=nY67yVDoKik
デジタル携帯(第2世代(PDC))の通信速度(2400bps→9600bps)
https://www.youtube.com/watch?v=gEhgRL9_1YY
デジタル携帯(第2.5世代cdmaOne)の通信速度(64kbps)
https://www.youtube.com/watch?v=djvB1pGaaDc
デジタル携帯(第3世代VGS/FOMA)の通信速度(7.2Mbps/384kbps)
https://www.youtube.com/watch?v=7V1E6QKJIvE
https://www.youtube.com/watch?v=DNxu-EoK6GU
デジタル携帯(第3.5世代FOMA Hispeed)の通信速度(14Mbps/5.7Mbps)
https://www.youtube.com/watch?v=Spju5CGMhmc
デジタル携帯(第3.9?世代4G-LTE)の通信速度(110Mbps/10Mbps)
https://www.youtube.com/watch?v=bjtQkthByNU
https://www.youtube.com/watch?v=ELCgRtg7RoA
まとめるポイント(到達度確認)
1)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は100%とする)2)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は20%とする)
3)通信速度の向上はどのような事をもたらしたか
授業後補足
第4回 情報学(W)−情報セキュリティ
到達目標4−1情報セキュリティの定義(3要素)について説明出来る
4−2暗号化の必要性について説明できる
技術的な話が良く出てくるが、どうしても人が絡むところ(運用)が弱くなる
情報セキュリティ・・・情報の機密性、完全性、可用性の確保
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/intro/security/index.html
キーワード:ウイルス(普通のウイルスとの違い)https://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E3%82%A6%E3%82%A4%E3%83%AB%E3%82%B9、電子掲示板(普通の掲示板との違い)、SNS、脆弱性、認証、セキュリティポリシー
技術的な話
インターネットの世界は公共の場 → トンネル → 暗号化通信 例:SSL通信(https)(データを「わかりやすく」と「わかりにくく」と −医療分野の情報化− より)
平文→暗号文 暗号化
暗号文→平文 復号化
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/structure/02.html
暗号の例
転置式暗号・・・文字の並べ替え
換字式暗号・・・ポリュビオスの暗号表・・・ポケベル
運用上の話
【資料】SNS時代における個人情報保護と情報セキュリティhttp://www.medbb.net/wiki/index.php?sp%2F20140829kosakawh
【資料】特別講義 漏洩と拡散の危機から情報を守る考え方
http://www.medbb.net/education/joho20150724/index.html
その警告メッセージ、信じて大丈夫? ブラウザの“偽警告”にご用心! (IPA)
設定と管理のあり方− IDとパスワード(総務省安心してインターネットを使うために)
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/privacy/01-2.html
この中で、パスワードの定期変更の話が出てくるが、近年では変えない方が妥当という考え方
パスワード「90日ごとに変更」は間違い? ルール提唱者が「後悔」(ITmedia)
http://www.itmedia.co.jp/news/articles/1708/18/news072.html
まとめるポイント(到達度確認)
1)
(データを「わかりやすく」と「わかりにくく」と −医療分野の情報化− より)
2)パスワードを使う上で注意することを3つあげよ
授業後補足
授業では触れませんが家で読んでおいてください 情報セキュリティ読本 教育用プレゼン資料(IPA) https://www.ipa.go.jp/security/publications/dokuhon/ppt.html |
第5回 保健医療情報システム(T)−医用画像について
到達目標5−1DICOM規格について説明できる
5−2画像検査の種類や特徴について説明できる
DICOM
医用画像のデジタル保存・伝送に関する規格 http://medical.nema.org/Dicom/about-DICOM.htmlデファクトスタンダード
http://e-words.jp/w/%E3%83%87%E3%83%95%E3%82%A1%E3%82%AF%E3%83%88%E3%82%B9%E3%82%BF%E3%83%B3%E3%83%80%E3%83%BC%E3%83%89.html放射線を利用した画像について
被曝の話PET検査と放射線について(PET検査ネット)
http://www.pet-net.jp/pet_html/treat/radioactivity.html
外部被曝と内部被曝の違いを整理しておいてください(宇宙から 大地から が外部被ばく。空気中(吸入) 食べ物(摂取))
X線写真
アナログからデジタルへ移行(銀塩写真→デジタルカメラ)反射光を記録するのではなく透過光を記録
物質により透過具合が違う
造影剤は画像の濃淡を増強させるため
画像を取得しながらそのまま治療 → IVR
愛知医科大学IVR 治療を受けることになりました。どのような治療ですか?
CT
コンピューター断層撮影(アナログの)断層撮影もあるが、全く違うロジック
→アナログでは成立しなかった画像
横から見ているのに上から見た状況を推測
(「医療とコンピュータ」これまでとこれからと より)
CT MRI動画 (メディカルトピア草加病院)
https://www.youtube.com/watch?v=jqaJIKOdc6o
CTで撮影する際の注意とMRIの場合の違いなど見ておいてください
くも膜顆粒のCT、MRI画像所見 (画像診断チャンネル)
https://www.youtube.com/watch?v=fQXhrDiVa_A
一緒な部分の撮影でもCTとMRIで異なる
MRI
強力な磁場の中で電磁波(ラジオ波)を利用。放射線を使わない。磁力は感じなくても音のすごさに驚く検査
HOW TO サイエンス (9)からだの中を見る方法 MRI(サイエンスチャンネル)
https://www.youtube.com/watch?v=yeoIE5BmSrc
MRIで硬さを調べる以降は自宅でご覧ください
アクシデント
失敗百選 〜MRIにボンベが引き込まれて男児に衝突〜
http://www.sydrose.com/case100/257/
核医学検査
放射性同位元素を体内に投与代謝を見る
そこから出てくる放射線(γ線 PETは消滅放射線)を外側で検出
ガンマカメラ
γ線を検出して平面像を得る
SPECT
ガンマカメラのCT版
PET
陽電子放出核種を利用
科学医療フロンティア (11)核医学検査(サイエンスチャンネル)
https://www.youtube.com/watch?v=KvYZLS3sTm0
超音波
音波を利用反射するまでの時間を距離に変換
救急腹部エコー検査(日経BP)
https://www.youtube.com/watch?v=IldE_FzvQwI
4Dエコー写真と生まれてきた赤ちゃんの顔は本当に同じなのか? (mizunaTV)
https://www.youtube.com/watch?v=sCg00Mt5Q7A
音の反射時間から立体動画が作成される時代
内視鏡
国内機器メーカーが圧倒的シェア上記の医用画像との違いは、体の中を診るのに体外からアプローチしていたのを、体内に機械を放り込むところ
生検が可能
到達度確認
(データを「わかりやすく」と「わかりにくく」と −医療分野の情報化− より)
授業後補足
授業中紹介した話 リーチサイト 海賊版誘導、9人逮捕 著作権法違反容疑 (毎日新聞2017年10月31日 ) https://mainichi.jp/articles/20171031/k00/00e/040/250000c |
第6回 保健医療情報システム(U)−電子カルテについて
到達目標6−1カルテに記載される情報について説明できる
6−2電子カルテの必要な要件について説明できる
6−3電子カルテの意義と問題点について説明できる
カルテ
法令で「カルテ」なる言葉は出てこない。 「診療録」のことを指す東京都衛生部 都立病院における診療録等記載マニュアル
http://www.byouin.metro.tokyo.jp/hokoku/guideline/documents/sinryoroku.pdf
診療録等の定義と関連法規・記載の原則と留意事項(P1-P6)をよく読んで理解すること
・医師法<資格法>で作成や保存について定められている。
・治療に関すること以外の記載もある
電子カルテ
医療情報システムの安全管理に関するガイドライン第4.2 版(平成25年10月)厚生労働省http://www.mhlw.go.jp/file/05-Shingikai-12601000-Seisakutoukatsukan-Sanjikanshitsu_Shakaihoshoutantou/0000026087.pdf
「7 電子保存の要求事項について」の部分(P81-P96)をよく読むこと
法的に保存義務のある文書等の電子保存の要件
・真正性・見読性
・保存性
電子カルテの意義と問題点
新たな事が出来るようになると同時に、新たな事案も発生する(ゆえに、状況を把握し理解する力が必要)
・データ入力:手書き文字からの開放
・データ活用:情報の共有
・データ保存:データの紛失防止・長期保存
<導入例> 慶應義塾大学病院(富士通)
http://www.fujitsu.com/jp/solutions/business-technology/security/secure/casestudies/2012/hospkeio/
ISOUKAIx 医療情報 @黒田知宏先生 「それって『電子カルテ』ですか?」
https://www.youtube.com/watch?v=0jvcfrEol7g
電子カルテを単体ではなくで繋ぐことで利便性の向上と活用できる環境へ(次回に続く)
まとめるポイント(到達度確認)
1)保険医が診療録に記載しなくてはならない情報をまとめよ2)電子カルテに必要な3用件をまとめよ
授業後補足
第7回 保健医療情報システム(V)−施設内の情報システムについて
到達目標7−1病院内の情報システムにどのようなものがあるか説明できる
7−2オーダーエントリーシステムと電子カルテの情報の違いについて説明できる
7−3病院情報システムに求められる用件を説明できる
院内ネットワークの導入例
慶應義塾大学病院(NEC)
http://jpn.nec.com/case/hosp_keio/index.html
電子カルテの導入は病院全体の話
ISOUKAIx 医療情報 A竹村匡正先生 「失敗するプロジェクト 〜電子カルテ導入物語〜」
https://www.youtube.com/watch?v=pSYM9u6yveY
病院情報システム
HIS(Hospital Information System)狭義のHIS・・・オーダーエントリーシステム
広義のHIS・・・電子カルテも含めた病院全体のシステム
病院情報システムの発展の歴史
医事会計システム(レセコン=レセプトコンピュータ)がスタート(レセプト・・・診療報酬明細書)
医療機関からの請求。電子化が進む
患者の知らない診療明細 レセプト(ロハス・メディカル)
http://lohasmedical.jp/archives/2009/03/post-39.php
医療情報システム(オーダエントリ・電子カルテシステム)導入調査(JAHIS 一般社団法人 保健医療福祉情報システム工業会)
https://www.jahis.jp/action/id=57?contents_type=23
発展の鍵は費用対効果?
医事会計電子化・・・デジタル加算(アナログ減算)
オーダーエントリー・・・コスト漏れが防げる
電子カルテ・・・?
オーダーエントリーシステムと電子カルテの機能の違い
オーダー伝達と結果参照の話電子カルテの定義に関する日本医療情報学会の見解(日本医療情報学会)
http://www.jami.jp/medicalFields/Documents/eKarte.pdf
電子カルテの位置づけと機能のところがポイント
PACS
Picture Archiving and Communication SystemDICOM規格の話
(画像の発生と転送時間の計算が出来るように)
病院情報システムに求められる用件
・処理の確実性システムが肥大化しており影響も広範囲に
・システムの頑健性
いまさら代替手段がない
・データの冗長化
無駄なように見えて無駄じゃない
・データの継続性
csv(Comma-Separated Values)に出来ればなんとかなる
・データの機密性
公的な性質を持つ情報システムほど機微な情報が集まる
・分かりやすい操作性
特別な教育がなくとも使える
・早いレスポンス
クライアント側で処理させるか、サーバーサイドで処理させるか、プリフェッチ(事前に読み込み)
・低コスト性
全体のコストで見ないと
システム運用のメリットデメリット
システム運用のメリット
情報伝達が迅速転帰や再入力が不要
閲覧様式が自在
正確な情報収集
検索・集計が容易
保存スペースが小さく長期保存可
情報へのアクセスが迅速
紛失リスクが少ない
紙運用のメリット
情報収集の柔軟性近くの人への情報伝達の手軽さ
真正性の確保(甘さ?)
運用変更への対応
情報の分散管理
まとめるポイント(到達度確認)
1)オーダーエントリーシステムと電子カルテの相違点をまとめよ授業後補足
今年度は第9回(統計編)より、授業内課題をミニテスト形式で実施します。 時間を有効に活用するために講義そのものも座席指定します。 |
第8回 保健医療情報システム(W)−施設間の情報システムについて
到達目標8−1標準化に関する規格やコードや団体などについて説明できる
8−2遠隔医療の類型にどのようなものがあるか説明できる
8−3情報交換に必要な標準化に関する用語を理解できる
とりあえず映像を サイエンスニュース2010「科学技術政策ニュース」(40)ライフイノベーション 遠隔医療 研究の現場から(サイエンス チャンネル)
https://www.youtube.com/watch?v=JyzGjxjzOvE
情報を共有するために避けられない標準化
5分でわかる「医療情報の標準化」(アイテック株式会社)http://www.itec-ltd.co.jp/wordpress/report/02.pdf
標準化・・・誰にでも理解できるように(故に情報は欠落するわけだが)
HL7 DICOM ICD-10などなど
医療情報システムの標準化についてのパンフレットをPDFにて公開いたします(JAHIS)
https://www.jahis.jp/topics_list10/sections/id=69
規格名などがたくさん出てくるが、何を担っているのか
遠隔医療システムの類型
DtoD(Telemedicine)
医療者対医療者一人の医療者が全ての専門知識を持っているわけでは無い
専門医制度
http://www.japan-senmon-i.jp/
テレラジオロジー(放射線科医による読影)(ビデオ)
テレパソロジー(病理医による病理診断)術中迅速診断
テレカンファレンス(他施設の医療者との症例検討)
DtoP(Telecare)
医療者対患者医師法第20条の解釈
各論的事項 16 「遠隔医療」(日本医師会)
http://www.med.or.jp/doctor/member/kiso/d16.html
PtoP
患者対患者Communication Network Analysis in Maternity Hospital Bulletin Board System
Journal of Medical Systems(31/2)141-148 Shunji Suto, Nobuyuki Ashida, Terumasa Higashi, Hideo Takemura, Koji Kurimoto and Shiro Yorifuji
図説・日本の遠隔医療2013(日本遠隔医療学会)
http://jtta.umin.jp/pdf/telemedicine/telemedicine_in_japan_20131015-2_jp.pdf
配付資料は 遠隔医療とは、遠隔医療の社会的背景、遠隔放射線画像診断(P2-P7,P9-P10)
まとめるポイント(到達度確認)
1)ICDは日本国内においてどのような格好で利用されているか2)DtoDの類型の遠隔医療にはどのようなものがあるのか
3)DtoPにおいて注意すべき点をまとめよ
第9回 統計基礎(T)−尺度・度数分布について
到達目標9−1記述統計と推測統計について説明できる
9−24つの尺度について説明できる
9−3度数分布表が作成できる
統計とは
私の考える統計学
『気づかせてくれるもの。うすうす気づいていることを確認するもの』私の考える医療統計学(2015)
『ある事象のなかで一般化出来るもの(法則性)を見いだすことは、その個別の事例にとどまらず広く利用できる知見をもたらす。そのためには複数の事例を集めて検討する統計処理が必要になる。それゆえ、統計処理は個別の事情を発生頻度により排除する主義に基づく。
私達の周りで起こる様々な事象は自然現象によるものだけではなく人間活動などの人工的な要因の影響を受けるものも多く、そのため法則性を見いだすにはそれぞれの領域の目的に応じた統計処理が必要となる。
医療統計学は、単に生物としてだけではなく活動状況も多様な集団である人に対して、提供する医療が及ぼす影響やその要因に関する法則性を見いだす方法を探求する学問分野である。』
(複雑なため確定的な事象はなく確率的に取り扱う必要がある)
統計の分類
記述統計と推測統計に分類される記述統計とは
・収集したデータを要約してその集団の状況を表す・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度など
推測統計とは
事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。推定とは
・収集したデータを基にしてその集団の状況を表す・そこにあるデータは一部(標本)
・点推定・区間推定
検定とは(この領域の具体的な部分は2年次開講「統計学」にてエクセル使いながら)
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1名義尺度
2順序尺度
3間隔尺度
4比例尺度
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
累積度数・・・上位の変量の度数もあわせた度数
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積相対度数・・・累積度数の相対版
度数分布図
度数分布表をグラフ化したもの縦棒グラフだが量的変量に限っては「ヒストグラム」その棒の部分の面積が度数を示している
(奈良県立医科大学 生物統計学2017 第1回 オリエンテーション より)
到達度確認 2)統計があなたの人生に幸せをもたらす可能性の程度(確率)を示し、あわせてその理由を述べよ の結果
スタージェスの公式
量的変量の度数分布表・図作成の時に階級幅設定の参考になる公式K(階級数)=1+log2(サンプル数)
今回の配付資料のサンプル数は50なので
1+5.64=6.64
7ぐらいが適当
上記を参考にしながら階級幅を決めるとよい(かも程度で)
参考:ヒストグラムは怖い−スタージェスの公式(高校数学の問題を作る −工夫・コツとデータ− )
http://www10.plala.or.jp/mondai/columun/hist.pdf
(経験則に基づいたものだとばかり思っていたのでビックリ)
到達度確認
今年度は今回よりテスト形式とします講義時間+テスト+解説(10分)とします
授業後補足
第10回 統計基礎(U)−代表値について
到達目標10−1代表値にどのようなものがあるか説明・計算することが出来る
10−2度数分布表から平均値などの算出が出来る
代表値と散布度があると(構成数nもですが)その集団がどんなものか想像出来る(マラソン実況)
代表値
average(その集団を数値一つで表す。excelはaverage関数で算術平均を出すが、まぁ代表値の代表ということだからと解釈しています)算術平均
mean(算術平均以外にも相乗平均(積して累乗根をとる)などもあります)1/n・Σxi
正社員男性の平均給与「527万円」 引き上げているのは誰なのか?(BLOGOS-キャリコネニュース2014年10月04日)
http://blogos.com/article/95831/
加重平均
重みづけ平均例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの? 応用例
度数分布表から算術平均を計算
Σ(階級値×度数)/構成数
中央値
median(別名第二四分位数)量的変量を順序尺度で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
スキージャンプの飛型点は中央値的なノリで算術平均している
スキージャンプを知ろう!!ルール解説(ジャンプ雪印メグミルク)
https://www.meg-snow.com/jump/rule/rule.html
最頻値
mode(流行,はやり)違う意味で数の理論(多数決)の世界
量的変量を名義尺度で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記(平均をとると えっオレ優勝!?状態になる)
到達度確認
ミニテストで第11回 統計基礎(V)−散布度について
到達目標11−1散布度にどのようなものがあるか説明・計算することが出来る
散布度・・・dispersion
最大値と最小値を使う
最大値と最小値がわかればその集団のバラツキがわかる最大値maximum excel max関数
最小値minimum excel min関数
範囲
RangeR=最大値−最小値
特徴
外れ値もひらう
算出が用意
四分位数を使う
Quartile小さい順(昇順)に並べて集団を4分割
第1四分位数 First Quartile:Q1 = 25th percentile 25%タイル値
第2四分位数 Second Quartile:Q2 = 50th percentile 50%タイル値 = Median 中央値
第3四分位数 Third Quartile:Q3 = 75th percentile 75%タイル値
四分位数の求め方・・・厳密には数種類ある
授業では以下の方法
四分位数の求め方注意:順序の話とその順位のラベル(数値)をこんがらがってしまわないように例:テストの点 16,5,12,16,13,15,15,18,20,10,20 昇順に並べて順位(カッコ書き)をつける 5(1),10(2),12(3),13(4),15(5),15(6),16(7),16(8),18(9),20(10),20(11) n数(11)を4で割る 第1四分位数・・・1/4の順位・・・11/4×1=2.75個に分割する場所に相当する数値 第2四分位数・・・2/4の順位・・・11/4×2=5.5個に分割する場所に相当する数値 第3四分位数・・・3/4の順位・・・11/4×3=8.25個に分割する場所に相当する数値 2.75個に分割した場所の出し方 +1/4番目の数値=3番目=12 5.5個に分割した場所の出し方 +2/4番目の数値=6番目=15 8.25個に分割した場所の出し方 +3/4番目の数値=9番目=18 |
四分位範囲
IQR(interquartile range)IQR=Q3-Q1
四分位偏差
QD(Quartile Deviation)QD=IQR/2
範囲は個々の値のバラツキをイメージ
偏差はある値からのズレをイメージ
平均値を使う
mean偏差
Deviationもともとは標準となる数値からのズレ(偏り)を意味するものだが統計の世界では集団の平均値からのズレを示す
偏差の平均をとれば集団内の各々のズレっぷりがわかる → 合計は常に0 故に平均も常に0
分散
varianceV excel関数はVAR
偏差の二乗したものの平均
標準偏差
Standard Deviation記号は標本s 母集団σ
s=√V
(故にVはs^2やσ^2で表現する)
到達度確認
ミニテストで第12回 医療統計(T)−病院の統計資料
医療を提供することで発生するデータのとりまとめる到達目標
12−1統計資料にどのようなものがあるか説明・計算・情報収集をすることが出来る
12−2既存の資料から必要なデータを抽出することが出来る
運営上必要なもの
医療費の請求出来高払い
レセプト(診療報酬明細書)http://www.ssk.or.jp/yoshiki/yoshiki_05.html
DPC/PDPS
http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02930_03義務に基づくもの
・医療施設調査(医療施設調査規則)http://www.mhlw.go.jp/toukei/list/79-1.html
静態調査と動態調査に分かれる
・病院報告(統計法に基づく一般統計調査 医療法施行令)
http://www.mhlw.go.jp/toukei/list/80-1.html
・患者調査(統計法に基づく基幹統計)
http://www.mhlw.go.jp/toukei/list/10-20.html
一月分(9月)のデータ
届出上必要なもの
施設基準の届出https://kouseikyoku.mhlw.go.jp/kantoshinetsu/shinsei/shido_kansa/shitei_kijun/tokukei_shinryo.html
経営管理上必要なもの
人件費率 など(ちなみに病院の場合50〜60% うち医師で12〜15%ぐらい)様々な調査データとの比較
例)病院経営管理指標
http://www.mhlw.go.jp/topics/bukyoku/isei/igyou/igyoukeiei/kannri.html
病床規模であったり開設母体別であったり
医療機能を評価する上で必要なもの
平均在院患者数
一泊二日を入院日数2日と数えている平均外来患者数
平均在院患者数の日数と違い診療日で除する平均在院日数
入退院データから算出する方法と、患者票の「入院年月日」と「退院年月日」から直接差引き計算により在院日数を求める方法がある平均病床利用率
100%が良いというわけでもない病床回転率
平均在院日数と関係する死亡率
低い方が望ましいが、単純に比較してはならない新生児死亡率
出生数あたり参考
厚生労働統計に用いる主な比率及び用語の解説http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
奈良県立医科大学 概要
http://www.naramed-u.ac.jp/university/gaiyo/shokai/gaiyo.html
到達度確認
ミニテストで第13回 医療統計(U)−比と率と割合
医療を提供することで発生するデータのとりまとめる到達目標
13−1比と率と割合について説明できる
13−2人年法について説明や計算が出来る
比
ratio異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method
率
rate時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h
無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元
割合(比率)
proportion全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0〜1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%
人年法
一人の人を一年観察したとき1人年人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存
<本来の死亡率算出>
観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5 「1人年対0.5の死亡率」
<年央人口を用いる方法だと>
6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5 「1人年対0.5の死亡率」
<参考>
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/
到達度確認
ミニテストで授業後補足
「相談さぽーと通信 相談者実態調査」成人式に出席しない理由は、男性は「仕事の忙しさ」、女性は「人間関係」がトップ。成人式での飲酒トラブルの遭遇率は7%と低め。 (PR TIMES) https://prtimes.jp/main/html/rd/p/000000153.000006827.html |
第14回 医療統計(V)−相対危険度
どれだけ危険になるのか?効果があるのか?を知る指標Relative Risk
到達目標
14−1相対危険度を示す指標にどのようなものがあるか説明できる
14−2状況に応じて適切な相対危険度を示す指標を選択できる
この授業では相対危険度=Relative Risk は一般的な用語であり、その算出指標の一つに相対危険=リスク比(Risk Ratio)があると整理します
一般的にはここらへんの言葉ゴチャゴチャです。
説明用データ
疾病発症 | 疾病無 | 計 | |
---|---|---|---|
曝露有 | A | B | A+B |
曝露無 | C | D | C+D |
計 | A+C | B+D |
相対危険
Risk Ratio(RR)「リスク比」と言った方がわかりよい(と思うが)
曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら
A〜D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)
曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
リスク比=A/B/C/D=AD/BC
----------
<参考>寄与危険
Attributeable Risk
相対危険は関係性(比で関係性を見る)
寄与危険は影響の大きさ(差でインパクトを見る)
リスク差(Risk Difference)=A/(A+B)−C/(C+D)
----------
オッズ比
Odds Ratio(OR)「リスク比」を出せない場合でも出せる(リスク比はそれぞれの群のリスクがわかっていないと出せない)
危険な事象が起きた場合と起きなかった場合度数の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの
発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
=AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる
前向き(コホート研究)と後ろ向き(症例対照研究)
同じものを眺めるとき向きが違うとスタート地点も変わってしまう因果関係を観察する場合は時間軸が必ず必要・・・時間の世界で前後ろの話
(後ろ向きの場合は既に罹患しているわけで。疾病発症を症例群 疾病無を対照群と読替えて)
前向きの場合:スタート時点では正確な情報を集められるがゴールでは・・・
前向きの場合:結果=発症リスク
後向きの場合:スタート時点では正確な情報を集められるが遡ると記憶が・・・
後向きの場合:結果≠発症リスク
近似誤差と発症頻度の関係を取りまとめた論文
オッズ比と相対危険の関係,横山徹爾 田中平三 ,日本循環器管理研究協議会雑誌33(1),36-39,1998
https://www.jstage.jst.go.jp/article/jjcdp1974/33/1/33_1_36/_article/-char/ja