大阪保健医療大学 医療情報学2023
(保健医療学部リハビリテーション学科 理学療法学専攻)
統計の基礎部分のフォロー講義開講に関する情報
統計の基礎部分のフォロー講義(オンライン)ですがzoomで行います.4つの尺度から記述統計,そして推測統計の入り口まで行います
告知の通り日曜の午前中が都合がつきやすいと思い設定させていただきました.
日程 タイトルは以下の通りです
2023年12月10日(日)10時~12時 統計学(1)尺度と度数
2023年12月17日(日)10時~12時 統計学(2)代表値と散布
2024年 1月 7日(日)10時~12時 統計学(3)母平均と母分散の点推定
2024年 1月14日(日)10時~12時 統計学(4)母平均の区間推定
申し込みされる方は以下のpeatixのページからお願いします
https://medbbstat2023.peatix.com
講義資料のページは以下になります
https://medbb.net/education/medbbstat2023
最初に
自己紹介
http://researchmap.jp/medbb/授業メニュー
第1回 情報学(Ⅰ)-情報とは第2回 情報学(Ⅱ)-情報量(Ⅰ)定義と文字
第3回 情報学(Ⅲ)-情報量(Ⅱ)画像と音
第4回 情報学(Ⅲ)-ネットワーク技術について
第5回 情報学(Ⅳ)-情報セキュリティ
第6回 保健医療情報システム(Ⅰ)-医用画像について
第7回 保健医療情報システム(Ⅱ)-電子カルテについて
第8回 保健医療情報システム(Ⅲ)-施設内外の情報システムについて
第9回 統計基礎(Ⅰ)-尺度・度数分布について
第10回 統計基礎(Ⅱ)-代表値について/散布度について
第11回 統計基礎(Ⅲ)-推測統計(点推定)
第12回 統計基礎(Ⅳ)-推測統計(区間推定)
第13回 医療統計(Ⅰ)-比と率と割合
第14回 医療統計(Ⅱ)-相対危険度
第15回 まとめ
第1回 情報学(Ⅰ)-情報とは
到達目標1-1医療の情報化について考えることが出来る
1-2データ 情報 知識の違いを説明することが出来る
情報化された医療とは
情報化・・・情報の流通および事柄の記録が増えていくこと情報化社会・・・社会の中で情報の流通及び事柄の記録が増えていくこと
とすると
医療において情報の流通及び事柄の記録が増えていくこと
情報とは
戦争に関する本で翻訳する時の森鴎外による造語とされる以下の論文参照
情報という言葉の起源,長山 泰介,ドクメンテーション研究 33(9), 431-435, 1983
http://ci.nii.ac.jp/naid/110002755644
情報という言葉の由来 [味村ノート](GPA Talks)
http://gpatalks.blog.so-net.ne.jp/2011-07-11
情報の特徴・・・モノではない
疑問)モノじゃないのであれば何を以て存在しているとするのか(モノじゃないので)
→記憶されていたら/記録され活用されていたら
<参考>「記憶こそが時間。そしてそれこそが、人を支える」(オーナー 仮面ライダー図鑑)
https://www.kamen-rider-official.com/zukan/character/748
人の死・・・医学的な死/社会的な死 情報化社会により医学的な死を迎えても社会的に生き続けることが可能になったのでは?
<参考>【追悼】24年前、突如広まった“志村けん死亡説”とは何だったのか(文春オンライン)
https://bunshun.jp/articles/-/36979
<参考>「志村は死なないの」志村けん追悼番組での高木ブーに“考えをひっくり返された”(クイックジャパンウェブ)
https://qjweb.jp/column/24786/
疑問)情報が「存在」を失うことについてどのように測定したらよいのだろう
<参考>情報の寿命を表す指標:被引用半減期(情報の科学と技術 70巻(2020)1号)
https://www.jstage.jst.go.jp/article/jkg/70/1/70_30/_article/-char/ja/
半減期・・・例えば放射能の場合,放射能を有する放射性同位元素が減少すること (消費スピードが早いほど放射線を出すがその分減少していく ⇔ 消費スピードが遅いほど減少しないが・・・)
たしかに情報で直接物理的な影響を及ぼすことは出来ないが,心理効果は期待できる(例えばマクロスとか)
情報技術の発展により実空間から情報がサイバー空間に飛び出している.
ICTの話は通信技術の進展と情報技術のマッチングというところ.世界は変わりました.
(COVID-19流行期における保健医療と情報-ICTによるディスタンスコントロール- より)
データ:
一次データと二次データの違い。
一次・・・ライブ。対象からダイレクト
二次・・・既に記録されたもの。まとめられたもの
情報:
データに意味を付与したもの
ただし受信者の特性に依存
知識:
情報を体系化したもの。
受信者の知性は当然だが、提供されているデータや情報としての理解の度合いや誤解によって知識構造体に違いが出てくる。
(よりよい医療に貢献する医療情報技師の役割 より)
情報化
データを情報にしていくことが情報化一つのデータで一つの情報 というわけでもない
(受け売り・・・一つの二次データで一つの情報)
情報を増殖させることが出来る(発信できる)できる人間なのか,情報を入手するだけの人間なのか
→単なる思い付き・・・背景がないと薄っぺら あっという間に消費
→授業を一コマする時点で引き出しを使い果たし呆然としたあの日
求められるのは研究視点では「新たな知見」簡単じゃないけど
教育の場合は,変わらない(であろう)本質と実態の乖離をわかりやすく示す情報に思う.
→新たな知見というより新たな道筋と思うがこれも簡単じゃない
補足
過去に描いた近未来の医療におけるICTの役割
ホームドクター2006-近未来の地域医療-(第23回日本医学会総会1991京都)https://www.youtube.com/watch?v=5Fy17NuNG_k
思い描いた未来がやってくるわけでも無い件
(保健医療分野における情報空間の安全な歩き方2022 より)
第2回 情報学(Ⅱ)-情報量(Ⅰ)定義と文字
到達目標2-1情報量bitと確率の関係について説明することが出来る
2-2同じ文字でも設定(全角,半角)によって情報量が異なることを説明できる
情報の量
bit:シャノンの情報理論AなのかAじゃないのか?明確に指定できる情報・・・1bit
事象の起こる確率によって決まる。確率の低い事象を確定する情報ほど大きくなる
I=-log2P 事象の起こる確率によって情報の量が決まる
それぞれの事象の起こる確率が等しいならば選択肢の数(T)に書き換えると I=log2T → 何が起こるのか想定しないと情報は取り扱えない・・・想定外の事象の情報量は計算できない(無限大)
デジタルの世界では1と0の情報の組み合わせであらゆるデータを取り扱っている
(但しデータの定義が必要)
情報量の定義
yes/Noを区別(選択肢2つから1に)させる情報・・・1bit選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。
対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる
文字の情報量
英数字・・・7bit+カナ・・・8bit=(1byte)半角文字
漢字は倍の2byte(全角文字)
情報量は文字数×1文字あたりの情報量
(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)
第3回 情報学(Ⅲ)-情報量(Ⅱ)画像と音
到達目標3-1情報量の計算が出来る
3-2補助単位について説明できる
3-3画像や音など情報化(デジタル情報化)していくことで,どのような注意点があるか説明できる
色の情報量
光の3原色・・RGBそれぞれ256階調とすると、一色8bit
3色で8×3で24bit
情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
情報量が大きいほどより細かい事柄を表現できる
(情報通信技術の活用による効果的な学修環境の構築について より)
色深度(bpp)
1bit ■ ■ ■ ■ ■ ■ ■ ■
2bit ■ ■ ■ ■ ■ ■ ■ ■
3bit ■ ■ ■ ■ ■ ■ ■ ■
補助単位
補助単位はキリのいい数字・・・切りの良い数字とは?十進数の世界ち二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000
K→M→G
十進数は1000
二進数は2^10=1024≒1000
キロ・・・kとK
音の情報量
空気の振動(粗密波)Hz
人間の可聴域は20Hz~20kHz
サンプリング定理:元の周波数の2倍以上でサンプリングすれば再現できる
<参考>標本化定理(サンプリング定理)とは(制御工学の基礎あれこれ)
http://arduinopid.web.fc2.com/M34.html
(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)
サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz
情報量は音信号の情報量(16bit×2チャンネル=4byte)×1秒あたりのサンプリング数×曲の長さ(秒数)
(参考)なぜ650MBのCD-Rに74分の音楽が記録できるのでしょうか?
http://okwave.jp/qa/q2070273.html
第04回情報学(Ⅲ)-ネットワーク技術について
4-1ネットワークにはどのようなものがあるか挙げることが出来る4-2コンピューターネットワークの速度の計算が出来る
デジタル化された情報の送受信→音 映像 写真 文字 どのような情報でもデジタル化すれば取り扱える
デジタル信号とアナログ信号の強さの違い
(アナログ)FMラジオ・・・ノイズが入ってもある程度聞こえる
(デジタル)ワンセグテレビ・・・ある程度まで見えていても急に画面が止まる
アナログ・・・連続している・・・情報そのまま(ノイズにより元の情報から変化)
デジタル・・・離散している・・・復号化しなくてはならない(ノイズにより元情報と違うものに変わってしまう恐れ)
ネットワークとは
繋がり(ノードとエッジの関係)世の中には様々な繋がりがある
人間関係・・・様々な情報が集まる
(余談)私のブログ・・・弱いこともいいことだ(御卒業おめでとうございます)・・・当時の卒業生へのメッセージ
http://medbb.exblog.jp/19464438/
電話(音声通信)ネットワーク・・・無線化(携帯電話)により開発国で整備が進む
高速道路ネットワーク
航空ネットワーク・・・ハブ空港の存在
ヨーロッパを舞う飛行機ルートを可視化
東京駅から日本全国への「到達所要時間マップ」 - Yahoo! JAPANビッグデータレポート
テレビ局ネットワーク・・・各系列が広範囲に情報を
(余談)腸捻転
https://ja.wikipedia.org/wiki/%E8%85%B8%E6%8D%BB%E8%BB%A
コンピューターネットワーク・・・様々な情報(文字・音・写真・音楽・映像)を流せる
インターネット・・・ネットワークとネットワークが繋がって形成(蜘蛛の巣状)・・・スケールフリーネットワーク →故障に強いが、攻撃には弱い
インターネット上で様々な(人的)ネットワークが作られている・・・LINE Facebook Twitter Mixi etc.
電話回線にも規格が決められているようにインターネットでも規約がある・・・プロトコル
通信速度
bps(秒あたりの情報量)・・・距離は関係ない1200bps・・・1秒当たり全角(日本語)75文字を伝えることができる
(私が最初に経験した300bpsの時代は1秒当たり20文字・・・一行40文字とすると2秒かかってしまう)
携帯電話にみる通信速度の変遷
アナログの世界(通話)→デジタルの世界(通信)
アナログ携帯(第1世代)の通信速度(通話のみ)
https://www.youtube.com/watch?v=EpxmB1e0FKA
デジタル携帯(第2世代(PDC))の通信速度(2400bps→9600bps)
https://www.youtube.com/watch?v=SI8nRqGZt2A
https://www.youtube.com/watch?v=gEhgRL9_1YY
https://youtu.be/InnZUrTA1X8
https://youtu.be/mTtURP7HF0o
デジタル携帯(第2.5世代cdmaOne)の通信速度(64kbps)
https://www.youtube.com/watch?v=djvB1pGaaDc
デジタル携帯(第3世代VGS/FOMA)の通信速度(7.2Mbps/384kbps)
https://www.youtube.com/watch?v=7V1E6QKJIvE
デジタル携帯(第3.9?世代4G-LTE)の通信速度(110Mbps/10Mbps)
https://www.youtube.com/watch?v=VJg3AfXKSkE
デジタル携帯(第5世代5G)の通信速度(10Gbps)
https://www.youtube.com/watch?v=0VzkgnMX9t0
一気に振り返る動画
https://www.youtube.com/watch?v=UcLyd1otlI8
例題
CDの音質(16bit×2チャンネル 44.1kHz)で4分の音楽を作成した.640kbpsで伝送した場合,どの程度の時間を要するのか求めよ
但し伝送効率は100%とする
まとめるポイント
1)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は100%とする)2)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は20%とする)
第5回 情報学(Ⅳ)-情報セキュリティ
到達目標5-1情報セキュリティの定義(3要素)について説明出来る
5-2暗号化の必要性について説明できる
技術的な話が良く出てくるが、どうしても人が絡むところ(運用)が弱くなる
情報セキュリティ・・・情報の機密性、完全性、可用性の確保お金配りアカウントの目的、情弱リストの作成かなと思ってたけど詐欺用の口座確保と受け子調達だったと知ってアハ体験した https://t.co/fxGEKltdky
— はやおき (@hy__ok) September 19, 2022
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/intro/security/index.html
技術的な話
インターネットの世界は公共の場 → トンネル → 暗号化通信 例:SSL通信(https)(データを「わかりやすく」と「わかりにくく」と -医療分野の情報化- より)
平文→暗号文 暗号化
暗号文→平文 復号化
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/structure/02.html
暗号の例
転置式暗号・・・文字の並べ替え
換字式暗号・・・ポリュビオスの暗号表・・・ポケベル
<参考>
ポケットベル(通信用語の基礎知識)
https://www.wdic.org/w/WDIC/%E3%83%9D%E3%82%B1%E3%83%83%E3%83%88%E3%83%99%E3%83%AB
これ読めますか?「045105110」懐かしのポケベルのメッセージ27選(マネーフォワード)
https://biz.moneyforward.com/blog/business-hack/pocketbell/
ポケベルまもなく終了、秋葉原では「お葬式」も(IT media)
https://www.itmedia.co.jp/news/articles/1909/30/news113.html
運用上の話
【資料】SNS時代における個人情報保護と情報セキュリティhttps://medbb.net/education/kosaka20140828
【資料】特別講義 漏洩と拡散の危機から情報を守る考え方
http://www.medbb.net/education/joho20150724/index.html
その警告メッセージ、信じて大丈夫? ブラウザの“偽警告”にご用心! (IPA)
手口検証動画シリーズ ~スマホやパソコンに関する「だましの手口」を実際に検証!~(IPA Channel)
https://www.youtube.com/playlist?list=PLi57U_f9scIJRkSigtIyOIZ7dRQGXkeZw
設定と管理のあり方- IDとパスワード(総務省安心してインターネットを使うために)
http://www.soumu.go.jp/main_sosiki/joho_tsusin/security/basic/privacy/01-2.html
この中で、パスワードの定期変更の話が出てくるが、今は変えない方推奨
パスワード「90日ごとに変更」は間違い? ルール提唱者が「後悔」(ITmedia)
http://www.itmedia.co.jp/news/articles/1708/18/news072.html
会見で語られた「ドコモ口座」不正利用、問題点と対策は(ケータイWatch)
https://k-tai.watch.impress.co.jp/docs/news/1276379.html
緊急解説 なぜ起きた?「ドコモ口座」不正引き出し(2020年9月11日)(テレ東ニュース)
まとめるポイント
1)セキュリティは技術的な話だけではなく運用によるところも大きい2)暗号化-復号化ができるように
(あるルールで作成したデータはルールを知らないと解釈できない
例)ID001の渡す薬剤のセットはコード番号19.002は10としたとき.コード21にはどのようなセットになるか?
ID | 薬剤A | 薬剤B | 薬剤C | 薬剤D | 薬剤E |
---|---|---|---|---|---|
001 | 有 | 無 | 無 | 有 | 有 |
002 | 無 | 有 | 無 | 有 | 無 |
003 |
第6回 保健医療情報システム(Ⅰ)-医用画像について
到達目標6-1DICOM規格について説明できる
6-2画像検査の種類や特徴について説明できる
復習すると
様々な情報を全てbitに変換しデジタル情報に変換することで,一台のデジタル機器で様々な情報を記録/再生できる.例題
1.以下の曲をデジタル情報に変換した時タイトルはどうなるか求めよ2.以下の曲から何を人は連想するのか考えよ
参考
ヒゲダン「115万キロのフィルム」115万キロって何?至極のラブソングに迫る!(歌詞検索UtaTen)https://utaten.com/specialArticle/index/4207
動画のビットレートとは?目安や計算方法から設定のやり方までを解説(株式会社サムシングファン)
https://www.somethingfun.co.jp/video_tips/movie_bitrate
DICOM
医用画像のデジタル保存・伝送に関する規格 http://medical.nema.org/Dicom/about-DICOM.htmlデファクトスタンダード
http://e-words.jp/w/%E3%83%87%E3%83%95%E3%82%A1%E3%82%AF%E3%83%88%E3%82%B9%E3%82%BF%E3%83%B3%E3%83%80%E3%83%BC%E3%83%89.html放射線を利用した画像について
被曝の話PET検査と放射線について(PET検査ネット)
http://www.pet-net.jp/pet_html/treat/radioactivity.html
外部被曝と内部被曝の違いを整理しておいてください(宇宙から 大地から が外部被ばく。空気中(吸入) 食べ物(摂取))
X線写真
アナログからデジタルへ移行(銀塩写真→デジタルカメラ)反射光を記録するのではなく透過光を記録
物質により透過具合が違う
造影剤は画像の濃淡を増強させるため
画像を取得しながらそのまま治療 → IVR
愛知医科大学IVR 治療を受けることになりました。どのような治療ですか?
CT
コンピューター断層撮影(アナログの)断層撮影もあるが、全く違うロジック
→アナログでは成立しなかった画像
横から見ているのに上から見た状況を推測
(「医療とコンピュータ」これまでとこれからと より)
CT MRI動画 (メディカルトピア草加病院)
https://www.youtube.com/watch?v=jqaJIKOdc6o
CTで撮影する際の注意とMRIの場合の違いなど見ておいてください
くも膜顆粒のCT、MRI画像所見 (画像診断チャンネル)
https://www.youtube.com/watch?v=fQXhrDiVa_A
一緒な部分の撮影でもCTとMRIで異なる
MRI
強力な磁場の中で電磁波(ラジオ波)を利用。放射線を使わない。磁力は感じなくても音のすごさに驚く検査
HOW TO サイエンス (9)からだの中を見る方法 MRI(サイエンスチャンネル)
https://www.youtube.com/watch?v=yeoIE5BmSrc
MRIで硬さを調べる以降は自宅でご覧ください
アクシデント
失敗百選 ~MRIにボンベが引き込まれて男児に衝突~
http://www.sydrose.com/case100/257/
MRIの危険性03「絶対に外れない車椅子」医療安全教育
https://www.youtube.com/watch?v=av3ABf7s3E8
核医学検査
放射性同位元素を体内に投与代謝を見る
そこから出てくる放射線(γ線 PETは消滅放射線)を外側で検出
ガンマカメラ
γ線を検出して平面像を得る
SPECT
ガンマカメラのCT版
PET
陽電子放出核種を利用
札幌東徳洲会病院 PET-CT検査紹介動画
https://www.youtube.com/watch?v=0g6rn0ZtlXE
超音波
音波を利用反射するまでの時間を距離に変換
救急腹部エコー検査(日経BP)
https://www.youtube.com/watch?v=IldE_FzvQwI
4Dエコーあり 妊娠13週 助産師解説します。(助産師ママの子育て べいちゃん)
https://youtu.be/O1jlfTUMS2U?si=eE7zlshxQv0AgCd7
音の反射時間から立体動画が作成される時代
内視鏡
国内機器メーカーが圧倒的シェア上記の医用画像との違いは、体の中を診るのに体外からアプローチしていたのを、体内に機械を放り込むところ
生検が可能
ききょうの丘健診プラザ: 胃内視鏡検査の受け方
https://www.youtube.com/watch?v=bHxCoEJ29Gg
まとめるポイント
(データを「わかりやすく」と「わかりにくく」と -医療分野の情報化- より)
第7回 保健医療情報システム(Ⅱ)-電子カルテについて
到達目標7-1カルテに記載される情報について説明できる
7-2電子カルテの必要な要件について説明できる
7-3電子カルテの意義と問題点について説明できる
カルテ
法令で「カルテ」なる言葉は出てこない。 「診療録」のことを指す・医師法<資格法>で作成や保存について定められている。
・治療に関すること以外の記載もある
電子カルテ
医療情報システムの安全管理に関するガイドライン 第6.0版(令和5年5月)厚生労働省https://www.mhlw.go.jp/stf/shingi/0000516275_00006.html
概要編「医療情報システムの安全管理に必要な要素;をよく読むこと
情報セキュリティの要素
・機密性・完全性
・可用性
電子カルテ(電子保存の)の三原則
・真正性・見読性
・保存性
システム運用編 別添「e-文書法対応に求められる技術的対策(見読性、真正性、保存性)」をよく読むこと
電子カルテの意義と問題点
新たな事が出来るようになると同時に、新たな事案も発生する(ゆえに、状況を把握し理解する力が必要)
・データ入力:手書き文字からの開放
・データ活用:情報の共有
・データ保存:データの紛失防止・長期保存
ISOUKAIx 医療情報 ①黒田知宏先生 「それって『電子カルテ』ですか?」
https://www.youtube.com/watch?v=0jvcfrEol7g
電子カルテから症状を読み取る IBM Watson Explorer(IBMJapanChannel)
https://youtu.be/Psuy1ARK2aU
電子カルテは単なる記録するためのものではなく利便性の向上と活用できる環境へ(次回に続く)
セキュリティの話
なぜ電子カルテはセキュリティを担保しなくてはならないのか?刑法(e-GOV)
https://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=140AC0000000045
理学療法士及び作業療法士法(e-GOV)
https://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=340AC0000000137
特別講義 漏洩と拡散の危機から情報を守る考え方
http://www.medbb.net/education/joho20150724/index.html
まとめるポイント
1)電子カルテに必要な3用件第8回 保健医療情報システム(Ⅲ)-施設内の情報システムについて
到達目標8-1病院内の情報システムにどのようなものがあるか説明できる
8-2オーダーエントリーシステムと電子カルテの情報の違いについて説明できる
8-3病院情報システムに求められる用件を説明できる
病院情報システム
HIS(Hospital Information System)狭義のHIS・・・オーダーエントリーシステム
広義のHIS・・・電子カルテも含めた病院全体のシステム
電子カルテの導入は病院全体の話
ISOUKAIx 医療情報 ②竹村匡正先生 「失敗するプロジェクト ~電子カルテ導入物語~」
https://www.youtube.com/watch?v=pSYM9u6yveY
病院情報システムの発展の歴史
医事会計システム(レセコン=レセプトコンピュータ)がスタート(レセプト・・・診療報酬明細書)
医療機関からの請求。電子化が進む
患者の知らない診療明細 レセプト(ロハス・メディカル)
http://lohasmedical.jp/archives/2009/03/post-39.php
医療情報システム(オーダエントリ・電子カルテシステム)導入調査(JAHIS 一般社団法人 保健医療福祉情報システム工業会)
https://www.jahis.jp/action/id=57?contents_type=23
発展の鍵は費用対効果?
医事会計電子化・・・デジタル加算(アナログ減算)
オーダーエントリー・・・コスト漏れが防げる
電子カルテ・・・?
オーダーエントリーシステムと電子カルテの機能の違い
オーダー伝達と結果参照の話電子カルテの定義に関する日本医療情報学会の見解(日本医療情報学会)
http://www.jami.jp/medicalFields/Documents/eKarte.pdf
電子カルテの位置づけと機能のところがポイント
PACS
Picture Archiving and Communication SystemDICOM規格の話
(画像の発生と転送時間の計算が出来るように)
病院情報システムに求められる用件
・処理の確実性システムが肥大化しており影響も広範囲に
・システムの頑健性
いまさら代替手段がない
・データの冗長化
無駄なように見えて無駄じゃない
・データの継続性
csv(Comma-Separated Values)に出来ればなんとかなる
・データの機密性
公的な性質を持つ情報システムほど機微な情報が集まる
・分かりやすい操作性
特別な教育がなくとも使える
・早いレスポンス
クライアント側で処理させるか、サーバーサイドで処理させるか、プリフェッチ(事前に読み込み)
・低コスト性
全体のコストで見ないと
システム運用のメリットデメリット
システム運用のメリット
情報伝達が迅速転帰や再入力が不要
閲覧様式が自在
正確な情報収集
検索・集計が容易
保存スペースが小さく長期保存可
情報へのアクセスが迅速
紛失リスクが少ない
紙運用のメリット
情報収集の柔軟性近くの人への情報伝達の手軽さ
真正性の確保(甘さ?)
運用変更への対応
情報の分散管理
情報システム間の連携
IHE - 医療情報統合化への挑戦(日本IHE協会)http://www.ihe-j.org/movie/index.html
繋がり始めるとメリットがあれば施設内にとどまる必要はないので施設を飛び越える
運用の工夫
県中!熱中!お仕事中:医療情報技師/島根県立中央病院/えにし~扉の向こうに~ 2023年7月放送(しまねっこCH)https://www.youtube.com/watch?v=OkRIMjx6mvY
まとめるポイント
デジタル化によりデータは同一メディアで取り扱えるものの・・・・病院内で発生した情報をどのように取りまとめるのか
CLISTA! 医療DWH 簡単紹介(医用工学研究所)
https://www.youtube.com/watch?v=sVdxBDpGDho
医療用DWH CLISTA! プレゼンテーション(医用工学研究所) https://www.youtube.com/watch?v=WX7iLD8NnVA
遠隔医療
元々は遠隔地を結ぶ格好で地域に医師がいない部分を補うために「遠隔医療」として行われていた.遠隔医療システムの類型
DtoD(Telemedicine)
医療者対医療者一人の医療者が全ての専門知識を持っているわけでは無い
専門医制度
http://www.japan-senmon-i.jp/
テレラジオロジー(放射線科医による読影)(ビデオ)
テレパソロジー(病理医による病理診断)術中迅速診断
テレカンファレンス(他施設の医療者との症例検討)
平成29年度5G総合実証 遠隔医療(総務省動画チャンネル)
https://youtu.be/0t6-YjaT1wo
情報に出来ない「モノ」伝送できないので・・・
ドローンで医療品を離島へ輸送 香川(SankeiNews)
https://youtu.be/EWOjXW0CSxM
命を救うドローン ルワンダで医薬品や血液を輸送 (BBC News Japan)
https://youtu.be/IF-GItooN8I
DtoP(Telecare)
医療者対患者医師法第20条の解釈
各論的事項 №16 「遠隔医療」(日本医師会)
http://www.med.or.jp/doctor/member/kiso/d16.html
遠隔医療拡大に対応し職能追求を(薬事日報)
https://www.yakuji.co.jp/entry63463.html
スマホでできる遠隔診療・健康相談 ポケットドクター(Pocket Doctor)
https://youtu.be/ByYcE492RfQ
【Nスタ】オンライン診療予約急増、コロナ感染疑いある患者も(TBS NEWS)
https://youtu.be/mpyEBTp64mY
初診オンライン診療 厚労省が難色(テレ東NEWS)
https://youtu.be/EI_4akjdYtE
PtoP
患者対患者Communication Network Analysis in Maternity Hospital Bulletin Board System
Journal of Medical Systems(31/2)141-148 Shunji Suto, Nobuyuki Ashida, Terumasa Higashi, Hideo Takemura, Koji Kurimoto and Shiro Yorifuji
地域医療連携情報システム
目的:病院完結型医療ではなく、地域完結型医療を達成するにあたって医療機関間のスムーズな連携の支援地域により事情が異なるのでシステムの持つ機能は様々
ICT を利用した全国地域医療連携の概況(2016 年度版) 日医総研ワーキングペーパーより作成
<参考>
医療情報連携ネットワーク支援Navi(厚生労働省)
http://renkei-support.mhlw.go.jp/
被保険者番号を「医療等ID」として運用へ 厚労省が仕様まとめる(Med IT Tech)
https://medit.tech/mhlw-announced-scheme-of-medical-id/
第9回 統計基礎(Ⅰ)-尺度・度数分布について
到達目標統計が集団を対象としていることを理解する.
9-1 4つの尺度について理解する
9-2 度数分布表を作成することが出来る
統計に用いるデータ
基本どのようなデータでも統計処理は出来る出来ないのは,どのようなデータであっても一つしか存在しない時
データについて
レコード
症例,個体,被験者単位でまとめられたデータの塊.表の場合一行にその症例のすべてのデータを記していたらそれがレコード変数(変量)
データの項目名のことデータ
観測値や測定値のこと(数値)だけでなく性別など文字の場合もある.コンピュータ処理するとき,文字だと扱いにくい時があるのでその時は数字に置き換える(→コード変換)
例えば都道府県名であれば 北海道→01 青森県→02 奈良県→29
全国地方公共団体コードの上二桁=都道府県番号
<参考>全国地方公共団体コード(総務省) https://www.soumu.go.jp/denshijiti/code.html |
変量(データ)の分類
変量は様々なものがあるがそれらの性質をとりまとめ分類することが出来る。それぞれを尺度と呼び、4つに分類するのが一般的である
1分類尺度(名義尺度)
2順序尺度
3間隔尺度
4比尺度(比例)(比率)
1,2を質的変量(定性的)
3,4を量的変量(定量的)
性質としては上位互換性があり
4>3>2>1
統計の世界の枠組み
記述統計と推測統計に分類される記述統計とは
・収集したデータを要約してその集団の状況を表す・そこにあるデータは全体(母集団)
・度数(分布)・代表値・散布度・相関係数など
推測統計とは
事象の起こる確率を仮定した上で全体(過去・現在だけではなく未来も含む)を推測する。推定と検定に分類される。推定とは
・収集したデータを基にしてその集団の状況を表す・そこにあるデータは一部(標本)
・点推定・区間推定・モデリング
検定とは
・収集したデータを基にしてその集団の状況を仮定に従ってyes/Noで判断する・そこにあるデータは一部(標本)
・t検定・カイ二乗検定など
母集団とは
対象としている集団の全体を指し示すときに「母」を最初に付ける。無限母集団と有限母集団からなる。
対象が有限か無限に増殖するかの違い
標本とは
母集団の一部。昆虫標本を思い浮かべると、偏りに注意する必要があることは自明。
参考
標本調査はサンプル抽出が命(The Huffington Post Japan)http://www.huffingtonpost.jp/nissei-kisokenkyujyo/sample-survey_b_5878832.html
記述統計量
取りまとめたものを「量で」示したもの.質的変数であっても度数(個数,人数など数えるもの)については「量」として示すことが出来る度数
どのようなデータでも度数を示すことは可能度数分布表
それぞれのデータ(変量)の数(出現頻度)をまとめたもの変量が名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときに、それぞれの度数がしめる割合
累積度数・・・上位の変量の度数もあわせた度数
累積相対度数・・・累積度数の相対版
品名 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|
いちご | 15 | |||
みかん | 8 | |||
ぶどう | 7 | |||
計 | 30 | 1.00 | ----- | ----- |
量的変数の度数分布表
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.血圧 163.5mmHg 164.2mmHg 162.5mmHg・・・どれも度数を積み上げられない → 区間を設定する
「A~B」は「A以上B未満」と読む格好と思っていたが,分野などによって違うようです 「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定は絶対しないように. この授業では「A~B」は「A以上B未満」とします. |
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
130~140 | 135 | ||||
140~150 | 145 | ||||
150~160 | 155 | ||||
160~170 | 165 | ||||
170~180 | 175 | ||||
計 | ----- | ----- |
度数分布図
質的変数・・・縦棒グラフ量的変数・・・ヒストグラム
棒の間隔が無いのは値が連続している状態であるが故
普通の棒グラフは棒の長さが度数を示すが,ヒストグラムは棒の面積が度数を示す
「階級の幅を等しくすること」と説明している場合があるが,それは幅が変わると高さが変わる故で,実際にはそのような区間設定はよくある |
ヒストグラムーなるほど統計学園(総務省統計局) https://www.stat.go.jp/naruhodo/4_graph/shokyu/histogram.html |
例題
1)下記の度数分布表の空欄部A,B,Cを求めよ階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|---|
0.5~1.0 | |||||
1.0~1.5 | 6 | A | 0.325 | ||
1.5~2.0 | 0.1 | 17 | |||
2.0~2.5 | B | 0.65 | |||
2.5~3.0 | 7 | ||||
3.0~3.5 | 0.125 | C | |||
3.5~4.0 | |||||
計 | ----- | 1.00 | ----- | ----- |
店名 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|
1.00 | ||||
計 | 1.00 | ----- | ----- |
第10回 統計基礎(Ⅱ)-代表値について/散布度について
到達目標10-1 それぞれの代表値について特性を理解する
10-2 散布度それぞれの特性について理解する
記述統計量(代表値)
代表値と散布度からなる.←駅伝やマラソンの実況中継はこれらを利用しているから状況がわかる平均(Mean)
Averageってexcel関数ありますが,あれ代表値って意味です.算術平均
いわゆる割り勘.xbar=1/n(x1+x2+・・・+xn)欠点:外れ値があると平均値は分布の中心位置を示さない(←それって代表的な値??)
→ 対処法:外れ値を取り除くか中央値を使うか
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる加重平均
重みづけ平均例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの? 応用例
度数分布表から算術平均を計算
Σ(階級値×度数)/構成数
中央値
昇順に並べたときに,真ん中の順番のデータ(変数)の値データの数が偶数だと真ん中のデータは二つになるのでそれらの平均値
最頻値
最も個数が多いデータの値最頻値は複数存在する場合がある→二峰性
例題
前回の例題で作成(空欄ABC)した度数分布表より,平均値を求めよ記述統計量(散布度)
範囲
最大値と最小値の差四分位範囲
IQR=第3四分位数(75%点)-第1四分位数(25%点)(参考:中央値=第2四分位数(50%点))第3四分位数(75%点)の算出方法は数多くありまして・・・
標準偏差
範囲を用いた散布度と違い,平均値からのバラツキ(差=偏差)の平均を求めようというものただし偏差の平均をとれば集団内の各々のズレっぷりがわかると思って計算しても → 合計は常に0 故に平均も常に0
そこで偏差を二乗したものの平均を取っている → 分散
標準偏差は分散の正の平方根をとったもの
統計手法の考え方
量的変数をそのまま量的に取り扱う場合・・・平均値 標準偏差 パラメトリック検定・・・t検定(正規分布を用いた検定)量的変数を順序変数として取り扱う場合・・・中央値 四分位範囲/偏差 ノンパラメトリック検定・・・一標本Wilcoxon検定,Mann-Whitney検定
量的変数を名義(カテゴリー)変数として取り扱う場合・・・度数 カイ二乗検定
よく,パラメトリック検定を分布に依存すると表現している件
意味としてはノンパラ(順序=分布に依存しない)とは,取り扱うと,値の分布をキャンセルしている(バラバラに存在整列していたものを整列させる)ということ元々は量的変数.こちらの絵の通りで平均値(14.55)を求めたり標準偏差(4.23)を求めたり,母集団の推定のために不偏分散(19.67)求めたりt検定を行ったり.
こちらは分布なんて関係なく中央値(15)を求めたり,四分位偏差(2)求めたり,U検定を行ったり.
記述統計量の求め方で集団そのものの可視化ではなく,集団の一部である標本としたときに,母集団の推定に用いることが出来るのか
偏りが無ければ使える=均等にばらつくことが期待できるのであれば代表値(算術平均)
計算そのもので偏よることはない(標本が偏っているのであれば偏ってしまうが)散布度(分散 標準偏差)
計算そのもので偏ってしまう・・・(母集団の平均を標本の平均で推定しているが一致しないことが期待されるので)例題
以前のみかんの売り上げデータより平均値,中央値,最頻値,範囲,標準偏差を求めよ第11回 統計基礎(Ⅲ)-推測統計(点推定)
到達目標11-1 母平均値の点推定は殆ど母平均と同じにならないことを説明できる
11-2 母分散の点推定は,なぜ集団全体を求めた式とことなるのか説明できる
点推定
一つの数値(点)で推定値を示すこと欠点:推定値と真の値がどの程度ズレているのかよくわからない
利点:区間推定よりも簡単に算出できる
推定をしても必ず一致するわけでもない→せめて偏りなくバラついてほしい→不偏推定量
平均値
標本から求めた平均値は母集団の平均値の不偏推定量か?以下は20000のデータから標本数10の平均値を求めたもの(標本数2000)をヒストグラムにしたもの
125.0未満の標本平均になった標本の数 1000(50.0%)
標本平均が125.0になった標本数 22(1.1%)
125.0を超えた標本平均になった標本の数978(48.9%)
分散
標本から求めた分散は母集団の分散の不偏推定量か?標本の分散
以下は20000のデータから標本毎に求めた平均(標本平均)を用いて分散を求めたもの(標本数2000)をヒストグラムにしたもの母分散の値よりも低く出る標本が多い→偏っている
母平均を用いた標本の分散
それでは母平均を用いて標本ごとの分散を求めると以下のようになる偏っていない推定が出来るが,そもそも母平均を用いることが出来るわけもなく・・・
不偏分散(標本の平均を用いて母分散の推定を行う)
<参考>不偏分散は何故nではなく(n-1)で除するのか(生物統計学2018奈良医大) https://medbb.net/education/nmubiostat2018/index.html#VAR |
今回のデータで検証すると
標本の平均を用いた分散<母平均を用いた分散 1978
標本の平均を用いた分散=母平均を用いた分散 22
標本の平均を用いた分散>母平均を用いた分散 0
ということで,標本平均を用いて母分散の推定を行うには,少し値を大きくしないといけない
上記の<参考は>母平均を用いた式を標本平均に置き換えて式を変化させた話 → 結論は偏差平方和を標本数nではなくn-1で除すると良い
課題
1
以下の3つの標本の個票データよりそれぞれの標本から母平均と母分散,標準偏差を点推定せよ第12回 統計基礎(Ⅳ)-推測統計(区間推定)
到達目標12-1 母平均値の区間推定について100%の信頼区間を求めることに意味が無いことを説明できる
12-2 正規分布について説明できる
区間推定
前回の標本から求めた母平均の推定値のヒストグラム標本数が多くなると,その出現頻度は「正規分布」に従う・・・中心極限定理
中心極限定理
標本の大きさが十分であれば標本平均の分布は正規分布→正しく測定されているのであれば偶然誤差の発生は正規分布に従う
→測定回数を増やせば増やすほど
誤差の話は二つの要因
正規分布
左右対称の釣鐘状分布平均値に近いほど出現率が高く遠ざかるに従って低くなる(ことが多い)
標準正規分布
平均値が0標準偏差=1(分散も1)になるように値を変換したもの偏差値は平均値を50、標準偏差=10になるように値を変換したもの
両者の関係
偏差値=50+10×z
標準正規分布表
標準正規分布表のPDF版はコチラから
標準偏差と標準誤差
・標準偏差は標本の分布のバラツキ具合を示したもの・標準誤差は母集団から抽出した標本の平均値のバラツキ具合
SE=σ/√n
標準誤差SEはなぜ標準偏差σを√nで除するのか
標準誤差は母平均に対する標本平均のバラつき指標(標準偏差)の話対象が母集団全体ならば0だが,母平均(μ)と標本平均(xbar)には差が生じる
ある標本における平均値と母平均の偏差平方は
(xbar-μ)2
=((1/n)Σxi-μ)2
=((1/n)Σxi-(1/n)Σμ)2
=((1/n)Σ(xi-μ))2
=(1/n)(1/n)Σ(xi-μ)2
-----
ここで
(1/n)Σ(xi-μ)2
をσ2とおくと
-----
=σ2/n
故に標準誤差は
SE=σ/√n
平均値の区間推定
平均値の区間推定については標準誤差をバラツキの基準にして計算する
平均値の点推定値±バラツキ
バラツキ・・・信頼区間の確率により確率分布表(標準正規正規分布表)から求める.
一般には95%信頼区間
ただし標準正規分布表は標準偏差が1の時の値(=Z値)なので今回対象とする集団の標準偏差(ここでは平均値の話なので標準誤差)の値で読み替えなくてはいけない
課題
1)テストの点が正規分布に従うとして
10000人でテストを行い平均点60点,標準偏差16の試験で84点(偏差値は65 ZスコアはZ=1.5)を取っていたのであれば,その順位は668番目となる
では,96点では?
2)母集団の平均点が 60点,標準偏差が16点の試験
そこで84点の場合 偏差値,Z値は?
3)ある試験の受験者100人から点を教えてもらったところ平均値(点推定)=65点 標準偏差(点推定)=18点であった.
平均値の区間推定を信頼区間95%で示せ
講義中黒板で示したものをパワポでまとめたもの
第13回 医療統計(Ⅰ)-比と率と割合
到達目標
13-1 比と率と割合について説明できる
13-2 人年法について説明や計算が出来る
比と率と割合(比率)と
ここら辺の理解について整理しておいてください
ごちゃごちゃに整理される原因は割合=比率という整理になっているところだと思います
比
ratio
異なるもので割ったもの・・・単位は無次元の場合もある
例)BMI(Body Mass Index)
身長の二乗(m^2)に対する体重(kg)の比
身長170cmで体重70kgの人のBMI・・・70/(1.7^2)≒24.2
検査表の見方(日本人間ドック学会)
http://www.ningen-dock.jp/public/method
率
rate
時間に対する何かの量の比・・・単位は無次元の場合もある
変化を表す指標
例)時速
マラソン(42.195km)を2時間6分で走った場合の時速・・・42.195/2.1≒20.1km/h
100m走を10秒で走った場合の時速・・・0.1/(10/3600)=36km/h
無次元の例としては稼働率
稼働率(JIT基本用語集)
http://www.lean-manufacturing-japan.jp/jit/cat241/post-74.html
時間を時間で割るので無次元
割合(比率)
proportion
全体に対してその一部がどの程度占めるか割ったもの・・・単位は無次元になる
0~1の間の値をとるpercentで表示したりする。100%を超えるのは本来おかしい
例)日本人の血液型の割合
A型 約40%
B型 約20%
O型 約30%
AB型 約10%
人年法
一人の人を一年観察したとき1人年
人年に対する何かの量の比・・・率になる
例)5人の患者を1年間観察していた時に二人死亡
Aさん 1年後生存
Bさん 3ヶ月後に死亡
Cさん 9ヶ月後に死亡
Dさん 1年後生存
Eさん 1年後生存
本来の死亡率算出
観察人年=1+0.25+0.75+1+1=4人年
その間の死亡数が2なので
2/4=0.5 「死亡率(1人年あたり)0.5」
2/4*1000=500「死亡率(1000人年あたり)500」
年央人口を用いる方法
6ヶ月経過の時点での生存者4人
1年経過後の集団の死亡数が2なので
2/4=0.5 「1人年対0.5の死亡率」
参考資料
厚生労働統計に用いる主な比率及び用語の解説(厚生労働省)
http://www.mhlw.go.jp/toukei/kaisetu/index-hw.html
人年法の計算と利用方法,青木伸雄,日本循環器管理研究協議会雑誌 26(1),64-66,1991
https://www.jstage.jst.go.jp/article/jjcdp1974/26/1/26_1_64/_article/-char/ja/
第14回 医療統計(Ⅱ)-相対危険度
到達目標
6-1 相対危険を示す指標にどのようなものがあるか説明できる
6-2 研究手法によって適切な指標を選択できる
この授業では相対危険=Relative Risk は一般的な用語であり、その算出指標の一つにリスク比(Risk Ratio)があるのですがそれを相対危険としているケースもあり,言葉の整理が出来ていないところでもあります。
指標と調査方法との関係
観察研究(Observational study)
記述疫学
特段曝露について触れたものではない
ただし,人,場所,時間という曝露はあるが
記述統計と言われるものと同じ格好で,状況を可視化するもの
生態学的研究
集団レベルで曝露と疾病頻度の関係をみる.
仮説を形成するところまで
個人レベルで曝露と疾病頻度に関係が無くても集団レベルで行うと,関係が見えてくる場合がある → 謎理論誕生
横断研究(Cross-sectional study)
曝露と疾患を同時に評価
時間軸がない場合が多く(例外は性別など)因果関係までは不明になってしまいやすい
コホート研究(Cohort study)
対象に曝露している人々と非曝露群を設定、追跡調査していくスタイル
通常前向きだが、後ろ向きにみる回顧的コホート研究というのもある。(後々でも曝露群に関する情報がある場合)
症例対照研究(Case-control study)
ある状態(例えば病気に罹患している)群と、罹患していない群を設定、時間を遡って調査していくスタイル
後ろ向きにしか行えない(前向きだと曝露→疾患の順がおかしくなる)
実験的研究(介入研究)(intervention study)
コホート研究の場合、曝露群(介入群)を研究者が割り付ける → 被験者に対する倫理的配慮が肝要
無作為に割り付けることが出来る場合は交絡因子を制御できる(ことが期待される)
倫理的に考えると非介入群の方が不利益になってしまう可能性が高いので、配慮した研究デザインが求められる
説明用データ
疾病発症 | 疾病無 | 計 | |
---|---|---|---|
曝露有 | A | B | A+B |
曝露無 | C | D | C+D |
計 | A+C | B+D |
リスク比
Risk Ratio(RR)曝露(介入)の有る時と無の時の危険を示す指標の比
危険を示す指標には罹患率やら有病率やら死亡率やら
A~D:疾病発生頻度(頻度以外に罹患率やら有病率・・・)
曝露有群の発症リスク=A/(A+B)
曝露無群の発症リスク=C/(C+D)
リスク比=A/(A+B)/C/(C+D)
もし、発生頻度が低ければA+B≒B C+D≒D
リスク比≒A/B/C/D=AD/BC
オッズ比
Odds Ratio(OR)危険な事象が起きた場合と起きなかった場合の指標の比(=オッズ)について曝露(介入)の有無毎に求め比をとったもの
発症有群の曝露オッズ=A/C
発症無群の曝露オッズ=B/D
オッズ比=A/C/B/D
=AD/BC
上記のように発症頻度が低ければオッズ比とリスク比の近似値となる
本日の例題
コホート研究不整脈あり | 不整脈なし | 計 | |
---|---|---|---|
曝露群 | 100 | 1900 | 2000 |
非曝露群 | 50 | 1950 | 2000 |
計 | 150 | 3850 | 4000 |
不整脈あり | 不整脈無し | 計 | |
---|---|---|---|
曝露歴あり | 100 | 65 | 165 |
曝露歴無し | 100 | 135 | 235 |
計 | 200 | 200 | 400 |