関西医科大学 情報活用論2025
(看護学部看護学科)
講義後記はコチラをクリックしてください
2025年度開講にあたって
https://medbb.net/education/2025init/
課題提出
課題提出のフォームはコチラから
提出期限は授業日の翌日の午前9時59分59秒迄とする
メールアドレスは所属機関で付与されているものを記入のこと(課題の内容は当該メール宛にコピーが送信されます)
授業メニュー
第01回 情報とデータ通信
第02回 データ収集
第03回 データ分析(1)データの特性
第04回 データ分析(2)データエンジニアリング
第05回 データ分析(3)データ駆動型社会
第06回 データ分析(4)AI
第07回 科学技術と社会(1)情報セキュリティ
第08回 科学技術と社会(2)ELSI
第01回 情報とデータ通信
教科書4章-1MDASH_L
【1-2-2】1次データ、2次データ、データのメタ化
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-2-4】データ作成(ビッグデータとアノテーション)
情報とは
戦争に関する本で翻訳する時の森鴎外による造語とされる
情報とデータと知識
データ
ノイズとして認識しなかった事柄の記録発生するデータは受診特性に依存する.
一次データと二次データに分けられる
一次・・・対象からダイレクトに取得
二次・・・既に記録されたもの。まとめられたもの
情報
データに意味を付与したもの情報化にあたって受信者の特性に依存する.
知識
情報を体系化したもの。受信者の知性に依存する.
その時点での受信者の知識によるところが大きい

(よりよい医療に貢献する医療情報技師の役割 より)
データのメタ化
データには情報にするために他のデータも付加される場合もあるが,作成時に自動的に発生し埋め込んでいるデータもある → メタデータ例えばだれが作成したのか,何処で撮影されたのかなどなど
メタ化とは,データに様々な情報(二次データ)が付加され具体的な事実から抽象的な解釈に向かっていく過程
テキストデータに医用画像の位置情報を付与して表示させた例

産学官連携マネジメント論2018(分担:地域医療と産学官連携)より
例題1
なぜ一夜漬けの勉強が否定されるのか,データと情報と知識の関係性を念頭にして自身の考えを述べよ社会生活における情報量
コンピュータで取り扱うデータは情報の量の考え方でデジタル化されている情報の量
bit:シャノンの情報理論AなのかAじゃないのか?明確に指定できる情報・・・1bit
事象の起こる確率によって決まる。確率の低い事象を確定する情報ほど大きくなる
I=-log2P 事象の起こる確率によって情報の量が決まる
それぞれの事象の起こる確率が等しいならば選択肢の数(T)に書き換えると I=log2T → 何が起こるのか想定しないと情報は取り扱えない・・・想定外の事象の情報量は計算できない(無限大)
デジタルの世界では1と0の情報の組み合わせであらゆるデータを取り扱っている
(但しデータの定義が必要)
情報量が大きいほどより細かい事柄を表現できる

情報量の定義
yes/Noを区別(選択肢2つから1に)させる情報・・・1bit選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。
対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる
デジタルデータはこの考え方に基づきアナログなものもデジタルデータとして取り扱っている
数値
コンピュータは2進数の世界なので10進数の世界と馴染みにくいところがある.デジタルの世界の補助単位
補助単位はキリのいい数字・・・切りの良い数字とは?十進数の世界ち二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000
K→M→G
十進数は1000
二進数は2^10=1024≒1000
キロ・・・kとK

例題1-2
十進数の100を二進数で示すとどのようになるか 二進数は長ったらしいので16進数が一般に使われている.画像の情報量
光の3原色・・RGBそれぞれ256階調とすると、一色8bit
3色で8×3で24bit
情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
1マスあたりの情報量は白黒だったら1bit.灰色なども考えると・・・.カラーになると光の三原色・・・

色深度(bpp)
1bit ■ ■ ■ ■ ■ ■ ■ ■
2bit ■ ■ ■ ■ ■ ■ ■ ■
3bit ■ ■ ■ ■ ■ ■ ■ ■
画像処理の授業中唐突に脳に現れてこびりついて辛い pic.twitter.com/T5cCUfcrJh
— flerovium (@flerovium3) September 28, 2022
1回目ここまで
提出課題
事後学修:講義を振り返り①理解できた内容②理解できなかった内容③その他コメントを簡潔にまとめ講義サイトより提出の事
文字の情報量
用いる文字の種類の数によって決まる英数字・・・7bit
+カナ・・・8bit=(1byte)半角文字
漢字は倍の2byte(全角文字)
情報量は文字数×1文字あたりの情報量
(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)
音の情報量
空気の振動(粗密波)Hz
人間の可聴域は20Hz~20kHz
サンプリング定理:元の周波数の2倍以上でサンプリングすれば再現できる
<参考>標本化定理(サンプリング定理)とは(制御工学の基礎あれこれ)
http://arduinopid.web.fc2.com/M34.html
(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)
サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz
情報量は音信号の情報量(16bit×2チャンネル=4byte)×1秒あたりのサンプリング数×曲の長さ(秒数)

(参考)なぜ650MBのCD-Rに74分の音楽が記録できるのでしょうか?
http://okwave.jp/qa/q2070273.html
通信
情報の活用に必要な事柄情報の収集→分析→成果→提供→活用
古代
のろし,音,口伝え到達距離に限界がある
口伝えは伝言ゲームになってしまう
人の移動距離に限界がある(時間もかかる)
<参考>意外と古い!? 可視光通信の歴史(可視光通信研究倶楽部(カシケン)
https://www.kashikou.jp/kashikou/post-20/
紙時代
記録媒体を輸送(通信したものが形で残る)情報をモノ(メディア)に記録させてそれを運ぶ・・・時間がかかる
データ通信時代
モールス信号は文字を電気信号に置き換えて送信FAXは紙をスキャンし電話回線で送れる(文字以外に絵も送れる)
デジタルデータ・・・メディアに依存しないので様々な情報を送れる
<参考>通信の歴史(5G全解)
https://contest.japias.jp/tqj23/230354T/telecommunication_history.html
インターネット
昔のパソコン通信は限られた世界の中世界中の様々なデジタルネットワークがつながった

災害時における情報通信と保健医療(開催趣旨)より
第02回 データ収集
教科書3-1-2(ビッグデータ),4-1-2(あれもこれもデータサイエンス),4-2(販売データ),4-3(協調フィルタリング),4-4(データの活用が生み出す新しい価値),9-4(標本の抽出方法)MDASH_L
【1-1-2】データ量の増加、計算機の処理性能の向上、AIの非連続的進化
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-2-5】データのオープン化(オープンデータ)
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)
ビッグデータ
総務省情報通信白書より出典 平成24年版情報通信白書
ビッグデータは、どの程度のデータ規模かという量的側面だけでなく、どのようなデータから構成されるか、あるいはそのデータがどのように利用されるかという質的側面において、従来のシステムとは違いがあると考えられる。
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
平成29年版情報通信白書を加工して作成
ビッグデータの種別に関する分類は・・・政府:国や地方公共団体が提供する「オープンデータ」,企業:暗黙知(ノウハウ)をデジタル化・構造化したデータ,企業:M2M(Machine to Machine)から吐き出されるストリーミングデータ,個人:個人の属性に係る「パーソナルデータ」
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h29/html/nc121100.html
当初はデータの大きさの話も含めていたが,利活用を念頭においた上で特に量的な話よりも質的な話が中心
平成24年は何が出来るのか手探りだった感
データを資産と考えると,お金を持っていても何にも使えないのであれば実質的な恩恵は得られない
同様にデータも大量に保有していても何にも使えないのであれば実質的な恩恵は得られない
ビッグであることそのもので,何か新しい知見が勝手に出てくるわけではない.それは次回以降の話
身近にあふれるデータ(生活者)
個人に関する生活するうえでの事柄を記録したデータ
銀行での振り込み等〇〇payの購入記録
SMSでの連絡記録
個人が社会に対して提供したデータ
昔はマスメディアなどを通じないと広く提供することが出来なかった広告メディアなども,一昔前と今ではかなり変わった感がある
出典 平成20年版情報通信白書
パソコンや携帯電話が、これまで4大マスメディアが果たしてきた役割を担うようになったのだろうか
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h20/html/k1323000.html
4マスそれぞれの業種別広告費前年比から広告主の姿勢をさぐる(2024年公開版)(不破雷蔵 Yahooニュース)
https://news.yahoo.co.jp/expert/articles/2e4c709966725f36666986dcfb9d7005a6307d99
社会が個人に対して提供したデータ
昔は通信回線数(チャンネル数)に限界があったので,個別のニーズに沿った情報提供は困難だった朝の番組の天気予報コーナーで,週末のピンポイント天気予報のリクエスト(運動会とか,旅行とか,ゴルフとか)に答えていた記憶がある.
情報の伝え方も進歩したことに加えて,個人が情報をチョイスする仕組みもあり,雨雲レーダーもスマホで確認できる
ニュースリアルタイムの裏側に潜入!(中京テレビ)
https://www.ctv.co.jp/announce/2009/spot/0520/index04.html
以前なら社会に依頼しないと得られない個人のデータ
その昔は,写真などは撮影しただけでは見ることが出来ず,現像処理が必要だが個人でしていた人はお一人知っている程度今は,スマホでそのまま見ることができるようになり,スポーツなどでの自分の動き方も確認できるようになってきた.
JavaScriptで画像から「重心移動」「回旋角」を簡単に計測パソコンやスマホだけで投球フォーム分析(谷岡広樹 ログミーTech)
https://logmi.jp/tech/articles/325347
社会にあふれるデータ(顧客の)
個人に関する生活するうえでの事柄を記録したデータ
小売店での販売データは,顧客(個人)のものであるが同時に小売店側も取得するデータであるその個人を紐づけていく事が出来たら,対象者に寄り添った販売が可能
POSデータとは?その定義やデータの種類からPOSデータの活用例を解説(NECソリューションイノベータ)
https://www.nec-solutioninnovators.co.jp/ss/retail/topics/pos-data/
支部大会奨励賞:田井紗瑛子さん 論文名:「ID-POSデータを用いた非会員顧客の年齢と性別の推定」(学部4年)(コミュニケーションデザイン研究室(吉野研究室)和歌山大学)
https://web.wakayama-u.ac.jp/~yoshino/lab/d_award/tai_2022_1.html
3.11の都心における人の流動を光の流れで再現したら東京から光が消えた(GigaZine)
https://gigazine.net/news/20130111-confluence-of-0311/
データ収集の注意点
全部収集できれば良いが,コストの面から無理な場合もあればそもそも対象が増殖するのであれば全部は無理
全体をバランスよく取ることができるか(偏っていないか)
偏りなくても方法について問題はないか?
以下はデータの取得方法が変更したため影響が出た例

奈良県の医療を取り巻く状況について より
さらにデータが人手を介するとエラーは必ず出ると思っていたほうが良い(だって人間だもの)
バーコードリーダーの利用はエラー低減のため(人に読ませない).
センター入試では受験生が間違えてる可能性が出てくるが不利益が出ないように,チェックデジットが使われている(バーコードも)
様々な注意点があるものの最終的に使えるようなデータであってほしい(と思って取り組んでいます)
チェックデジット 【check digit】 チェックディジット(IT用語辞典e-words)
https://e-words.jp/w/%E3%83%81%E3%82%A7%E3%83%83%E3%82%AF%E3%83%87%E3%82%B8%E3%83%83%E3%83%88.html
Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)とは?(@IT)
https://atmarkit.itmedia.co.jp/ait/articles/2010/21/news027.html
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③送られてきたor自ら取得したデータに振り回された想い出(公表できる範囲で)について
課題提出のフォーム より期日内に提出せよ
課題のフォロー
情報の寿命
記録媒体としての寿命だけでなく利活用の考え方もある

標本化
どのような間隔でデータを取得するか.取得する間隔が広いと周波数は低くなる.取得する間隔が狭いと周波数は高くなる.
下の絵はデータを取得する間隔を狭くすると,アナログの状況がより細かく再現されているのが把握できると思います.
その分沢山データをとらなくてはいけないので,トータルの情報量は増加します
あとは山の高さを細かく分けるか大雑把に分けるかで一つの点当たりの情報量は増加します
それぞれ文字の情報量に置き換えると前者が文字数,後者が文字の表現できる種類(1byte文字(半角),2bute文字(全角))に相当します



私たちの日常(10進数)とコンピュータの日常(2進数)と

第03回 データ分析(1)データの特性
教科書1(ようこそデータサイエンスへ),7-1(データの種類),7-3-2(データを解釈するときの注意点)
MDASH_L
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)
【2-1-1】データの種類(量的変数、質的変数)
収集したデータがどのようなものなのか
数字だけがデータではない→文字って分析できるの?
データの種類
さまざまなデータがあるのか確認できたが,処理していく上で特性別に種類に分けていく事が必要
4つの尺度(7-1-1質的データと量的データ)
食事の際,質(みずみずしい,ふっくら)と量(おかわり)の二つの軸から満足している
それらをもう少し細かく分類すると4つの尺度となる
4つの尺度
世の中のデータを4つの種類で説明できる
1名義尺度(質的データ)
2順序尺度(質的データ)
3間隔尺度(量的データ)
4比尺度(比例)(比率)(量的データ)
1,2を質的変量(定性的)ともいう
3,4を量的変量(定量的)ともいう
性質としては上位互換性があり
4>3>2>1
間隔尺度と比尺度との見分け方
データ自身が負の値をとることが想定されるものは間隔尺度(引き算などで便宜上マイナスになるものはデータ自身によるものではない)
天気予報での摂氏温度(℃)の話をどのようにされているのか(過去に一回だけビックリしたことがあるけど)

奈良県立医科大学 保健統計学I2024(医学部看護学科)より
例題3-1
以下の文章中の下線部の尺度を示せ
折角の(1)日曜日【月曜日,火曜日】,天気も(2)晴【曇,雨】なので車に乗って(3)奈良駅【郡山駅,畝傍駅】までドライブ.
昼食はハンバーガーチェーン店でチーズバーガーとポテトを購入,ドリンクは(4)Lサイズ【Mサイズ,Sサイズ】を選ぶ
昼食後車を走らせるがガソリンが少ないので(5)35リットル【20リットル,5リットル】ほど給油.
無事目的地に到着し駐車場から外に出るとなにやら(6)少し寒い【温かい,熱い】,確かに気温を見ると(7)12℃【10℃,8℃】と先程よりも低い
なので上着を買って帰ることにした.丁度バーゲンセールをやっている.値段は(8)3980円【2980円1980円】,(9)凄く良い【まぁまぁ良い,少し残念な】ものを買うことが出来ました.
例題3-2
教科書1-1-1(役に立つデータサイエンスを読んで,どのような「データ」(売上とか交通量とか・・・)が登場し,何尺度なのか答えよ
度数
どのようなデータでも名義尺度の性質を有している.
名義尺度は数を数える(度数)ことでのみ,量的な取り扱いが可能になる
例題3-3
以下の40名の血液型データについて度数を求めよ

度数分布表
度数は表にすることで,全体の状況が把握しやすくなる
度数分布表はそれぞれのデータの度数(出現頻度)をまとめたもの
名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数 ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
累積度数・・・上位で出現していた度数もあわせた度数
累積相対度数・・・累積度数の相対度数
https://gigazine.net/news/20130111-confluence-of-0311/
https://e-words.jp/w/%E3%83%81%E3%82%A7%E3%83%83%E3%82%AF%E3%83%87%E3%82%B8%E3%83%83%E3%83%88.html
Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)とは?(@IT)
https://atmarkit.itmedia.co.jp/ait/articles/2010/21/news027.html
講義を振り返り①理解できた内容②理解できなかった内容③送られてきたor自ら取得したデータに振り回された想い出(公表できる範囲で)について
課題提出のフォーム より期日内に提出せよ
以下の文章中の下線部の尺度を示せ
折角の(1)日曜日【月曜日,火曜日】,天気も(2)晴【曇,雨】なので車に乗って(3)奈良駅【郡山駅,畝傍駅】までドライブ.
昼食はハンバーガーチェーン店でチーズバーガーとポテトを購入,ドリンクは(4)Lサイズ【Mサイズ,Sサイズ】を選ぶ
昼食後車を走らせるがガソリンが少ないので(5)35リットル【20リットル,5リットル】ほど給油.
無事目的地に到着し駐車場から外に出るとなにやら(6)少し寒い【温かい,熱い】,確かに気温を見ると(7)12℃【10℃,8℃】と先程よりも低い
なので上着を買って帰ることにした.丁度バーゲンセールをやっている.値段は(8)3980円【2980円1980円】,(9)凄く良い【まぁまぁ良い,少し残念な】ものを買うことが出来ました.
教科書1-1-1(役に立つデータサイエンスを読んで,どのような「データ」(売上とか交通量とか・・・)が登場し,何尺度なのか答えよ
以下の40名の血液型データについて度数を求めよ

(名称) | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|
計 | 1.00 | ----- | ----- |
例題3-4
例題3-3で求めた血液型別度数より度数分布表を作成せよ
量的変量の度数分布表の注意点
例えば身長を0.1cm単位で測定して度数分布表を作成しようとしたとき,全て度数は1で全体の状況の把握が出来ないケースがあるその場合ある程度の区間を設けて度数を求める
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.
「A~B」は「A以上B未満」と読む格好がスタンダードと思っていますが,分野などによって違うようです 「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように. |
階級 | 階級値 | 度数 | 相対度数 |
---|---|---|---|
130~140 | 135 | ||
140~150 | 145 | ||
150~160 | 155 | ||
160~170 | 165 | ||
170~180 | 175 | ||
計 |
結局のところ作成する目的と集計する方の知識によるところがある.
例題3-5
こちらの度数分布表の空欄埋めてください
品名 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
---|---|---|---|---|
かつ丼 | 90 | |||
カレーライス | 0.3 | 0.75 | ||
ラーメン | ||||
計 | 1.00 | ----- | ----- |
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③いままでの人生で目視で数(度数)を数えた中で最も大きかったもの(何かと 数字)
第04回 データ分析(2)データエンジニアリング
教科書4-2-3(協調フィルタリング),9-4(標本の抽出方法)MDASH_L
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-4-1】データ解析:予測、グルーピング、パターン発見、最適化、シミュレーション・データ同化など
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)
【2-1-1】データの種類(量的変数、質的変数)
エンジニア
エンジニアは技術職といわれる製品を作るための装置を設計し作成し,運用していく中で装置や作業工程など改善を重ねて品質の高い製品に
<参考>
技術士Professional Engineerとは(公益社団法人日本技術士会)
https://www.engineer.or.jp/contents/about_engineers.html
技術士とベテラン技術者の違いについて。(坂林和重の技術士試験コラム)
https://ejes.jp/column/article/380
ところで医療技術職とは?
厚生労働省編職業分類においては「04 医療・看護・保健の職業」の中に「医療技術者」が示されている021 医師、歯科医師、獣医師、薬剤師
021-01 医師 021-02 歯科医師 021-03 獣医師 021-04 薬剤師022 保健師、助産師
022-01 保健師 022-02 助産師023 看護師、准看護師
023-01 看護師・准看護師(病院・診療所) 023-02 看護師・准看護師(介護施設) 023-03 看護師・准看護師(訪問看護) 023-99 その他の看護師・准看護師024 医療技術者
024-01 診療放射線技師 024-02 臨床工学技士 024-03 臨床検査技師 024-04 理学療法士 024-05 作業療法士 024-06 視能訓練士 024-07 言語聴覚士 024-08 歯科衛生士 024-09 歯科技工士参考
厚生労働省編職業分類(令和4年改定)(ハローワークインターネットサービス 厚生労働省)
https://www.hellowork.mhlw.go.jp/info/mhlw_job_info.html
例題4-1
「04 医療・看護・保健の職業」の中において「医療技術者」が担っている技術について考えよ
データエンジニア
データそのものを利活用できるよう整備する役割整備するための仕組みを作ったり,利活用するための環境整備を行ったり
<参考>
エンジニアリングとは(千代田化工建設)
https://www.chiyodacorp.com/jp/recruit/graduate/business/about.html
データエンジニア(jobtag 厚生労働省)
https://shigoto.mhlw.go.jp/User/Occupation/Detail/523
大学における医療人の養成(医学・歯学・薬学・看護学等)(文部科学省)
https://www.mext.go.jp/a_menu/koutou/iryou/1326073.htm
ICT化以前
記録は明確な目的の達成のための行うという考え方→一次利用例)診療録(いわゆるカルテ)
診療録
診療録=カルテと一般的に表記されるが法令などではすべて「診療録」
診療録は医師法(資格法)において義務が定められているのがポイント(医療機関の話=医療法ではない)
医師法第24条 医師は、診療をしたときは、遅滞なく診療に関する事項を診療録に記載しなければならない。
同 第2項 前項の診療録であつて、病院又は診療所に勤務する医師のした診療に関するものは、その病院又は診療所の管理者において、その他の診療に関するものは、その医師において、五年間これを保存しなければならない。
医師法で定めている理由としては、ともかく医療行為を行ったことの記録(というレベル)
故にキチンと記録しないと大変なことになる
例題4-2
診療録の記載が法律で定められている理由は?
ICTを利活用する時代において
一次利用を目的としたデータ取得や活用に加えて二次利用が行われるようになったデータクレンジング
得られたデータを綺麗にすること表記ゆれ,誤入力,指定された場所以外への記入
データ収集の時点で防ぐには
誤入力をどのように解決するかデータそのものに起因するものである「表記ゆれ」はコード化することで無くすことできる
(例:都道府県コード)鳥取,鳥取県,とっとり県,鳥取県と島根県を混同されて誤表記されるケースを防ぐことができる
<参考>
都道府県番号(厚生労働省)
https://www.mhlw.go.jp/topics/2007/07/dl/tp0727-1d.pdf
企画展「鳥取県ができるまで」(鳥取県)
https://www.pref.tottori.lg.jp/293517.htm
決められた場所に入力されていない
入力や機械による読み込みのエラー防止(チェックデジットなど)はご存じの通りだが構造化データで,全体でズレているケースがあるが修正は可能(マークシートで一問飛ばした場合のことを考えると良い)
未然に防ぐにはリストから選ばせる方式にするなど選択させるようにするのも一案(選択肢によりどのような情報を入力するのか把握できる)
正しく入力していたとしても
例えば生年月日などは和暦,西暦など複数の形式で入力できるようにする場合がある(入力する側の負担軽減のため)データ処理にあたって揃えておく必要がある
例題4-3
以下のデータを得た.クレンジング処理を行ったうえで度数分布表を作成せよ
年度 | パリーグ優勝チーム |
2024 | 福岡ソフトバンクホークス |
2023 | オリックス・バファローズ |
\2022\ | オリックス・バファローズ |
オリックス・バファローズ | |
オリックス・バファローズ | |
R02 | 福岡ソフトバンクホークス |
2019 | 埼玉西武ライオンズ |
H30 | 埼玉西武ライオンズ |
2017 | 福岡ソフトバンクホークス |
2016 | 北海道日本ハムファイターズ |
2016 | 北海道日本ハムファイターズ |
2015 | 福岡ソフトバンクホークス |
2014 | 福岡ソフトバンクホークス |
2013 | 東北楽天ゴールデンイーグルス |
2011 | 北海道日本ハムファイターズ |
2012 | 福岡ソフトバンクホークス |
2010 | 福岡ソフトバンクホークス |
2009 | 北海道日本ハムファイターズ |
埼玉西武ライオンズ | |
北海道日本ハムファイターズ | |
2006 | 北海道日本ハムファイターズ |
2005 | 千葉ロッテマリーンズ |
2004 | 西武ライオンズ |
'03 | 福岡ダイエーホークス |
平成14 | 西武ライオンズ |
平成13 | 大阪近鉄バファローズ |
名寄せ
異なるデータベースのデータを結合すること一見簡単に思えるが意外と難しい
A病院とB医院に通院している患者さん
それぞれA病院とB病院で診察券を持っているが番号がバラバラ(例えば〇〇ポイントカードと△〇ポイントカードの番号が違うことを思えば当然
それぞれの診察券(カード)を作成時に登録した情報で寄せることはできないか?
本人であることを特定できる情報が含まれていない
取得できそうなデータ
住所→(可変)引っ越しとともに変わる
氏名→(可変)私の知り合った方を振り返ると様々なケースがある(チーム名の話と一緒)
電話→(可変)携帯電話はナンバーポータビリティで変えなくても良いようになったがそれでも
血液型→(ほぼ不変)変わるケースもある.また,測定の問題もある
生年月日→(不変)単独では特定できない
<参考>赤ちゃんの頃に検査した血液型は,大人になると変わることはありますか?(愛知医科大学)
https://www.aichi-med-u.ac.jp/hospital/sh15/sh1503/sh150303/sh15030301/sh15030301_09.html
実際には複数の属性情報を重ねて特定するしかないが結構大変
協調フィルタリング
名寄せなど出来て様々な変数を持ち且つ追跡できているデータがあれば,活用の話で何をもって一緒なグループにするか
従来のフィルタリング
個人の年齢や居住地等により学区が定められ,学齢に基づき学年が決まり学校に
健診は年齢と所属組織の職域,居住地域に基づく地域により
「社会人になられたあなたへ」というDMが某自動車会社から届いた
現在
購入履歴など個別にデータが蓄積されているので,私と似たような購入履歴の人を同じグループにして,まだ買っていないものをお勧めする
amazonや楽天など確認したのですが私の閲覧履歴に基づくものを示してきているだけですね(昔はこれ買ったお客さんは他にこのような商品を・・・だったような)
イメージとしては健診結果に基づく保健指導の対象者の話の方が具体的に想像しやすいですよね.健診データで同じような結果の人を同じグループにして・・・
それを購入履歴など個人別に大量に利活用できるようになったので・・・というところです
フィルターバブル問題は最近カバンを見すぎたりしていたのでやたらと推薦してきます
農産物直売所の件は個人単位では無いのですが,東日本大震災に被災された方々の購入履歴(POSデータ)に基づき,どのような時期にどのようなものが購入されていたのかを需要と供給の面からまとめたものです
病院は利益を追求することが目的ではありませんし(医療法),保健においても地域住民の健康の保持及び増進を目的とするものですから(地域保健法)そのような視点で社会生活から得られる情報で協調フィルタリング使えると良いなと思っています
<参考>
健診後の保健指導・健康相談(協会けんぽ)
https://www.kyoukaikenpo.or.jp/g4/cat420/r36/
災害時における農産物直売所の機能(大浦 裕二, 中嶋 晋作他農業経営2012 年 50 巻 2 号 p. 72-77)
https://www.jstage.jst.go.jp/article/fmsj/50/2/50_72/_article/-char/ja/
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③なんでこれを私にお勧めするの?と思った経験(公表しても良いエピソードで ネット販売でも店舗販売の経験でも可)
フォロー
例題4-3クレンジング後の個票の例
氏名→(可変)私の知り合った方を振り返ると様々なケースがある(チーム名の話と一緒)
電話→(可変)携帯電話はナンバーポータビリティで変えなくても良いようになったがそれでも
血液型→(ほぼ不変)変わるケースもある.また,測定の問題もある
生年月日→(不変)単独では特定できない
<参考>赤ちゃんの頃に検査した血液型は,大人になると変わることはありますか?(愛知医科大学)
https://www.aichi-med-u.ac.jp/hospital/sh15/sh1503/sh150303/sh15030301/sh15030301_09.html
実際には複数の属性情報を重ねて特定するしかないが結構大変
協調フィルタリング
名寄せなど出来て様々な変数を持ち且つ追跡できているデータがあれば,活用の話で何をもって一緒なグループにするか
従来のフィルタリング
個人の年齢や居住地等により学区が定められ,学齢に基づき学年が決まり学校に
健診は年齢と所属組織の職域,居住地域に基づく地域により
「社会人になられたあなたへ」というDMが某自動車会社から届いた
現在
購入履歴など個別にデータが蓄積されているので,私と似たような購入履歴の人を同じグループにして,まだ買っていないものをお勧めする
amazonや楽天など確認したのですが私の閲覧履歴に基づくものを示してきているだけですね(昔はこれ買ったお客さんは他にこのような商品を・・・だったような)
イメージとしては健診結果に基づく保健指導の対象者の話の方が具体的に想像しやすいですよね.健診データで同じような結果の人を同じグループにして・・・
それを購入履歴など個人別に大量に利活用できるようになったので・・・というところです
フィルターバブル問題は最近カバンを見すぎたりしていたのでやたらと推薦してきます
農産物直売所の件は個人単位では無いのですが,東日本大震災に被災された方々の購入履歴(POSデータ)に基づき,どのような時期にどのようなものが購入されていたのかを需要と供給の面からまとめたものです
病院は利益を追求することが目的ではありませんし(医療法),保健においても地域住民の健康の保持及び増進を目的とするものですから(地域保健法)そのような視点で社会生活から得られる情報で協調フィルタリング使えると良いなと思っています
<参考>
健診後の保健指導・健康相談(協会けんぽ)
https://www.kyoukaikenpo.or.jp/g4/cat420/r36/
災害時における農産物直売所の機能(大浦 裕二, 中嶋 晋作他農業経営2012 年 50 巻 2 号 p. 72-77)
https://www.jstage.jst.go.jp/article/fmsj/50/2/50_72/_article/-char/ja/
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③なんでこれを私にお勧めするの?と思った経験(公表しても良いエピソードで ネット販売でも店舗販売の経験でも可)
フォロー
例題4-3クレンジング後の個票の例
血液型→(ほぼ不変)変わるケースもある.また,測定の問題もある
生年月日→(不変)単独では特定できない
<参考>赤ちゃんの頃に検査した血液型は,大人になると変わることはありますか?(愛知医科大学)
https://www.aichi-med-u.ac.jp/hospital/sh15/sh1503/sh150303/sh15030301/sh15030301_09.html
実際には複数の属性情報を重ねて特定するしかないが結構大変
協調フィルタリング
名寄せなど出来て様々な変数を持ち且つ追跡できているデータがあれば,活用の話で何をもって一緒なグループにするか
従来のフィルタリング
個人の年齢や居住地等により学区が定められ,学齢に基づき学年が決まり学校に
健診は年齢と所属組織の職域,居住地域に基づく地域により
「社会人になられたあなたへ」というDMが某自動車会社から届いた
現在
購入履歴など個別にデータが蓄積されているので,私と似たような購入履歴の人を同じグループにして,まだ買っていないものをお勧めする
amazonや楽天など確認したのですが私の閲覧履歴に基づくものを示してきているだけですね(昔はこれ買ったお客さんは他にこのような商品を・・・だったような)
イメージとしては健診結果に基づく保健指導の対象者の話の方が具体的に想像しやすいですよね.健診データで同じような結果の人を同じグループにして・・・
それを購入履歴など個人別に大量に利活用できるようになったので・・・というところです
フィルターバブル問題は最近カバンを見すぎたりしていたのでやたらと推薦してきます
農産物直売所の件は個人単位では無いのですが,東日本大震災に被災された方々の購入履歴(POSデータ)に基づき,どのような時期にどのようなものが購入されていたのかを需要と供給の面からまとめたものです
病院は利益を追求することが目的ではありませんし(医療法),保健においても地域住民の健康の保持及び増進を目的とするものですから(地域保健法)そのような視点で社会生活から得られる情報で協調フィルタリング使えると良いなと思っています
<参考>
健診後の保健指導・健康相談(協会けんぽ)
https://www.kyoukaikenpo.or.jp/g4/cat420/r36/
災害時における農産物直売所の機能(大浦 裕二, 中嶋 晋作他農業経営2012 年 50 巻 2 号 p. 72-77)
https://www.jstage.jst.go.jp/article/fmsj/50/2/50_72/_article/-char/ja/
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③なんでこれを私にお勧めするの?と思った経験(公表しても良いエピソードで ネット販売でも店舗販売の経験でも可)
フォロー
例題4-3クレンジング後の個票の例
<参考>赤ちゃんの頃に検査した血液型は,大人になると変わることはありますか?(愛知医科大学)
https://www.aichi-med-u.ac.jp/hospital/sh15/sh1503/sh150303/sh15030301/sh15030301_09.html
実際には複数の属性情報を重ねて特定するしかないが結構大変協調フィルタリング
名寄せなど出来て様々な変数を持ち且つ追跡できているデータがあれば,活用の話で何をもって一緒なグループにするか従来のフィルタリング
個人の年齢や居住地等により学区が定められ,学齢に基づき学年が決まり学校に健診は年齢と所属組織の職域,居住地域に基づく地域により
「社会人になられたあなたへ」というDMが某自動車会社から届いた
現在
購入履歴など個別にデータが蓄積されているので,私と似たような購入履歴の人を同じグループにして,まだ買っていないものをお勧めするamazonや楽天など確認したのですが私の閲覧履歴に基づくものを示してきているだけですね(昔はこれ買ったお客さんは他にこのような商品を・・・だったような)
イメージとしては健診結果に基づく保健指導の対象者の話の方が具体的に想像しやすいですよね.健診データで同じような結果の人を同じグループにして・・・それを購入履歴など個人別に大量に利活用できるようになったので・・・というところです
フィルターバブル問題は最近カバンを見すぎたりしていたのでやたらと推薦してきます
農産物直売所の件は個人単位では無いのですが,東日本大震災に被災された方々の購入履歴(POSデータ)に基づき,どのような時期にどのようなものが購入されていたのかを需要と供給の面からまとめたものです
病院は利益を追求することが目的ではありませんし(医療法),保健においても地域住民の健康の保持及び増進を目的とするものですから(地域保健法)そのような視点で社会生活から得られる情報で協調フィルタリング使えると良いなと思っています
<参考>
健診後の保健指導・健康相談(協会けんぽ)
https://www.kyoukaikenpo.or.jp/g4/cat420/r36/
災害時における農産物直売所の機能(大浦 裕二, 中嶋 晋作他農業経営2012 年 50 巻 2 号 p. 72-77)
https://www.jstage.jst.go.jp/article/fmsj/50/2/50_72/_article/-char/ja/
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③なんでこれを私にお勧めするの?と思った経験(公表しても良いエピソードで ネット販売でも店舗販売の経験でも可)
フォロー
例題4-3クレンジング後の個票の例
年度 | パリーグ優勝チーム |
2024 | 福岡ソフトバンクホークス |
2023 | オリックス・バファローズ |
2022 | オリックス・バファローズ |
2021 | オリックス・バファローズ |
2020 | 福岡ソフトバンクホークス |
2019 | 埼玉西武ライオンズ |
2018 | 埼玉西武ライオンズ |
2017 | 福岡ソフトバンクホークス |
2016 | 北海道日本ハムファイターズ |
2015 | 福岡ソフトバンクホークス |
2014 | 福岡ソフトバンクホークス |
2013 | 東北楽天ゴールデンイーグルス |
2012 | 北海道日本ハムファイターズ |
2011 | 福岡ソフトバンクホークス |
2010 | 福岡ソフトバンクホークス |
2009 | 北海道日本ハムファイターズ |
2008 | 埼玉西武ライオンズ |
2007 | 北海道日本ハムファイターズ |
2006 | 北海道日本ハムファイターズ |
2005 | 千葉ロッテマリーンズ |
2004 | 西武ライオンズ【埼玉西武ライオンズ】 |
2003 | 福岡ダイエーホークス【福岡ソフトバンクホークス】 |
2002 | 西武ライオンズ【埼玉西武ライオンズ】 |
2001 | 大阪近鉄バファローズ |
病院間の診療情報の共有

第05回 データ分析(3)データ駆動型社会
教科書1-1-2(読み,書き,そろばん,データサイエンス),1-2-3(データサイエンスを学ぶ心構え),3-1-1(情報はいつから利用できるようになったのか),3-2(Society5.0に向けた情報利活用の課題と対策),3-3(情報利用による課題と変革例)MDASH_L
【1-1-1】ビッグデータ、IoT、AI、生成AI、ロボット
【1-1-3】第4次産業革命、Society 5.0、データ駆動型社会
【1-1-6】データを起点としたものの見方、人間の知的活動を起点としたものの見方
【1-3-1】データ・AI活用領域の広がり(生産、消費、文化活動など)
【1-3-2】研究開発、調達、製造、物流、販売、マーケティング、サービスなど
【1-3-3】仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
【1-3-4】対話、コンテンツ生成、翻訳・要約・執筆支援、コーディング支援など生成AIの応用
私たちの日常におけるデータ駆動
テストの点が悪かった→入塾体験人間がデータにより状況把握し意思決定していた世界
データ駆動型社会とは
データ駆動型社会は,様々な事柄がデータ化されており,多種多様なデータを分析し意思決定する世界データ駆動型の対局にあるのが「KKD」
<参考>勘と経験と度胸に依存しすぎて混乱に陥った工場(日経XTECH)
https://xtech.nikkei.com/atcl/nxt/column/18/00578/00048/
例題5-1 データ駆動型とKKDの利点と欠点をそれぞれ考えよ.そしてどのように組み合わせたらそれぞれの良さを融合することができるか考えよ
産業革命
産業革命により社会は変わる.光と影の側面があるまた,環境により要因が重なると物事が進む→産業革命が起こる前のイギリスの状況
<参考>
イノベーションの歴史(清水洋 科学技術イノベーション政策の科学コアコンテンツ)
https://scirex-core.grips.ac.jp/index#sec5
第3節 イノベーションの歴史(平成28年度国土交通白書)
https://www.mlit.go.jp/hakusyo/mlit/h28/index.html
https://www.mlit.go.jp/hakusyo/mlit/h28/hakusho/h29/html/n1131000.html 第2章 新たな産業変化への対応(第1節)(第1節 第4次産業革命のインパクト 日本経済2016-2017 内閣府)
https://www5.cao.go.jp/keizai3/2016/0117nk/n16_2_1.html
医療DX
保健医療の領域においても過去から現在まで進化してきた.現在は「医療DX」として保健医療介護分野においてもICTを用いた新しい形態に変化しつつある
過去においても情報通信技術が発展して社会と同様に保健医療分野もその恩恵を得ていたものの,現実となるには時間を要したように思う
過去に描かれた近未来の医療現場
ホームドクター2006-近未来の地域医療-(第23回日本医学会総会1991京都)https://www.youtube.com/watch?v=5Fy17NuNG_k
令和6年度診療報酬改定の概要 医療DXの推進(厚生労働省)
https://youtu.be/KDcYC6YOK4M?si=SB1SCAnYD20hRd2j
<参考>医療DXについて(厚生労働省)
https://www.mhlw.go.jp/stf/iryoudx.html
医療現場におけるデータ駆動
医療現場では様々な意思決定が様々な形で取得されたデータに基づいて意思決定がなされている.技術の進歩により人体より得られるデータも同様に進歩している
その中の医用画像の領域では取得したデータを元に再構成することで意思決定に貢献しているものにCT画像がある.
CT(コンピューター断層撮影)
前から撮影せずに横から撮影して,人体の断面の画像を作成する行っている計算は空白の部分に入っている数値を計算して求める.パズルのようなもの
例題5-2 以下は被験者から得たもので横断するマス内に存在する物質の量を測定した結果である.次の各マスに入る数字を求めよ
A | B | |
---|---|---|
1 | ||
2 |
A2+B2=7
A1+A2=5
B1+B2=8
A1+B2=6
A2+B1=7
<参考>
X線CT 第1回:画像形成の原理,装置開発の現状(齊藤泰男 Medical Imaging Technology/27 巻 (2009) 3 号)
https://www.jstage.jst.go.jp/article/mit/27/3/27_200/_article/-char/ja/
例題5-3 実際に生体に対して測定する場合,5-2のような計算だけで画像を形成することは事実上困難です.どのような問題があるからでしょうか?
提出課題
講義を振り返り①理解できた内容②理解できなかった内容③上手くいく予定だったのに見立てから外れて上手くいかなかったときの話(公表しても良いエピソードで)
フォロー
第06回 データ分析(4)AI
教科書2-1(AIによる共助の推進),2-2(AIに代替される経験値),2-3(AIが描く画像),2-4(AIと人間の共同作品),5-1(人工知能技術の成長と限界),5-2(生活の中のAI),11-2(AIの登場と進化),12(AIによる生活のアップデート),13(AIによる社会のアップデート),15-2(AIと労働問題)MDASH_L
【1-1-4】複数技術を組み合わせたAIサービス
【1-1-5】人間の知的活動とAIの関係性
【1-4-4】特化型AIと汎用AI、今のAIで出来ることと出来ないこと、AIとビッグデータ
【1-4-5】認識技術、ルールベース、自動化技術
【1-4-6】マルチモーダル(言語、画像、音声 など)、生成AIの活用(プロンプトエンジニアリング)
【1-5-2】流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
【1-6-1】AI最新技術の活用例(深層生成モデル、強化学習、転移学習、生成AIなど)
【1-6-2】AI等を活用した新しいビジネスモデル(シェアリングエコノミー、商品のレコメンデーションなど
【1-6-3】基盤モデル、大規模言語モデル、拡散モデル
AIが紡ぎ出す『言葉』は人間の心に響くの?SNSで炎上しない『言葉』とは?現代社会での『言葉』の使い方を歌人の視点で考察【ゲスト:俵万智】2025年5月7日(【公式】大竹まこと ゴールデンラジオ!)
第07回 科学技術と社会(1)情報セキュリティ
教科書6-1(情報セキュリティの要素),6-2(暗号資産のセキュリティ),6-3(情報の流出)MDASH_L
【3-2-1】情報セキュリティ:機密性、完全性、可用性
【3-2-2】匿名加工情報、暗号化、パスワード、悪意ある情報搾取
【3-2-3】情報漏洩等によるセキュリティ事故の事例紹介
【3-2-4】サイバーセキュリティ
第08回 科学技術と社会(2)ELSI
教科書5-2(生活の中のAI)11-3(データやAIを扱うときの注意点),14(秩序あるデータの重要性),15-1(データサイエンスのこれから),15-3(デジタル・シティズンシップの重要性)
MDASH_L
【3-1-1】ELSI(Ethical, Legal and Social Issues)
【3-1-2】個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト
【3-1-3】データ倫理:データのねつ造、改ざん、盗用、プライバシー保護
【3-1-4】AI社会原則(公平性、説明責任、透明性、人間中心の判断)
【3-1-5】データバイアス、アルゴリズムバイアス
【3-1-6】AIサービスの責任論
【3-1-7】データガバナンス
【3-1-8】データ・AI活用における負の事例紹介
【3-1-9】生成AIの留意事項(ハルシネーションによる誤情報の生成、偽情報や有害コンテンツの生成・氾濫 など)