関西医科大学 情報活用論2024
(看護学部看護学科)

シラバス上で
事後学修:講義を振り返り①感想②不明な部分③理解した部分④その他コメントを簡潔にまとめ講義サイトより提出の事(30分程度)
としている部分ですが
事後学修:講義を振り返り「提出課題」について講義サイトより提出の事(30分程度)
と読み替えてください

2024年度開講にあたって
https://medbb.net/education/2024init/
困った時,オンラインでのサポートやなにかありましたら以下からご連絡ください
私へ連絡・オンラインオフィスアワー予約

課題提出は以下のフォームから
https://forms.gle/X45963h4PVqMn2hs8

授業メニュー



第01回 情報とデータ

第02回 データ通信

第03回 データ収集

第04回 データ分析(1)データの特性

第05回 データ分析(2)データクレンジングと名寄せ

第06回 データ分析(3)データ駆動型社会

第07回 データ分析(4)研究におけるデータ

第08回 データ分析(5)AI

第09回 科学技術と社会(1)情報セキュリティ

第10回 科学技術と社会(2)ELSI

第01回 情報とデータ

教科書4章-1
DSliteracy
【1-2-2】1次データ、2次データ、データのメタ化
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-2-4】データ作成(ビッグデータとアノテーション)

情報とは

戦争に関する本で翻訳する時の森鴎外による造語とされる
20200911-12.png(352004 byte)

情報とデータと知識

データ

ノイズとして認識しなかった事柄の記録
発生するデータは受診特性に依存する.
一次データと二次データに分けられる
 一次・・・対象からダイレクトに取得
 二次・・・既に記録されたもの。まとめられたもの

情報

データに意味を付与したもの
情報化にあたって受信者の特性に依存する.

知識

情報を体系化したもの。
受信者の知性に依存する.
その時点での受信者の知識によるところが大きい

joho20150613-6.png(111907 byte)
よりよい医療に貢献する医療情報技師の役割 より)

データのメタ化

データには情報にするために他のデータも付加される場合もあるが,作成時に自動的に発生し埋め込んでいるデータもある → メタデータ
例えばだれが作成したのか,何処で撮影されたのかなどなど
メタ化とは,データに様々な情報(二次データ)が付加され具体的な事実から抽象的な解釈に向かっていく過程
テキストデータに医用画像の位置情報を付与して表示させた例
huhmacollab2018-13.png(298843 byte)
産学官連携マネジメント論2018(分担:地域医療と産学官連携)より
例題1
なぜ一夜漬けの勉強が否定されるのか,データと情報と知識の関係性を念頭にして自身の考えを述べよ

社会生活における情報量

コンピュータで取り扱うデータは情報の量の考え方でデジタル化されている

情報の量

bit:シャノンの情報理論
AなのかAじゃないのか?明確に指定できる情報・・・1bit
事象の起こる確率によって決まる。確率の低い事象を確定する情報ほど大きくなる
I=-logP 事象の起こる確率によって情報の量が決まる
それぞれの事象の起こる確率が等しいならば選択肢の数(T)に書き換えると I=logT → 何が起こるのか想定しないと情報は取り扱えない・・・想定外の事象の情報量は計算できない(無限大)

デジタルの世界では1と0の情報の組み合わせであらゆるデータを取り扱っている
(但しデータの定義が必要)
情報量が大きいほどより細かい事柄を表現できる
kmuiutil2024-0101.png(308133 byte)

情報量の定義

yes/Noを区別(選択肢2つから1に)させる情報・・・1bit

選択肢4つから1にさせる情報・・・2bit
選択肢8つから1にさせる情報・・・3bit
選択肢は2のるい乗(べき乗)になる。

対数(log)・・・るい乗(べき乗)を求めることが出来る→選択肢から情報量を求められる

デジタルデータはこの考え方に基づきアナログなものもデジタルデータとして取り扱っている

数値

コンピュータは2進数の世界なので10進数の世界と馴染みにくいところがある.

デジタルの世界の補助単位

補助単位はキリのいい数字・・・切りの良い数字とは?
十進数の世界ち二進数の世界のキリのいい数字は異なる
十進数 10 二進数 1010
十進数 16 二進数 10000

K→M→G
十進数は1000
二進数は2^10=1024≒1000
キロ・・・kとK
nmumedinfo2020-0216.png(371330 byte)

例題1-2
十進数の100を二進数で示すとどのようになるか
二進数は長ったらしいので16進数が一般に使われている.

画像の情報量

光の3原色・・RGB
それぞれ256階調とすると、一色8bit
3色で8×3で24bit

情報量はマス目(ピクセル)数×1マス(ピクセル)あたりの情報量
1マスあたりの情報量は白黒だったら1bit.灰色なども考えると・・・.カラーになると光の三原色・・・

nmumedinfo2020-0212.png(347362 byte)
色深度(bpp)
1bit
2bit
3bit

文字の情報量

用いる文字の種類の数によって決まる
英数字・・・7bit
+カナ・・・8bit=(1byte)半角文字

漢字は倍の2byte(全角文字)

情報量は文字数×1文字あたりの情報量

(余談)ローマ字「ん」の後ろにbmpが来る場合、nではなくmで表記(ヘボン式)namba(なんば)

授業1回目ここまで 課題は提示した内容で

音の情報量

空気の振動(粗密波)
Hz

人間の可聴域は20Hz~20kHz
サンプリング定理:元の周波数の2倍以上でサンプリングすれば再現できる
<参考>標本化定理(サンプリング定理)とは(制御工学の基礎あれこれ)
http://arduinopid.web.fc2.com/M34.html

(余談)超音波とは可聴域を超えたところの周波数の音波・・・故に人には聞こえない(ハズ)

サンプリング周波数・・・どのぐらいの周期で音信号をひらっているか・・・CDは44.1kHz

情報量は音信号の情報量(16bit×2チャンネル=4byte)×1秒あたりのサンプリング数×曲の長さ(秒数)

nmumedinfo2020-0215.png(376901 byte)
(参考)なぜ650MBのCD-Rに74分の音楽が記録できるのでしょうか?
http://okwave.jp/qa/q2070273.html

提出課題
事後学修:講義を振り返り①感想②不明な部分③理解した部分④その他コメントを簡潔にまとめ講義サイトより提出の事(30分程度)

皆様のご意見など

①感想
舘ひろしが面白かったです。 リアクション薄いと思ったのですが良かったです
高校で学んだ内容とかぶっていることもあったので復習になりました お楽しみいただけてなによりです
公式をそのまま覚えるのではなく、どうしてそうなるのかを教えてもらえて理解がしやすく楽しかった。情報だけど看護につながっているところを知れて面白かった。 覚えていることは忘れますが理解は定着
思っていたより複雑そうでテストなどが不安ですが、説明が面白くて授業は楽しかった 少しの不安が楽しさを倍増させる
高校の時にも情報の授業はあったけど、その内容とはまた異なる内容の授業 今後の内容の部分を主にされていたのかな?
文字の情報量において、英数字よりカナのほうが多いことに驚いた。 正確に言うと 英数字より英数字カナ(いわゆる半角文字)のほうが多いとなります
高校の情報の授業では、情報についての知識を学べるような内容は少なかった ベースの知識がしっかりしないと理解が浅くなるのと,実空間とは異なる空間での出来事なので入り口を丁寧にと
私は十字路と言っていた人だから丁字路が正しいと知り 現在ではT字路も正しいと思いますが,由来や経緯を知っておくことで人は優しくなるように思います.
②不明な部分
漢字をbitであらわすとは 英数文字カナと同様
一夜漬け否定の理由 試験に向けての解釈になるので使える知識になりにくい
コツコツと勉強した場合と異なり、データの取り込みになってしまい、それが情報、知識として自分なりに消化されていかないからだと考えました。 その理解で良いです
色彩について 文字を表わす場合は想定される文字の中から一つチョイスする格好ですが,色の場合は16777216色(24bit)の中から1マスごとに色を選び塗りつぶしている
選択肢が2の倍数の時のbitの求め方はわかりましたが、選択肢が3つなどの2の倍数以外の時のbitの求め方がわからなかった。 bitはYes/Noの世界なので 3つの場合はデジタルでは2bit使う形.計算するとlog23=1.585 となります
なぜ十字路が2ビットになるのか 注文するときにメニューが4種類の中から選ぶのと16種類の中から選ぶのでは後者の方が悩むわけで,情報量は提供することそのものではなく,至るまでの選択する苦労を評価したもの
データのメタ化 対象とするデータに関連するデータを紐づけ(埋め込んだり)していくこと.
情報量については理解しにくかったです。 人間側から見ると理解しにくい部分もあるかと.人間の思考とは違うように思いますが 全てyes/Noを組み合わせて人が扱っている情報を表現しようというところですので
10進数を2進数にする計算が難しい 12進数や60進数は慣れているかと思いますが,2進数も慣れると桁が多すぎてあきれる程度の感覚になればと思います
二値ひろしが多値ひろしに比べて色が少なく見えるのはどうして 多値ひろしはフルカラー(だと思うので)RGB3色それぞれ8bitで表現していますが二値ひろしはモノクロで中間色使わないのでRGB(255,255,255)とRGB(0,0,0)の2種類の色で表現してます(ハズです)
③理解した部分
概ね良好な感じと思います.
情報量が多くなるほどアナログに近づく
ある物事が起こる確率によって情報量は変わり、その物事が複雑であればあるほどより多くの情報量が必要
④その他コメント
一次データは自分で作り上げたノートのようで、二次データは他の人が作ったノートをもらったようだという説明が理解しやすかった
3bitではそれぞれの色が異なるが4bitでは色が異なるだけではなく、さらに彩度に磨きがかかるのかどうか 鋭いですね RGB3色の話をしましたが,もう8bitを色ではなく透明度にあてて表現しているケースが多いかな

第02回 情報化社会(1)通信

情報の活用に必要な事柄

情報の収集→分析→成果→提供→活用

古代

のろし,音,口伝え
到達距離に限界がある
口伝えは伝言ゲームになってしまう
人の移動距離に限界がある(時間もかかる)
<参考>意外と古い!? 可視光通信の歴史(可視光通信研究倶楽部(カシケン)
https://www.kashikou.jp/kashikou/post-20/

紙時代

記録媒体を輸送(通信したものが形で残る)
情報をモノ(メディア)に記録させてそれを運ぶ・・・時間がかかる

データ通信時代

モールス信号は文字を電気信号に置き換えて送信
FAXは紙をスキャンし電話回線で送れる(文字以外に絵も送れる)
デジタルデータ・・・メディアに依存しないので様々な情報を送れる
<参考>通信の歴史(5G全解)
https://contest.japias.jp/tqj23/230354T/telecommunication_history.html

インターネット

昔のパソコン通信は限られた世界の中
世界中の様々なデジタルネットワークがつながった
mte20230316-09.png(372125 byte)
災害時における情報通信と保健医療(開催趣旨)より

世の中のネットワーク

ネットワークとは

繋がり(ノードとエッジの関係)
世の中には様々な繋がりがある
人間関係・・・様々な情報が集まる
(余談)私のブログ・・・弱いこともいいことだ(御卒業おめでとうございます)・・・当時の卒業生へのメッセージ
http://medbb.exblog.jp/19464438/

電話(音声通信)ネットワーク・・・無線化(携帯電話)により開発国で整備が進む
高速道路ネットワーク
航空ネットワーク・・・ハブ空港の存在
ヨーロッパを舞う飛行機ルートを可視化
東京駅から日本全国への「到達所要時間マップ」 - Yahoo! JAPANビッグデータレポート
テレビ局ネットワーク・・・各系列が広範囲に情報を
(余談)腸捻転
https://ja.wikipedia.org/wiki/%E8%85%B8%E6%8D%BB%E8%BB%A


コンピューターネットワーク・・・様々な情報(文字・音・写真・音楽・映像)を流せる
インターネット・・・ネットワークとネットワークが繋がって形成(蜘蛛の巣状)・・・スケールフリーネットワーク →故障に強いが、攻撃には弱い

インターネット上で様々な(人的)ネットワークが作られている・・・LINE Facebook Twitter Mixi etc.

電話回線にも規格が決められているようにインターネットでも規約がある・・・プロトコル

通信速度

bps(秒あたりの情報量)・・・距離は関係ない
1200bps・・・1秒当たり全角(日本語)75文字を伝えることができる
(私が最初に経験した300bpsの時代は1秒当たり20文字・・・一行40文字とすると2秒かかってしまう)
携帯電話にみる通信速度の変遷
アナログの世界(通話)→デジタルの世界(通信)
アナログ携帯(第1世代)の通信速度(通話のみ)
https://www.youtube.com/watch?v=EpxmB1e0FKA
デジタル携帯(第2世代(PDC))の通信速度(2400bps→9600bps)
https://www.youtube.com/watch?v=SI8nRqGZt2A
https://youtu.be/InnZUrTA1X8
https://youtu.be/mTtURP7HF0o
https://youtu.be/0xuFwKEfbdM?si=yvoNcTSncJv8ApMc
デジタル携帯(第2.5世代cdmaOne)の通信速度(64kbps)
https://www.youtube.com/watch?v=djvB1pGaaDc
デジタル携帯(第3世代VGS/FOMA)の通信速度(7.2Mbps/384kbps)
https://www.youtube.com/watch?v=7V1E6QKJIvE
デジタル携帯(第3.9?世代4G-LTE)の通信速度(110Mbps/10Mbps)
https://www.youtube.com/watch?v=VJg3AfXKSkE
デジタル携帯(第5世代5G)の通信速度(10Gbps)
https://www.youtube.com/watch?v=0VzkgnMX9t0
一気に振り返る動画
https://www.youtube.com/watch?v=UcLyd1otlI8
例題2-1
1)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は100%とする)
2)1Mbyteのデータを1Mbpsの回線で転送するときにかかる時間は?(ネットワークの伝送効率は20%とする)
提出課題
事後学修:講義を振り返り
①通信速度の向上が社会にどのような変化をもたらしたのか,考えよ
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

皆様のご意見など

4名ほど提出までに時間がかかっていたのでご注意を
次回から締め切りを授業日翌日の午前10時00分までに未提出は減点します
①通信速度の向上が社会にどのような変化をもたらしたのか
電話で通話ができるだけだったものが、インターネットメールであらゆるところに向けてメールを送信できるようになった 今では通話することが主ではなく、それ以外の機能が付随していくようになった電話機が情報通信機器になったというところですよね
昔のCMを見た時に私の中では携帯は話すものという認識が低かったため、驚きました。昔から来た人ですが,携帯電話は電話と思っていました
通信環境が良くなって、リモート会議などができるようになったり、オンライン授業ができるようになった。コロナ禍において法的な整備(著作権)が追い付いていなかったけど,スタートした感があります.通常の手続きとは異なる不連続な展開でした.
通信速度向上は私達に情報を与えてくれる反面、考える力を奪っていったと考えます。しかし、受験の時は、賢い人の考え方を共有してもらえるので勉強面ではいい影響があると考えます。ですからインターネットの普及は私達に必要だったと思います。社会に「答え」は存在しておらず状況に応じて妥当なものを示せるかが重要になります.故に物事を理解する過程をどれだけ経験して身につけられるかなのでしょう.考える人と考えない人の格差が広がっているように思います
通信速度が向上することによって、便利なことも多くなり、社会の流れがより一層早く、物事が効率よく進むようになったと思う。しかし、人と人との関わりが減り、自分自身で行動することが大切になってきたと思う。仰る通り
データ通信のやりとりに遅延が発生しない→車の自動運転が可能になる 無線で作業を行える(工場など)技術の進展次第ですが頭の中に思い浮かべたことが瞬時にディスプレイに表示されたり音が鳴り始める時代がくるのでしょうね
通信速度の向上は社会に人間関係の希薄化をもたらしたと考えます。そうですよね.医療従事者においても実空間の世界が重要なのでどのように向き合ってより良い環境にするのかがポイントでしょう.
②その他コメント
講義の最後に取り組んだ問題が最初は難しいと感じたが、基本的なことを抑えて計算していくと意外と理解でき、慣れが必要だと感じた。理解力はそれまでの取り組みに伴って上昇していくように考えています.良かったです
理解が難しいです。定期試験はどのような形式ですかすみません 未定です そもそもbyteやbit自体の意味はどんなものなんだろうと気になったので教えていただきたいです。bitは情報量の考え方に基づくもの.byteは8bit=1byte としています

第03回 情報化社会(2)データ収集

教科書3-1-2(ビッグデータ),4-1-2(あれもこれもデータサイエンス),4-2(販売データ),4-3(協調フィルタリング),4-4(データの活用が生み出す新しい価値),9-4(標本の抽出方法)
DSliteracy
【1-1-2】データ量の増加、計算機の処理性能の向上、AIの非連続的進化
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-2-5】データのオープン化(オープンデータ)
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)

ビッグデータ

総務省情報通信白書より
出典 平成24年版情報通信白書
ビッグデータは、どの程度のデータ規模かという量的側面だけでなく、どのようなデータから構成されるか、あるいはそのデータがどのように利用されるかという質的側面において、従来のシステムとは違いがあると考えられる。
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
平成24年版情報通信白書を加工して作成
ビッグデータの種別に関する分類は・・・政府:国や地方公共団体が提供する「オープンデータ」,企業:暗黙知(ノウハウ)をデジタル化・構造化したデータ,企業:M2M(Machine to Machine)から吐き出されるストリーミングデータ,個人:個人の属性に係る「パーソナルデータ」
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h29/html/nc121100.html

当初はデータの大きさの話も含めていたが,利活用を念頭においた上で特に量的な話よりも質的な話が中心
平成24年は何が出来るのか手探りだった感
データを資産と考えると,お金を持っていても何にも使えないのであれば実質的な恩恵は得られない
同様にデータも大量に保有していても何にも使えないのであれば実質的な恩恵は得られない
例題3-1
情報(データ)の持ち腐れについて公表されてもかまわない程度で答えよ
https://forms.gle/d9E8GuD2PNZsCPGH8
私は大学の時の教科書(かなり高価かつ授業であまり使わず美品)を持っていたが何ら使うことはなかった(泣く泣く処分)
ビッグであることそのもので,何か新しい知見が勝手に出てくるわけではない.それは次回以降の話

身近にあふれるデータ(生活者)

個人に関する生活するうえでの事柄を記録したデータ

銀行での振り込み等
〇〇payの購入記録
SMSでの連絡記録

個人が社会に対して提供したデータ

昔はマスメディアなどを通じないと広く提供することが出来なかった
広告メディアなども,一昔前と今ではかなり変わった感がある
出典 平成20年版情報通信白書
パソコンや携帯電話が、これまで4大マスメディアが果たしてきた役割を担うようになったのだろうか
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h20/html/k1323000.html
4マスそれぞれの業種別広告費前年比から広告主の姿勢をさぐる(2024年公開版)(不破雷蔵 Yahooニュース)
https://news.yahoo.co.jp/expert/articles/2e4c709966725f36666986dcfb9d7005a6307d99

社会が個人に対して提供したデータ

昔は通信回線数(チャンネル数)に限界があったので,個別のニーズに沿った情報提供は困難だった
朝の番組の天気予報コーナーで,週末のピンポイント天気予報のリクエスト(運動会とか,旅行とか,ゴルフとか)に答えていた記憶がある.
情報の伝え方も進歩したことに加えて,個人が情報をチョイスする仕組みもあり,雨雲レーダーもスマホで確認できる
ニュースリアルタイムの裏側に潜入!(中京テレビ)
https://www.ctv.co.jp/announce/2009/spot/0520/index04.html

以前なら社会に依頼しないと得られない個人のデータ

その昔は,写真などは撮影しただけでは見ることが出来ず,現像処理が必要だが個人でしていた人はお一人知っている程度
今は,スマホでそのまま見ることができるようになり,スポーツなどでの自分の動き方も確認できるようになってきた.
JavaScriptで画像から「重心移動」「回旋角」を簡単に計測パソコンやスマホだけで投球フォーム分析(谷岡広樹 ログミーTech)
https://logmi.jp/tech/articles/325347

社会にあふれるデータ(顧客の)

個人に関する生活するうえでの事柄を記録したデータ

小売店での販売データは,顧客(個人)のものであるが同時に小売店側も取得するデータである
その個人を紐づけていく事が出来たら,対象者に寄り添った販売が可能
POSデータとは?その定義やデータの種類からPOSデータの活用例を解説(NECソリューションイノベータ)
https://www.nec-solutioninnovators.co.jp/ss/retail/topics/pos-data/
支部大会奨励賞:田井紗瑛子さん 論文名:「ID-POSデータを用いた非会員顧客の年齢と性別の推定」(学部4年)(コミュニケーションデザイン研究室(吉野研究室)和歌山大学)
https://web.wakayama-u.ac.jp/~yoshino/lab/d_award/tai_2022_1.html
3.11の都心における人の流動を光の流れで再現したら東京から光が消えた(GigaZine)
https://gigazine.net/news/20130111-confluence-of-0311/

データ収集の注意点

全部収集できれば良いが,コストの面から無理な場合もあればそもそも対象が増殖するのであれば全部は無理
全体をバランスよく取ることができるか(偏っていないか)
偏りなくても方法について問題はないか?
以下はデータの取得方法が変更したため影響が出た例
naracommed20190313-08.png(165744 byte)
奈良県の医療を取り巻く状況について より
さらにデータが人手を介するとエラーは必ず出ると思っていたほうが良い(だって人間だもの)
バーコードリーダーの利用はエラー低減のため(人に読ませない).
センター入試では受験生が間違えてる可能性が出てくるが不利益が出ないように,チェックデジットが使われている(バーコードも)

様々な注意点があるものの最終的に使えるようなデータであってほしい(と思って取り組んでいます)
チェックデジット 【check digit】 チェックディジット(IT用語辞典e-words)
https://e-words.jp/w/%E3%83%81%E3%82%A7%E3%83%83%E3%82%AF%E3%83%87%E3%82%B8%E3%83%83%E3%83%88.html
Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)とは?(@IT)
https://atmarkit.itmedia.co.jp/ait/articles/2010/21/news027.html

提出課題
提出期限授業日翌日の午前中10時00分まで
事後学修:講義を振り返り
①ウソの情報に騙されないようにどのようなことに注意しているか(公表できる範囲で)
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題の提出状況など

提出期限を守らなかった方・・・4件(うち2名は情報処理技術の課題?を書いている)
ウソ情報対策
ツイッターなどは基本信用せずリプ欄や引用コメントまで見て判断良い対策と思います
日本語の正確さをいつも以上に気をつける確かに言葉の使い方でわかるケース多いですよね
初めて見る情報は基本嘘と疑うこの授業に限らずですが疑いながら取り組むと理解がすすむと思います
様々な情報をみて本当に正しいかどうかを吟味確かに友人がまとめたものだけで勉強すると誤解しているケースが多いように思う
家族や友達とその情報について話してウソの情報に惑わされないようにする学びあいというのは自分で勉強した後に,その内容について意見交換しながら深めること
できる限り名前や情報源が明記されている著書を多く読む査読付き論文と査読無し論文の話
httpsがついているサイトをできるだけ見る通信を暗号化しているかどうかを示すもので,以前は仰る通りでしたが最近は安心できないものもあるかもしれません
Twitterは嘘の情報も多い気がしているので娯楽程度私も気楽な話をする場だと思っています.その中で何かのヒントや参考になることも多いので用空間です.熱い議論は似合わないように思っています
知らない電話番号からの電話も調べてから私も出ませんが,後で確認しています.特に0120など市外局番が無い系
人から聞いたことをあまり信用しない学校の先生方の仰ることは間違っていることがあるかもしれません,が先生自身については信用いただけたら幸いです
テレビの情報を確認したり、さまざまなサイトを確認する科学的な取り組み
複数のサイトを見比べる。疑問に思ったら周りの大人や友達な相談するウソ情報以外にも一般的に困った場合このような手順が妥当かなと
その他
捨ててきた教科書であったり説明書や様々なものが情報である事を知った説明書はpdfでメーカーサイトで見れるケースが多くなりましたからその場合は物理的に失っただけになりますね
日常生活の中でもち腐れの情報は思っていた以上に多かった情報過多社会ですよね.というよりもはやデータとして認識していないレベルになっている
個人のために天気予報をしていたことに驚いたリクエストの理由も含めることで季節感やら身近な出来事に感じ取れてコーナーとしては成立していました
普段考えないことを勉強するので、理解しにくいところもあるが、面白いです普段使っていることを勉強する良い機会になっていてよかったです
携帯電話の電波の分布の映像など、自分から進んでみることは無いものも授業では触れることが出来るので面白いです昔は教員所有のものをビデオテープ持ってきて・・・でしたが今はネットにある資料なら,授業後も皆さんが見れる良い時代です
テスト対策のために色々な問題をやりたいですうーん どうしましょう
チェックデジットの話をもう少し詳しくしてほしい私も本当はしたいんですけど時間取れるかな(どこかに充てれないか考えてみます)
国語辞典やCDなどはデータだが、ものはデータではないということがわかったデジタル化により情報(データ)とモノ(実空間)を分離可能にしたわけです
ビッグデータについて教科書にスマホで一日中動画を見ても300年くらい見れると書いてあって思っていたより大きくて驚いた特に時間軸を持つ形式のデータ(等時性のデータ)は人間が丁寧に理解するには再生する時間が必要なんですよね

第04回 データ分析(1)データの特性

教科書1(ようこそデータサイエンスへ),7-1(データの種類),7-3-2(データを解釈するときの注意点)
DSliteracy
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-3】構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)
【2-1-1】データの種類(量的変数、質的変数)

収集したデータがどのようなものなのか
数字だけがデータではない→文字って分析できるの?

データの種類

例題4-1
教科書1-1-1(役に立つデータサイエンスを読んで,どのような「データ」(売上とか交通量とか・・・)が登場しているのか書き出すこと
さまざまなデータがあるのか確認できたが,処理していく上で特性別に種類に分けていく事が必要

4つの尺度(7-1-1質的データと量的データ)

食事の際,質(みずみずしい,ふっくら)と量(おかわり)の二つの軸から満足している
それらをもう少し細かく分類すると4つの尺度となる

4つの尺度

世の中のデータを4つの種類で説明できる
1名義尺度(質的データ)
2順序尺度(質的データ)
3間隔尺度(量的データ)
4比尺度(比例)(比率)(量的データ)

1,2を質的変量(定性的)ともいう
3,4を量的変量(定量的)ともいう
性質としては上位互換性があり
4>3>2>1
間隔尺度と比尺度との見分け方
データ自身が負の値をとることが想定されるものは間隔尺度(引き算などで便宜上マイナスになるものはデータ自身によるものではない)
天気予報での摂氏温度(℃)の話をどのようにされているのか(過去に一回だけビックリしたことがあるけど)
nmuhlthstat1_2024-0103.png(363067 byte)
奈良県立医科大学 保健統計学I2024(医学部看護学科)より
例題4-2
以下の文章中の下線部の尺度を示せ
本日は(1)晴天なり,家族と(2)3人で車に乗り(3)イオン橿原店までドライブ.
昼食はハンバーガーチェーン店でチーズバーガーとポテト(L)を購入,ドリンクは(4)LサイズにするかMサイズにするかで悩む
昼食後車を走らせるがガソリンが少ないので(5)35リットルほど給油.
無事目的地に到着し駐車場から外に出るとなにやら(6)少し寒い,確かに気温を見ると(7)12℃と先程よりも低い
なので上着を買って帰ることにした.丁度バーゲンセールをやっている.値段は(8)3980円(9)凄く良いものを買うことが出来ました.

度数

どのようなデータでも名義尺度の性質を有している.
名義尺度は数を数える(度数)ことでのみ,量的な取り扱いが可能になる
例題4-3
以下の40名の血液型データについて度数を求めよ
nmuhlthstat1_2024-0102.png(9516 byte)

度数分布表

度数は表にすることで,全体の状況が把握しやすくなる
度数分布表はそれぞれのデータの度数(出現頻度)をまとめたもの
名義尺度の時は多い順(お作法として。但しその他を出すなら一番最後)
順序尺度以降であれば順(名義尺度でも比較のためにお作法を破ることはある)
度数  ・・・出現頻度
相対度数・・・総出現頻度を1(100%)としたときのそのぞれの度数のしめる割合
(名称) 度数 相対度数
 
 
 
1.00
例題4-4
例題4-3で求めた血液型別度数より度数分布表を作成せよ
名義尺度であっても名義そのものでカウント(度数を数える)する場合と,それまでの経緯を踏まえたとき別の名称であっても同じものとしてカウントする場合と,様々である
結局のところ作成する目的と集計する方の知識によるところがある.
提出課題
提出期限授業日翌日の午前中10時00分まで
事後学修:講義を振り返り
①いままでの人生で目視で数(度数)を数えた中で最も大きかったもの(何かと 数字)例えば私の場合は,クラスの人数を数える時で心がおれなかったもので40名程度(紙に書かずに頭の中でカウントしたもの)
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題について

高校時点の知識のバラツキが若干見られたような気がしました
大学では若干考慮して進めていくケースが多いと思いますが,社会に出りとそんなことは関係無いので,自身で不足部分を補えるようにしておいてください

楽しかった系

高校時代の数学を思い出し
た 数Aみたいで楽しかった
作業があったので楽しかった
問題はおもしろかったです
度数分布表のお作法は相手に伝わりやすいように破ってもいいのが面白い
いつもの授業内容よりはスっと理解
高校時代もやっていた内容だけど忘れていた すぐに理解できた

尺度いい感じ系

なんとなくわかった
説明を受けてある程度までわかりました
「掛け算ができるかどうか」で考えたら理解できた
例題のおかげで少し理解できました
分かりやすい順序尺度もあれば分かりにくい順序尺度もあって
どちらの尺度にも当てはまるなど、曖昧なところもあるものなのか
分類方法が難しく大変と思ったが明確な区別があり理解出来た
違いがよくわからなかったが、例題で自分で考えてみると理解できた
尺度の違いを知る事ができた

尺度苦戦系

間隔尺度と比例尺度の違いについてもう一回
間隔尺度と順序尺度の違いが分かったような分からないような
比例尺度と間隔尺度の違いが難
尺度の内容が難
聞いたものを理解するのが大変
意外と難しかった
晴天がなぜ順序なの
間隔尺度と比例尺度の違いがあまり分かりません
例題4-2改
以下の文章中の下線部の尺度を示せ
本日は(1)(快晴,晴天,曇り)なり,家族と(2)(3人,4人,5人)で車に乗り(3)(イオン大和郡山店,イオン五條店,イオン登美ヶ丘店)までドライブ.
昼食はハンバーガーチェーン店でチーズバーガーとポテトLを購入,ドリンクは(4)LサイズにするかMサイズにするかで悩む
昼食後車を走らせるがガソリンが少ないので(5)(35,30,25)リットルほど給油.
無事目的地に到着し駐車場から外に出るとなにやら(6)(少し,とても)寒い,確かに気温を見ると(7)(12,14,16)℃と先程よりも低い
なので上着を買って帰ることにした.丁度バーゲンセールをやっている.値段は(8)(3980,2980,1980)円(9)(凄く良い,まぁまぁ良い,ふつうの)ものを買うことが出来ました.

目視で数(度数)を数えた中で最も大

度数は68%程度しか回答が無かったです
(何かと 数字)なのですが,楽しいエピソードで終わっているものが大方です.一方度数(単位付き)のみのものもありました
何事もですが,提出時は再度確認してから提出するようにしたほうが良いと思います
以下二重投稿も含んでいます(粗集計)
何か(度数付き)
本,人,多数決,車,階数,枝豆,千円札,買い物の品数,テニスボール,天井の点,座席,肉団子,ピアノの鍵盤,文字数,ピン球,天井の細かい模様,アリ,千羽鶴
数字(度数)の要約
平均97.1,中央値55,最頻値50(度数12),範囲985,標準偏差137.0,四分位範囲60
kmuiutil2024-0401.png(189979 byte)
何か(度数なし)
サル,1円玉,餃子,対戦チーム数,服,天井の穴,人数,つまようじ,薬,小銭,文字,オセロのコマ,みかん,データの問題,床のタイル,豆,階数,座席,アリ,英単語,ビーズ
<注>×学部の生徒の数→〇学部の学生の数

第05回 データ分析(2)データクレンジングと名寄せ

教科書4-2-3(協調フィルタリング),9-4(標本の抽出方法)
DSliteracy
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-4-1】データ解析:予測、グルーピング、パターン発見、最適化、シミュレーション・データ同化など
【1-5-1】データサイエンスのサイクル(課題抽出と定式化、データの取得・管理・加工、探索的データ解析、データ解析と推論、結果の共有・伝達、課題解決に向けた提案)
【2-1-1】データの種類(量的変数、質的変数)

例題5-1
プロ野球 セリーグ及びパリーグの2001年~2023年のデータより優勝回数(チーム別 監督別)の度数分布表を作成せよ
(取りまとめて見せることが重要なので正解は複数あります)
年度 セリーグ優勝チーム セリーグ優勝監督 パリーグ優勝チーム パリーグ優勝監督
2023 阪神タイガース 岡田彰布 オリックス・バファローズ 中嶋聡
2022 東京ヤクルトスワローズ 高津臣吾 オリックス・バファローズ 中嶋聡
2021 東京ヤクルトスワローズ 高津臣吾 オリックス・バファローズ 中嶋聡
2020 読売ジャイアンツ 原辰徳 福岡ソフトバンクホークス 工藤公康
2019 読売ジャイアンツ 原辰徳 埼玉西武ライオンズ 辻発彦
2018 広島東洋カープ 緒方孝一 埼玉西武ライオンズ 辻発彦
2017 広島東洋カープ 緒方孝一 福岡ソフトバンクホークス 工藤公康
2016 広島東洋カープ 緒方孝一 北海道日本ハムファイターズ 栗山英樹
2015 東京ヤクルトスワローズ 真中満 福岡ソフトバンクホークス 工藤公康
2014 読売ジャイアンツ 原辰徳 福岡ソフトバンクホークス 秋山幸二
2013 読売ジャイアンツ 原辰徳 東北楽天ゴールデンイーグルス 星野仙一
2012 読売ジャイアンツ 原辰徳 北海道日本ハムファイターズ 栗山英樹
2011 中日ドラゴンズ 落合博満 福岡ソフトバンクホークス 秋山幸二
2010 中日ドラゴンズ 落合博満 福岡ソフトバンクホークス 秋山幸二
2009 読売ジャイアンツ 原辰徳 北海道日本ハムファイターズ 梨田昌考
2008 読売ジャイアンツ 原辰徳 埼玉西武ライオンズ 渡邉久信
2007 読売ジャイアンツ 原辰徳 北海道日本ハムファイターズ ヒルマン
2006 中日ドラゴンズ 落合博満 北海道日本ハムファイターズ ヒルマン
2005 阪神タイガース 岡田彰布 千葉ロッテマリーンズ バレンタイン
2004 中日ドラゴンズ 落合博満 西武ライオンズ 伊東勤
2003 阪神タイガース 星野仙一 福岡ダイエーホークス 王貞治
2002 読売ジャイアンツ 原辰徳 西武ライオンズ 伊藤春樹
2001 ヤクルトスワローズ 若松勉 大阪近鉄バファローズ 梨田昌考
データを取りまとめるのは難しいと感じたことでしょう.
その領域の状況を知らないと妙な集計になってしまいます → 対象とする領域について状況を理解する必要がある

データクレンジング

得られたデータを綺麗にすること
表記ゆれ,誤入力,指定された場所以外への記入

データ収集の時点で防ぐには

誤入力をどのように解決するか
表記ゆれ
データそのものに起因するものはコード化することで揺れを無くすことができる
(例:都道府県コード)鳥取,鳥取県,とっとり県,鳥取県と島根県を混同されて誤表記されるケースを防ぐことができる
<参考>
都道府県番号(厚生労働省)
https://www.mhlw.go.jp/topics/2007/07/dl/tp0727-1d.pdf
企画展「鳥取県ができるまで」(鳥取県)
https://www.pref.tottori.lg.jp/293517.htm

決められた場所に入力されていない
入力や機械による読み込みのエラー防止(チェックデジットなど)は第2回の授業参照
構造化データで,全体でズレているケースがあるが修正可能(マークシートで一問飛ばした場合のことを考えると良い)
防ぐにはリストから選ばせる方式にするなど選択させるようにするのも一案ですが(選択肢によりどのような情報を入力するのか把握できる)

正しく入力していたとしても

例えば生年月日などは和暦,西暦など複数の形式で入力できるようにする場合がある(入力する側の負担軽減のため)
データ処理にあたって揃えておく必要がある
例題5-2
次のテーブルのデータより年月日をyyyymmdd形式に変換せよ
その際どのようなルールで変換できたのか整理しておくこと(情報処理論ではもう少し大量に)
kmuiutil2024-0501.png(176847 byte)
<参考>西暦-和暦早見表(medbb.net)
https://medbb.net/wareki.html
元号が異なる和暦による日数の計算は気をつけないといけないですよね

名寄せ

異なるデータベースのデータを結合すること
一見簡単に思えるが意外と難しい

A病院とB医院に通院している患者さん

それぞれA病院とB病院で診察券を持っているが番号がバラバラ
(例えば〇〇ポイントカードと△〇ポイントカードの番号が違うことを思えば当然
それぞれの診察券(カード)を作成時に登録した情報で寄せることはできないか?
本人であることを特定できる情報が含まれていない
取得できそうなデータ
住所→(可変)引っ越しとともに変わる
氏名→(可変)私の知り合った方を振り返ると様々なケースがある(チーム名の話と一緒)
電話→(可変)携帯電話はナンバーポータビリティで変えなくても良いようになったがそれでも
血液型→(ほぼ不変)変わるケースもある.また,測定の問題もある
生年月日→(不変)単独では特定できない
<参考>赤ちゃんの頃に検査した血液型は,大人になると変わることはありますか?(愛知医科大学)
https://www.aichi-med-u.ac.jp/hospital/sh15/sh1503/sh150303/sh15030301/sh15030301_09.html
実際には複数の属性情報を重ねて特定するしかないが結構大変

協調フィルタリング

名寄せなど出来て様々な変数を持ち且つ追跡できているデータがあれば,活用の話で何をもって一緒なグループにするか

従来

個人の年齢や居住地等により学区が定められ,学齢に基づき学年が決まり学校に
健診は年齢と所属組織の職域,居住地域に基づく地域により
「社会人になられたあなたへ」というDMが某自動車会社から届いた

現在

購入履歴など個別にデータが蓄積されているので,私と似たような購入履歴の人を同じグループにして,まだ買っていないものをお勧めする
amazonや楽天など確認したのですが私の閲覧履歴に基づくものを示してきているだけですね(昔はこれ買ったお客さんは他にこのような商品を・・・だったような)
イメージとしては健診結果に基づく保健指導の対象者の話の方が具体的に想像しやすいですよね.健診データで同じような結果の人を同じグループにして・・・
それを購入履歴など以前の授業で示したように大量に利活用できるようになったので・・・というところです
農産物直売所の件は同一なグループ(東日本大震災に被災された方々)の購入履歴に基づき,どのような時期にどのようなものが購入されていたのかを需要と供給の面からまとめたものです
病院は利益を追求することが目的ではありませんし(医療法),保健においても地域住民の健康の保持及び増進を目的とするものですから(地域保健法)そのような視点で社会生活から得られる情報で協調フィルタリング使えると良いなと思っています
<参考>
健診後の保健指導・健康相談(協会けんぽ)
https://www.kyoukaikenpo.or.jp/g4/cat420/r36/
災害時における農産物直売所の機能(大浦 裕二, 中嶋 晋作他農業経営2012 年 50 巻 2 号 p. 72-77)
https://www.jstage.jst.go.jp/article/fmsj/50/2/50_72/_article/-char/ja/

例題5-3
以下のcsv大阪府の看護養成校(文部科学省管轄)を見ながら,どのようなグルーピングをすればどのような特徴がが見られると思うか考えよ
以下のデータで示されていないグルーピングもありえるのでその点考慮の事
大阪府の文部科学省管轄の看護養成校(文部科学大臣指定(認定)医療関係技術者養成学校一覧(令和5年5月1日現在)より作成)
kmuiutil2024-0501.csv
文部科学大臣指定(認定)医療関係技術者養成学校一覧(令和5年5月1日現在)(文部科学省)
https://www.mext.go.jp/a_menu/koutou/kango/1353401.htm

提出課題
例題5-3出来なかったので課題①の設問内容を変えています
提出期限授業日翌日の午前中10時00分まで
事後学修:講義を振り返り
①例題5-3で考えたグルーピングを記してください(例えば設置主体(国公立,私立)というのは私が思いついたところです,特徴としては学費というところです)
 あくまでも特徴は仮説レベルで大丈夫ですので

①理解できた内容,理解できなかった内容について
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題について

データは細かく取ろうと思った系

データは細かくとった後にまとめることはできるが、大きくとってしまうと細かくすることは因難である
指示がない時はなるべく細かく分けてデータを整理しようと思った。 このような感想が多くて良かったのですが,その分細かいと手間が増えたり取りまとめる時に手間がかからないような工夫も必要かもしれません
大分類中分類小分類のコードをふっておくとかでしょうか

純粋に喜んでいただけた系

血液型が変わることがあると知った
生物学的な変化によらないところで変化します

やってみた

度数分布表はチャットGPTに頼んだら名前が変わった球団も考慮したデータをつくってくれるのか疑問に思った
「日本のプロ野球過去25年のセリーグとパリーグのそれぞれのチーム別優勝回数」by chatGPT3.5
セントラル・リーグ(セリーグ)
チーム名 優勝回数
読売ジャイアンツ (Yomiuri Giants) 8
中日ドラゴンズ (Chunichi Dragons) 5
阪神タイガース (Hanshin Tigers) 4
横浜DeNAベイスターズ (Yokohama DeNA BayStars) 2
広島東洋カープ (Hiroshima Toyo Carp) 6
東京ヤクルトスワローズ (Tokyo Yakult Swallows) 3
パシフィック・リーグ(パリーグ)
チーム名 優勝回数
福岡ソフトバンクホークス (Fukuoka SoftBank Hawks) 11
千葉ロッテマリーンズ (Chiba Lotte Marines) 2
西武ライオンズ (Seibu Lions) 4
北海道日本ハムファイターズ (Hokkaido Nippon-Ham Fighters) 4
オリックス・バファローズ (Orix Buffaloes) 2
東北楽天ゴールデンイーグルス (Tohoku Rakuten Golden Eagles) 2
福岡ソフトバンクホークスがパシフィック・リーグで最も多く優勝しており、読売ジャイアンツがセントラル・リーグで最多優勝を誇っています。

世代の違い

昭和が長く続き、昭和何年と現すことがが多かったため、親世代の人たちは自分の生年月日を名乗る時に、昭和○○年と名乗るんだなと
仰る通り.親世代の親の親も昭和生まれというところもあるかと思います.

西暦と和暦あるからこその経験

今まで西暦と和暦に関連性は無いと思ってい
年月日は形式を統一した方がいい

幻の問1

大学と短大 専修で分けることかできると考える
修業年限が3年か4年 学費
どのような分類にするのかですが地域別などというのもありますよね
目的によるものもありますが,ある程度分類別に度数がバラついている方が全体を早くしやすいかなと思います

第06回 データ分析(3)データ駆動型社会

教科書1-1-2(読み,書き,そろばん,データサイエンス),1-2-3(データサイエンスを学ぶ心構え),3-1-1(情報はいつから利用できるようになったのか),3-2(Society5.0に向けた情報利活用の課題と対策),3-3(情報利用による課題と変革例)
【1-1-1】ビッグデータ、IoT、AI、ロボット
【1-1-3】第4次産業革命、Society 5.0、データ駆動型社会
【1-1-6】データを起点としたものの見方、人間の知的活動を起点としたものの見方
【1-3-1】データ・AI活用領域の広がり(生産、消費、文化活動など)
【1-3-2】研究開発、調達、製造、物流、販売、マーケティング、サービスなど
【1-3-3】仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
人間の意思決定のイメージとしては平たく言うと,テストの点が悪かったので入塾体験への流れ
人間がデータにより状況把握し意思決定した世界.
例題6-1 復習をしない学生に対してどのようなデータがあれば復習を行っていただけるのか考えよ

データ駆動型社会は,様々な事柄がデータ化されており,多種多様なデータを分析し意思決定する世界
データ駆動型の対局にあるのが「KKD」
<参考>勘と経験と度胸に依存しすぎて混乱に陥った工場(日経XTECH)
https://xtech.nikkei.com/atcl/nxt/column/18/00578/00048/

例題6-2 データ駆動型とKKDの利点と欠点をそれぞれ考えよ.そしてどのように組み合わせたらそれぞれの良さを融合することができるか考えよ

産業革命

産業革命により社会は変わる.光と影の側面がある
また,環境により要因が重なると物事が進む→産業革命が起こる前のイギリスの状況
<参考>
イノベーションの歴史(清水洋 科学技術イノベーション政策の科学コアコンテンツ)
https://scirex-core.grips.ac.jp/index#sec5

第3節 イノベーションの歴史(平成28年度国土交通白書)
https://www.mlit.go.jp/hakusyo/mlit/h28/index.html
https://www.mlit.go.jp/hakusyo/mlit/h28/hakusho/h29/html/n1131000.html 第2章 新たな産業変化への対応(第1節)(第1節 第4次産業革命のインパクト 日本経済2016-2017 内閣府)
https://www5.cao.go.jp/keizai3/2016/0117nk/n16_2_1.html

医療DX

私たち保健医療の領域においても産業革命の中で医療も進化してきた.
現在は「医療DX」として保健医療介護のICTを用いて社会生活の形態の変化に向かっている
過去には情報通信技術が発展して社会と同様に保健医療も発展したかというと,現実のものとなるには時間を要したように思う

過去に描かれた近未来の医療現場

ホームドクター2006-近未来の地域医療-(第23回日本医学会総会1991京都)
https://www.youtube.com/watch?v=5Fy17NuNG_k
令和6年度診療報酬改定の概要 医療DXの推進(厚生労働省)
https://youtu.be/KDcYC6YOK4M?si=SB1SCAnYD20hRd2j
<参考>医療DXについて(厚生労働省)
https://www.mhlw.go.jp/stf/iryoudx.html

例題6-3 当時考えていた未来像と現在を比較して異なっている部分を示してください

臨床現場におけるデータ駆動

医療現場では様々な意思決定が様々な形で取得されたデータを分析に基づいてなされている.
技術の進歩により人体より得られるデータも同様に進歩している
その中の医用画像の領域では取得したデータを元に再構成することで意思決定に貢献しているものにCT画像がある.

CT(コンピューター断層撮影)

前から撮影せずに横から撮影して,人体の断面の画像を作成する
行っている計算は空白の部分に入っている数値を計算して求める.パズルのようなもの
例題6-4 次の各マスに入る数字を求めよ
A B
1
2
A1+B1=6
A2+B2=7
A1+A2=5
B1+B2=8
A1+B2=6
A2+B1=7
<参考> X線CT 第1回:画像形成の原理,装置開発の現状(齊藤泰男 Medical Imaging Technology/27 巻 (2009) 3 号)
https://www.jstage.jst.go.jp/article/mit/27/3/27_200/_article/-char/ja/

例題6-5 実際に患者さんを撮影した場合,連立方程式で画像を再構成すると問題が出てきます.どのような問題でしょうか?

提出課題
①理解できた内容,理解できなかった内容について
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題について

CTの話は取り上げてよかったなと

CT

CTは今までどのように画像にしているのか考えたことがなかったけどわかった
例題6の4の数字は埋めれたけど、マスが増えたら大変だと感じた
答えを導き出すための計算式はたくさんあり、それぞれ意味があること
CT撮ったことないんですけど
撮ってたら大変なことになります
無資格者の胸部X線撮影が「医師の指示」等により可の場合はあるか?(日本医事新報社)
https://www.jmedj.co.jp/journal/paper/detail.php?id=5371

もろもろ

チャットGPTはデータの新しい、古いはあまり気にしていないということに驚いた
とりあえず体裁を整えるのに奮闘して力尽きたレポートという感じでしょうか.
過去には、暗証番号は全てカードなどの端末に保存
なぜ暗証番号は4桁? から考える「鍵」の存在意義の変化 財産を守る→自分の証明(GLOBE+ 朝日新聞)
https://globe.asahi.com/article/14861749
電話で患者の薬を聞くのは情報漏洩につながると思った
利便性高くリスクは低く ですね
復習をしない学生に対してはエビングハウスの忘却曲線を見せるとよいと
ありがとうございます.早速実践します
<参考>エビングハウスの忘却曲線(代々木進学ゼミナール)
https://yoshin-zemi.com/blog/tk-2/

第07回 データ分析(4)研究におけるデータ

1-3. データ・AIの活用領域 さまざまな領域でデータ・AIが活用されていることを知る
教科書1-1-2(読み,書き,そろばん,データサイエンス),1-2-3(データサイエンスを学ぶ心構え),3-1-1(情報はいつから利用できるようになったのか),3-2(Society5.0に向けた情報利活用の課題と対策),3-3(情報利用による課題と変革例)
【1-3-2】研究開発、調達、製造、物流、販売、マーケティング、サービスなど
【1-3-3】仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など

研究

理論や事実などを明らかにすること
例題7-1 真実と事実の違いを説明してください
研究は,現象を確認できる事実に基づく客観的な真実を追求する取組 ということになる
特にデータを用いた研究はデータそのものは事実であるが,研究のために取得したデータでも想定していない事柄も含まれたデータになる
例題7-2
ある年の日本の出生時刻を調べたところ以下のような結果になった
kmuiutil2024-0701.png(217096 byte)
このような結果は各自想定通りのものか否か確認したうえで,何故このような結果になるのか小グループを作り話し合ってください
その中で出てきた意見が仮説(主観的な真実)になりうるものになります
想定通りであれば,どのような想定で結果に至っているのか.想定通りでなければ本来どのような結果が期待されていて,どのような想定外の出来事が影響を与えているのか
いずれにしても,それが仮説になりうるものとなります

生活空間で発生するデータ

社会的な要因による影響が出てることを考慮しなくてはならない
<参考>W杯観戦中の意外な現象 原因はトイレ?(日本経済新聞)
https://www.nikkei.com/article/DGXMZO75842400Z10C14A8000000/

疫学の分野は,社会の中で健康に影響が出る要因を探ることが可能な分野

疫学とは

ある人間集団単位における健康状態の頻度分布の観察
ある集団とは地域であったり年齢であったり・・・・
科学的に原因が解明されていなかったとしても,集団の特性と頻度分布の関係を見出せば,原因が未知でも問題を解決できることもある.
集団単位の設定が原因解明の限界になるので,それだけで真の原因に辿り着くとは限らない.

日本疫学会で示している定義は以下を
<参考>
疫学(疫学用語の基礎知識 日本疫学会)
https://jeaweb.jp/glossary/glossary001.html
コレラ菌の話が有名
ジョン・スノウとコレラ(酒井 弘憲 ファルマシア/50 巻 (2014) 6 号)
https://www.jstage.jst.go.jp/article/faruawpsj/50/6/50_558/_article/-char/ja/

科学

科学が日常生活を豊かにしていることは明らかであるものの,科学者の想いによらない使い方もされたり,世の中全てを科学で説明できない
小学校学習指導要領(平成 29 年告示)解説 理科編(文部科学省)
科学が,それ以外の文化と区別される基本的な条件としては,実証性,再現性,客観性などが考えられる。
実証性とは,考えられた仮説が観察,実験などによって検討することができるという条件である。
再現性とは,仮説を観察,実験などを通して実証するとき,人や時間や場所を変えて複数回行っても同一の実験条件下では,同一の結果が得られるという条件である。
客観性とは,実証性や再現性という条件を満足することにより,多くの人々によって承認され,公認されるという条件である。
小学校学習指導要領解説(文部科学省)
https://www.mext.go.jp/a_menu/shotou/new-cs/1387014.htm
【理科編】小学校学習指導要領(平成29年告示)解説(文部科学省)
https://www.mext.go.jp/content/20211020-mxt_kyoiku02-100002607_05.pdf

実証性

「考えられた仮説」が無いことには始まらない→仮説検証型
それでは「考えられていない仮説」とは?
→まだ十分に確固たる仮説として成立していない仮説
仮説検証型と仮説探索型
仮説探索型とは「考えられた仮説」が存在せず(関心ある事象など),得られた結果は「考えられた仮説」になる可能性を有するので「まだ考えられたと言い切れない仮説」

再現性

仮説を実証するために得られたデータから複数回,同一の検証結果になること
「常に」同一の検証結果になることを求めていないが,それは求められないから
再現性の限界
再現性の条件は「仮説の実証を複数回行っても同一の結果が得られる」ことですが,その回数が無限であるならばその条件は永遠に満たされません.
故に有限となりますが,それはある回数(x回)まで同一の結果としても,x+1回目以降同一の結果にならない可能性を含んだものになります.
これは未来において,その仮説が覆される可能性があることを示すもので,反証可能性といわれるものです.
再現性の限界を超える方法
「仮説の実証を∞回行っても同一の結果が得られる」
実証で得られたデータについてどのようなものであっても同一な結果が出るように判定基準を定める
例題6-3 再現性の限界を超える(つまり同一の結果が100%出るような判定基準を定める)ことがよろしくない理由を考えよ
判定基準
「同一の結果」が100%の確率で出現しないことを示しておく必要が出てきます 例えば仮説の実証を行うにあたって検証データに対する判定基準を目標値(目標とする効果量)として設定した場合,達成してもその判定基準が「『同一の結果』が100%の確率で出現しない」ものか分かりません.
例えばその目標値が医学的に妥当なものであったとしても,ここでは関係ない話になります
そうなると,確率に基づく基準で判定しないことには,再現性を満たすことが出来ません
故に仮説検定では効果量などで判定せずに確率に基づいて行います
統計的有意差と臨床的有意差
得られたデータに基づき計算した確率が判定基準を下回った時に統計的有意差があると言います.
知見は社会実装することで人類に貢献できますが,医療現場においては臨床的に意味があるとされる量を基準とする臨床的有意差が結果として求められます
無論社会で役立てていく知見としては,統計的有意差よりも臨床的有意差が重要になりますが,「科学的」な観点からは前者が支配的になります.
確率の違いを量で示すとき,その量はサンプルサイズにより変化します.故に臨床的有意差に基づきサンプルサイズを決定することで二つの違いを解消できます
例えば臨床的有意差が統計的有意差よりも大きい場合は再現性については確認できたものの臨床的な観点から確認はできません.統計科学的に良いが,医科学的には?という結果になります
一般にはサンプルサイズが大きいほど,精度の高い結果が得られるので良いという感覚に思いますが,それは区間推定の話で仮説検定において効果量の差を検証する場合は少し状況が異なります

過去の研究

過去から様々な研究が行われ「新たな知見」が最終的に社会に還元されています(全てではありませんが)
その領域での積み重ねで次の「新たな知見」に繋がるケースもあれば,他領域での積み重ねが「新たな知見」に繋がるケースもあります
そして世の中のデータ周辺の環境が急速に充実したというのもあります
setonet20160521-63.png(200977 byte)
setonet20160521-56.png(240858 byte)
地域と医療の統合に資する情報活用の考え方-不足の観点からみる医療2.10- より

論文検索

Google Scholor
https://scholar.google.co.jp/schhp?hl=ja
J-STAGE
https://www.jstage.jst.go.jp/browse/-char/ja
学術機関リポジトリデータベース(IRDB)
https://irdb.nii.ac.jp/
CiNii
https://cir.nii.ac.jp/
注意点
論文には参考文献も掲載されていますので,関心を持つ領域の論文であればその周辺の論文がリスト化されています
無論,ご自身の関心の持ち方と筆者(その研究グループ)の関心の持ち方は一致するわけでもないので,違う切り口を垣間見ることも期待できます
<参考>引用するなら要注意!やってはいけない「孫引き」とは?(アカリク)
https://acaric.jp/articles/2636

関西医科大学附属図書館では様々な電子ジャーナルを契約されています.そちらを有効活用されることをおすすめします
関西医科大学附属図書館
https://www.kmu.ac.jp/library/

課題について

産まれるのは夜が多い(ドラマなどで聞くので)と思っていた
メディアの力ですよね.故に気をつけて製作されている
出産時間は身近な人が夜中が多かったので夜中が1番多いと思っていた
私たちが見ているのは世の中の一部なので,そのように感じても不思議ではないです
日々の生活の中にはあらゆるデータが潜んでいる
世の中は様々なもので成り立っておりますので
生物の授業でも、科学は客観性と再現性が大切
大切なことなので何回聞いても大丈夫です.他の授業でもまだまだ出てくるのでは?
疫学について学ぶのが楽しみ。出生時間の関連性が面白かった
ぜひ楽しんでください.
変化は社会的要因が影響している可能性も考慮しなければならないこと
はい.本当にいろいろな事が想像が出来ますが,その説が客観的な真実なのかは別問題
ハーフタイムに使用量増加することから国民がW杯を観ていたとわかるところが興味深かった。違う方法でも観ていることを調査できるのはすごい
状況の把握に代替する変数が手軽に測れる場合良いかと思います
出生時間のグラフは完全にランダムだと思っていた
私も最初そのように思っていました.データが学びの場を提供してくれます

データ分析(5)AI 

AIの歴史とどのような過程を経てきたのか,そして現在どのような形で活用されているのかについて講義する
教科書2-1(AIによる共助の推進),2-2(AIに代替される経験値),2-3(AIが描く画像),2-4(AIと人間の共同作品),5-1(人工知能技術の成長と限界),5-2(生活の中のAI),11-2(AIの登場と進化),12(AIによる生活のアップデート),13(AIによる社会のアップデート),15-2(AIと労働問題)
DSliteracy
【1-1-4】複数技術を組み合わせたAIサービス
【1-1-5】人間の知的活動とAIの関係性
【1-4-4】特化型AIと汎用AI、今のAIで出来ることと出来ないこと、AIとビッグデータ
【1-4-5】認識技術、ルールベース、自動化技術
【1-5-2】流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
【1-6-1】AI等を活用した新しいビジネスモデル(シェアリングエコノミー、商品のレコメンデーションなど 【1-6-2】AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など)

AIの歴史

5-1(人工知能技術の成長と限界)
11-2(AIの登場と進化)
15-2(AIと労働問題)

ロボットとAI

(語源は自動人形)人に代わって仕事をしてくれる機械
知能・制御系,センサ,駆動系の3要素からなる
知能制御系部分が,センサに基づくデータをもとに駆動系をつかさどっている
「世界初の自動改札」導入50年…阪急が記念入場券、気になるデザインは(産経新聞)
https://www.sankei.com/article/20170305-CCLXT2SR6FIQJD6TAW7QXES3SQ/ 誕生から90年 ロボット「学天則」が作られた理由とは(yahoo)
https://news.yahoo.co.jp/articles/c196bb380df85cc7861efb3e54e612f0921f69c4
学天則の意匠と動き 学天則復元にあたって(長谷川 能三 大阪市立科学館研究報告 第18号)
http://www.sci-museum.kita.osaka.jp/~nozo/publication/pb18-005.pdf
https://www.sci-museum.jp/activities/publication/report/2008/

人工知能(AI)

蓄積したデータを利用して,変化の推測や状況に応じた判断など人の知能を人工的に再現
AIで用いる分析技術の一つが機械学習
機械学習の中の方法の一つがディープラーニング
人工知能(AI)と機械学習(ML)の比較(google cloud)
https://cloud.google.com/learn/artificial-intelligence-vs-machine-learning?hl=ja

機械学習

一義的なプログラム(命令)に基づき意思決定,機械学習は状況も含めアルゴリズムに基づくプログラムで得られた結果より意思決定 アルゴリズムの枠内で自律的に学習していく
例題8-1 アルゴリズム
五十円玉,一円玉,十円玉,五百円玉,百円玉が並んでいる
いまから小さい順に並びなおしたいが,作業してくれるネコは並んでいる二つの硬貨しか識別できず並び替えもすることが出来ない
どのように硬貨を比較し並び変えていったら,昇順に綺麗に並ぶのだろうか
機械学習には教師あり学習,強化学習,教師なし学習がある
教師あり学習
正しいデータを提示して特徴を学ぶ方式
強化学習
正しい行動を選択(例えば勝利する確率)してくれたら評価し,それを繰り返すことで評価される判断を学習していく方式
<参考>強化学習これだけは知っておきたい 3 つのこと(MathWorks)
https://jp.mathworks.com/discovery/reinforcement-learning.html
教師なし学習
ルールなどなくコンピュータがそれなりな根拠で分類したあとに,その結果より人間が分類名を決める
人が思いつかないような特徴によって分類することもありうる

ディープラーニング

深層学習・・・見えない深いぶぶんにおける学習?
機械学習の構造が多くの層から構成されたもの.人間も判断する際にいろいろ(全体を眺めたり,細かい部分を眺めたり,話す声の抑揚であったり,話している言葉のチョイスだったり)なことを総合して判断するのと同じかと
そして人間を超えていく
ディープラーニング(深層学習)(NRI)
https://www.nri.com/jp/knowledge/glossary/lst/ta/deep_learning
13. ニューラルネットワークの基礎(Chainer) https://tutorials.chainer.org/ja/13_Basics_of_Neural_Networks.html
押さえておきたい機械学習とディープラーニングの違い(日立ソリューションズ・クリエイト)
https://www.hitachi-solutions-create.co.jp/column/technology/machine-learning-deep-learning.html
シンギュラリティは来ない?カーツワイル博士が描くディープラーニングの世界観とは(wisdom)
https://wisdom.nec.com/ja/innovation/2019072901/index.html

例題8-2 監視カメラ
病院内の廊下に監視カメラを設置した
医療従事者か患者さんかお見舞い客か不審者か判別したい
どのような特徴で見分けられるのか考えよ
<参考>人工知能(AI)研究の歴史(平成28年版 情報通信白書)
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h28/html/nc142120.html

人間とAI

2-2(AIに代替される経験値) 2-3(AIが描く画像) 2-4(AIと人間の共同作品) 5-2(生活の中のAI) 12(AIによる生活のアップデート)

経験値

経験により得た知識→形式知,もしくは暗黙知
マッチングの話はキッカケとしては良いかと思っていますがいかがでしょう
昔はそのようなアプリは無かったものの場そのものを提供して効果があったと思います
(動画どこかに残っていないかな)
人が形式知に変換できないようなものも,AIは人間の理解できない形式に変換しているかもしれません

プロンプトエンジニアリング

どのようにお願いしたら良いのかというのはAIに限らず人でも当然,機械,例えば車ならアクセルの踏み方ひとつで機嫌よく走ってくれる

AIとの共同作品

AIを使ってレポートを書く方がおられても不思議ではない世界だが,使っている人の痕跡が出てしまう
曲などではAIによらず人でも類似の曲が出て騒ぎになることもある.

AIによる推定

SNSの書き込みから推定することも当然できる
AIによらずですがデータを元にして得られた情報から推定するというのは,ドキッとする結果が出たりします
huhmacollab2018-03.png(376735 byte)
産学官連携マネジメント論2018(分担:地域医療と産学官連携) より

社会とAI

2-1(AIによる共助の推進) 13(AIによる社会のアップデート)

共助

setonet20160521-54.png(313488 byte)
地域と医療の統合に資する 情報活用の考え方 -不足の観点からみる医療2.10- より

AIを活用することで人と人もしくはサービスが繋がりやすくなった時代

AIは不都合な未来の到来を防いでくれるのか

不都合な未来~2025年の医療~(第29回日本医学会総会2015関西 学術テーマ展示「ITがもたらす情報化社会の新たな医療環境」) https://www.youtube.com/watch?v=fq8-FQ_T8c4
提出課題
①理解できた内容,理解できなかった内容について
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題について

教師ありなし学習

教師あり学習に加え、自分自身で問いや講義の目的を見つけるためにディープラーニングが必要
AIの危険性を耳にタコができるほど聞いてきたので良いイメージを持ってなかったけれど、便利なものであることを考えられた
教師なし学習は、人間が見抜けない特徴を拾うことができたら犯罪防止に使える

アルゴリズム

アルゴリズムが何か分かったが日本初のロボットは何をするためのロボットかわからなかった
アルゴリズムの硬貨を動かずやつはすぐに理解
アルゴリズムの問題で、ネコは並び替えができないのに硬貨を並び替えていて・・・
初めはアルゴリズムの考え方が難しいと感じたが、意外に単純な考え方だった

監視カメラ

サーモグラフィーや眼球での動きや身元調査というのは?
前2つはありなのかもしれませんが,入館時のカメラの体温測定のような格好ですかね.身元調査のデータ活用は法的な問題が出てくるだろうと思います

ピックアップ

近いうちに人間の仕事はAIに奪われるという話をよく聞くが、医療職は大丈夫なの
setonet20160521-57.png(173658 byte)
地域と医療の統合に資する 情報活用の考え方 -不足の観点からみる医療2.10- より
共助は文脈によって意味合いが変わるのは初めて知った
学天則がテラフォーマーズのゴキブリみたいで怖い
初めてのテラフォーマーズ(週刊ヤングジャンプ公式サイト)
https://youngjump.jp/terraformars/story/

第09回 科学技術と社会(1)情報セキュリティ

教科書6-1(情報セキュリティの要素),6-2(暗号資産のセキュリティ),6-3(情報の流出)
DSliteracy
【3-2-1】情報セキュリティ:機密性、完全性、可用性
【3-2-2】匿名加工情報、暗号化、パスワード、悪意ある情報搾取
【3-2-3】情報漏洩等によるセキュリティ事故の事例紹介

情報セキュリティはICTの利活用が活発に行われることで実空間のみの時代から電脳空間(サイバー空間)のセキュリティも含めて対応することが求められる
過去から情報(データ)は盗まれてきた.(例えば貨幣であったり企業の機密事項やら・・・)

機密性

許可されたものだけがアクセスできる
用いる情報は知識情報,所持情報,生体情報
多要素認証とは?二段階認証との違いやメリットデメリットまで解説(NTT東日本)
https://business.ntt-east.co.jp/content/cloudsolution/column-412.html

実空間

カギ(物理キー,暗証番号),秘密の場所
忍術屋敷の見どころ(甲賀流忍術屋敷)
https://www.kouka-ninjya.com/yashiki/

サイバー空間

多要素認証
例えば銀行のATMの場合は(ATM設置場所に行ってから)カードと暗証番号もしくは静脈認証
インターネットバンキングならID,パスワード+SMS認証(ワンタイムパスワード)など
問9-1 医療従事者が指紋認証を利用するときの欠点について考えよ

完全性

情報が改ざんや破壊されていないこと

実空間

原本を保存・・・各種契約書
書類は劣化するものの,確認はできる
正倉院(宮内庁)
https://shosoin.kunaicho.go.jp/

サイバー空間

コピーが自由,偽装も可能,勝手にファイルが壊れる場合もあり
kmuiutil2024-0901.png(384149 byte)

可用性

使わなければノーリスク.でも使わなければならない
kosaka20140828-19.png(250744 byte)
kosaka20140828-20.png(270040 byte)
SNS時代における個人情報保護と情報セキュリティ より

実空間

結構不便
その場所まで移動しないといけない

サイバー空間

24時間365日どこからでもアクセスが可能
<参考>
「サイバー」とは?意味や使い方をご紹介(コトバの意味辞典)
https://word-dictionary.jp/posts/1971
情報セキュリティの歴史 産業スパイから最新の脅威への対策まで解説(コンプライアンス研究所)
https://compliance.lightworks.co.jp/learn/information-security-history/
押さえておきたいセキュリティの3要素とは(日立ソリューションズ・クリエイト)
https://www.hitachi-solutions-create.co.jp/column/security/security-three-elements.html

ブロックチェーン技術

ブロックチェーン

記録したデータを連結していく事で不正を困難にする仕組み
その記録はサーバーに保存するのではなくそれぞれの端末が管理している
授業ノートを誰か一人作成して皆で共有するのではなく,
研究ノートをそれぞれが作成し,分散した格好で情報を共有
(誰かひとり作ってみんなに配布するわけではない)
ブロックチェーンの仕組み(NTTdata) https://www.nttdata.com/jp/ja/services/blockchain/002/
ブロックチェーンとは? その仕組みと種類を解説(日立ソリューションズ・クリエイト)
https://www.hitachi-solutions-create.co.jp/column/security/block-chain.html
【図解】ブロックチェーンとは?仕組みと基本を理解する(カゴヤのサーバー研究室)
https://www.kagoya.jp/howto/cloud/cloudtrend/blockchain/

ハッシュ関数

計算式でデータを他のデータに置き換える
その時に用いる関数
ハッシュ値より元のデータに戻すことが出来ない→匿名処理など
通常の暗号は復号化することができる
問9-2 
シーザー暗号で暗号化された文字から復号化しようと思う もともとの文字の先頭はkであることが分かっている
暗号文「oerwem」を復号化してもともとの文字にせよ
シーザー暗号を体験しよう(めざせホワイトハッカー!体験から学ぶ情報セキュリティ)
https://miraikidslab.org/cyber_security/challenge/page3_5.html

情報の流出

近年医療機関での事例が増えています
様々なパターンがあるのでご注意ください

実空間アナログ系

【お詫び】個人情報の漏えいについて(5/2)(横浜市立大学病院)
https://www.yokohama-cu.ac.jp/fukuhp/news/2024/kojinjoho.html

実空間デジタル系

近畿大学病院産婦人科における個人情報の漏洩について(近畿大学病院)
https://www.med.kindai.ac.jp/notice/2024_0513_6086.html

サイバー空間

パソコンサポート系
個人情報漏洩疑いのご報告(戸田総合病院)
https://www.chuobyoin.or.jp/2024/03/notice20240306/
個人情報漏洩の疑い事案について(大阪府済生会富田林病院)
https://tondabayashi.saiseikai.or.jp/news/%E5%80%8B%E4%BA%BA%E6%83%85%E5%A0%B1%E6%BC%8F%E6%B4%A9%E3%81%AE%E7%96%91%E3%81%84%E4%BA%8B%E6%A1%88%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6/
近畿大学病院で個人情報が漏洩か 出産患者2000人分(日本経済新聞)
https://www.nikkei.com/article/DGXZQOUF138KY0T10C24A5000000/
誤操作系
「BccじゃなくToで送信されてる」…鹿児島市立病院が55人分のメルアド漏えい(南日本新聞)
https://373news.com/_news/storyid/187709/
個人情報の漏えいに関するご報告(東邦大学医療センター大橋病院)
https://www.ohashi.med.toho-u.ac.jp/information/index2024/ledcal0000000mmo.html
SNS系
市立病院における個人情報漏えいについて(仙台市立病院)
https://hospital.city.sendai.jp/customer/kisyahappyou.html
動画系
個人情報の漏えいについて(2024年5月22日(水))(群馬大学)
https://www.gunma-u.ac.jp/information/176121
ランサムウェア
岡山県精神科医療センター サイバー攻撃で約4万人の情報流出か(NHK)
https://www3.nhk.or.jp/news/html/20240611/k10014477611000.html
提出課題
①理解できた内容,理解できなかった内容について
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

課題のコメント

シーザー暗号の例題が理解できなかった
セキュリティーを初めて体験し簡単に複合化ができることを知った
シーザー暗号解くのが楽しかった!
単純な暗号は簡単に破られます.最近は少々ややこしいものも破られてしまいます
ハッシュ関数は元のデータに戻すことができないことを学びました。もし、間違えて変換したら
元のデータがあれば誤字とわかるケースでもハッシュ化するともはや別なものとしか分からないのが欠点ですね
ブロックチェーンが連結をイメージできてわかった

書類のデータは劣化が緩やかなのに対して、デジタルのデータは一気に壊れるのが、自分の経験にも当てはめることができた

こまめな上書き保存も必要ですが,保存先をどれだけ信頼できるものにするかですね

サイバー攻撃などで完全に情報を守る方法はない気がした

はい

第10回 科学技術と社会(2)ELSI


教科書5-2(生活の中のAI)11-3(データやAIを扱うときの注意点),14(秩序あるデータの重要性),15-1(データサイエンスのこれから),15-3(デジタル・シティズンシップの重要性)
DSliteracy
【3-1-1】ELSI(Ethical, Legal and Social Issues)
【3-1-2】個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト
【3-1-3】データ倫理:データのねつ造、改ざん、盗用、プライバシー保護
【3-1-4】AI社会原則(公平性、説明責任、透明性、人間中心の判断)
【3-1-5】データバイアス、アルゴリズムバイアス
【3-1-6】AIサービスの責任論
【3-1-7】データ・AI活用における負の事例紹介

ELSI 教科書11-3(データやAIを扱うときの注意点)

Ethical Legal and Social Issues
倫理的,法的,社会的な課題
新たな技術の社会実装において,発生する課題
法的な枠組みで保たれていたものが新たな技術によりその枠組みを超えることによって,倫理での補完が求められる状況
社会的な課題として認識されてから気付くケースが多い(普及した場合も普及しない場合も)

普及する中で気付く課題

デジタルカメラ
デジタル万引き・・・データ自体はモノではないので法的に罰する規定がない
medicalSD20041124-02.png(47700 byte)
medicalSD20041124-03.png(38435 byte)
medicalSD20041124-04.png(49683 byte)
個人情報の保護に関する病院の義務と責任~個人情報保護法の施行へ向けて~ より

普及しないことが課題

マイナンバーカード
本屋で本を撮影する「デジタル万引き」が違法ではない理由(清水陽平(法律事務所アルシエン)シェアしたくなる法律相談所編集部)
https://lmedia.jp/2014/12/09/59218/ 「ELSI/RRI」とは? そのはじまりと今の日本における意味 - 三村 恭子 (科学フォーラム2024年2月号 通巻439号 ELSI 研究の現在)
https://www.tus.ac.jp/about/information/publication/forum/file/forum_no439_02.pdf
https://www.tus.ac.jp/about/information/publication/forum/2023.html
マイナンバーカード取得率、99業種のうち最も取得率が高かった業種は?(マイナビニュース)
https://news.mynavi.jp/article/20221017-2482739/

個人情報保護 教科書14-1(AI・データサイエンス時代のプライバシー保護)

個情法と略されて使われたりします
kosaka20140828-15.png(196283 byte)
SNS時代における個人情報保護と情報セキュリティ より
GDPRによりcookieにユーザー同意が必要

AIサービスの利活用における留意点

統計不正

本人のその気がなくとも,結果的に正しくない情報を提供してしまうケースもある
nmucsmed2024-01.png(220966 byte)
nmucsmed2024-02.png(146700 byte)
研究におけるデータ収集と統計処理について より
偏ったデータを取得していたら結果も偏る→データバイアス(P42)
粉飾決算で融資金5億円詐欺か 堀正工業元社長ら逮捕(テレ東BIZ)
https://www.youtube.com/watch?v=WdcrjRO8U2c

EBM

Evidence-Based Medicine
根拠に基づいた医療
「根拠」・・・科学的根拠と表現されているケースも多い・・・(経験則だけに基づかないようにという意味合いを込めてというところかな)

医療提供における「根拠」以外の要素

意思決定における3要素・・・根拠,価値観,資源
価値観は人によってさまざま
現有(もしくは調達可能な)資源で出来ることしかできない
医療資源
joho20140730-01.png(104237 byte)
不足の観点からみる医療2.0β より)
「根拠に基づく医療」(EBM)を理解しよう(厚生労働省eJIM(イージム「統合医療」情報発信サイト))
https://www.ejim.ncgg.go.jp/public/hint2/c03.html

EBMの5つのステップ

1.問題の定式化
PICO
P(Patient)どのような患者さん(対象)なのか
I(Intervention)どのような介入を適用しようとしているのか
C(Comparison)介入しない場合(もしくは他の介入)と比較して
O(Outcome)どのような結果になるのだろうか
2.問題についての情報収集
掲げた問題に相当するような情報(世の中にある研究論文など)を探す
3.情報の批判的吟味
情報そのものがどの程度信頼出来るのか,効果があるのか.
4.情報の患者への適用
今回の患者さんと情報で得られた患者像を同じと見做し適用して良いか,問題あるのか
5.1~4 のstepの振り返り
研究の場合もPICO/PECO(E(Exposure) 治療などの介入ではなく曝露)で整理し目的を明確化します.
EBMはある患者さんに医療を適用するために情報を検索という流れですが,研究はある仮説を明らかにするために目的を明確化してデータ収集・分析となります.
南郷栄秀,Evidence-based medicine:診療現場でのプロブレムの解決法 日内会誌 106:2545~2551,2017
https://www.jstage.jst.go.jp/article/naika/106/12/106_2545/_article/-char/ja/
特集:EBMとEBH『公衆衛生研究』 第49巻 第4号 (2000年12月)

EBMの5ステップと意思決定の3要素

EBM1~3ステップが根拠の部分
根拠とする情報に実証性と再現性と客観性があったほうが良いというところは理解できるかと(つまり科学としての基本的な条件を満たしている方が良いだろう)
研究の方法によって,グレードが変わるのはそれらの要素が方法によって異なってくるので
ステップ4においては価値観と資源を含めた形となる

AIとバイアス

アルゴリズムバイアス

AIに学習させるデータセットの偏りによる
マイクロソフトのAI、ヘイト発言を「学習」して停止(WIRED)
https://wired.jp/2016/03/25/tay-tweet-microsoft/
MS、AIチャットボット「Tay」を停止--ヒトラー擁護など不適切なツイートの投稿で(CNET Japan)
https://japan.cnet.com/article/35080128/

人間中心のAI社会原則

7つの社会原則が掲げられている
「人間中心のAI社会原則」について (新田隆夫 大学教育と情報 2019年度 No.2(通巻167号))
https://www.juce.jp/LINK/journal/2001/02_05.html
https://www.juce.jp/LINK/journal/2001/mokuji.html

AIサービスと責任

死亡事故を起こした自動運転車の車載カメラ映像(時事通信映像センター)
https://www.youtube.com/watch?v=06upo5tOGuQ
高速道路の工事現場の表示を吹き飛ばし…作業中の車に突っ込む 「自動運転を過信した事故が散見」【事故瞬間の映像】(CBCニュース【CBCテレビ公式】)
https://www.youtube.com/watch?v=yqCBb5aapkc
自動運転車の事故一覧(2024年最新版) 日本・海外の事例を総まとめ(自動運転LAB)
https://jidounten-lab.com/y_1615

これからのAI

人工知能法学を識るAIと法学が融合した “新学問”(国立情報学研究所)
https://www.nii.ac.jp/today/97/2.html
人気アニメ歌手・高橋洋子がコンサート出演を辞退 発端は「生成AIポスター」(テレ朝ニュース Yahoo)
https://news.yahoo.co.jp/articles/9cbc26fc1979d6cd56ff84602391ad346738e2ff
上泉雄一のええなぁ! (1)6月26日(水) 05:50-07:00(MBSラジオ radiko)
授業日の朝にAIカバーの話が取り上げられていましたので,タイミング良すぎ
https://radiko.jp/#!/ts/MBS/20240626055000
提出課題
①理解できた内容,理解できなかった内容について
②その他コメント
を簡潔にまとめ講義サイトより提出の事(30分程度)

試験範囲

〇は範囲 △は一部範囲 ×は範囲外

情報活用論2024

第01回 情報とデータ

第02回 データ通信

第03回 データ収集

第04回 データ分析(1)データの特性
度数分布表は除く
第05回 データ分析(2)データクレンジングと名寄せ
度数分布表は除く
第06回 データ分析(3)データ駆動型社会

第07回 データ分析(4)研究におけるデータ

第08回 データ分析(5)AI

第09回 科学技術と社会(1)情報セキュリティ

第10回 科学技術と社会(2)ELSI