関西医科大学 情報処理技術2024
(看護学部看護学科)

2024年度開講にあたって
https://medbb.net/education/2024init/

この講義では情報処理に関する装置の技術的な話(コンピュータの5大要素(装置))などはしません.
コンピュータを道具としてどのようにデータの取り扱いに関する技術を中心に行っていきます

授業メニュー



第01回 PCの基本操作

第02回 データの形式と四則演算

第03回 代表値

第04回 散布度

第05回 度数

第06回 表の作成(1)

第07回 表の作成(2)

第08回 データの可視化(1)グラフ

第09回 データの可視化(2)様々な可視化

第10回 まとめ

第01回 PCの基本操作

PCの基本的な操作とアプリケーションソフトウェアと用いるファイル形式について演習する
教科書4章-1,-2 DSliteracy
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-4-3】非構造化データ処理:言語処理、画像/動画処理、音声/音楽処理など
【2-3-3】データ解析ツール(スプレッドシート)
【2-3-4】表形式のデータ(csv)

PCで出来ること

デジタル化されたデータを取り扱うことができる

デジタル化されたデータ

数値,文字(記号),音,絵,映像・・・・
画像の例
kmuipt2024-0103.png(301950 byte)
kgufd20170120-10.png(252875 byte)
情報通信技術の活用による効果的な学修環境の構築について より)
色深度(bpp)
1bit
2bit
3bit
私たちの物理空間が連続の世界(アナログ)に対してサイバー空間は不連続(離散)の世界(デジタル)である.
サイバー空間が物理空間の世界に近づく(追い越す)には不連続なものを細かくして大量に集めることで連続に近づく
上記は色の不連続なものを細かくした件
演習1
インターネット上にある音や画像,映像のデジタルデータを確認せよ

オープンデータ

joho20170721-05.png(360104 byte)
オープンデータで読み解く地域包括ケア -不足の観点からみる医療2.21- より)
近年は国や地方自治体から様々なデータが提供されている
厚生労働統計一覧(厚生労働省)
https://www.mhlw.go.jp/toukei/itiran/index.html

内部で取り扱うデータ

業務で発生するデータなどは,プライバシーに関する情報も含まれたりするので内部で利用するケースが多い
ログ等大量に発生するものもある.
joho20140730-31.png(262460 byte)
本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)(WAF「Scutum」)
https://www.scutum.jp/information/waf_tech_blog/2021/01/waf-blog-077.html

「統計」は集団のデータを取りまとめることで個々の状態ではなく集団の状態を可視化したり,推測したりする
あるモノやコトからデータとなり情報そして知識の流れ.データや情報や知識をまとめて「情報」ということもある
nmuhlthstat1_2024-0101.png(303517 byte)
joho20140730-32.png(402275 byte)
「保健医療分野の情報化」これまでからこれからへ より)

EXCELの利用

起動してみましょう.
kmuipt2024-0101.png(223463 byte)
kmuipt2024-0102.png(245774 byte)

キーワード

セル
セル番地
数式バーとセルの表示
計算式
関数
セルの参照(絶対,相対)
グラフの作成
保存は大切
保存形式はありのままなら,標準形式(xlsx),データだけならcsvが便利
注意点
デジタルの世界はアナログと違って自在に複写や移動が出来るので,表現する内容(素材)を最初に作ってそこからデザインを考える方が無難
全体の出来上がりイメージを持つのもいいが,変わるケースが多い

CSV形式

ohsustat2020-0108.png(321674 byte)
演習1-1
示すファイルを用いてアプリケーションや文字コードによってデータがどのように表示されるか確認せよ
xlsx形式(Excel標準)のファイル

csv形式(文字コードはwindows標準のShift-JIS形式)

csv形式(文字コードは世界中で使われるUTF-8形式)

kmuipt2024-0104.png(285052 byte)
kmuipt2024-0105.png(269287 byte)
kmuipt2024-0106.png(272090 byte)
kmuipt2024-0107.png(295939 byte)
<参考>UTF-8:Tech Basics/Keyword(@IT ITmedia Inc.)
https://atmarkit.itmedia.co.jp/ait/articles/1603/28/news035.html

非構造化データ

構造化データ・・・表形式のようにデータが定義されていて処理しやすいもの(例 住所録)
氏名 住所 電話番号
〇〇一郎 大阪府 06-XXXX-XXXX
山田△〇 奈良県 0742-XXXX-XXXX
ルールがわかりやすく示されているので,見る方も理解できる

非構造化データ・・構造化データと違いデータが定義されていないもの(例 文章)

構造化されていない例

〇〇一郎さん知ってますよ,大阪府にお住まいで,連絡は06-XXXX-XXXXに電話したら取れると思います.
山田さんですか,ちょっと待ってくださいよ.奈良県に引っ越されたんですよね.連絡先は0742-XXXX-XXXXです

第02回 データの形式と四則演算

スプレッドシートソフト(MS-Excel)を用いて取り扱うデータ形式を理解し,四則演算および関数について演習する
教科書7章-1,8章-1,-3 DSliteracy
【2-3-1】データの集計(和、平均)
【2-3-3】データ解析ツール(スプレッドシート)

データ形式(Excel)

kmuipt2024-0201.png(303065 byte)
例題2-1
kmuipt2024-0202.png(258948 byte)

演算と関数

四則演算 +-×÷ → + - * /

セルの参照

極力手打ちでデータを入力しないように.(人は間違える)
エクセルに,どのセルの値なのか場所を教えてあげる
例題2-2
kmuipt2024-0203.png(337203 byte)
例題2-2の結果より合計金額と平均金額を算出する
よく使う計算は関数が用意されている.
合計はsum関数 平均はaverage関数
kmuipt2024-0204.png(333973 byte)
提出課題0102
kmuipt2024-0205.png(371823 byte)
kmuipt2024-0201.csv
提出するファイル名は学籍番号と氏名と本日の日付とする.
学籍番号 12321 氏名が 大阪一郎 授業日が 2024年4月12日 なら
12321大阪一郎20240412
となる.そのあとに拡張子がついているはずなので
12321大阪一郎20240412.xlsx
注意)英数字は半角のこと(守られていないと減点対象とする)