関西医科大学　情報処理技術２０２４
（看護学部看護学科）

シラバス上で
事後学修：講義を振り返り①感想②不明な部分③理解した部分④その他コメントを簡潔にまとめ講義サイトより提出の事(30分程度)
としている部分ですが
事後学修：講義を振り返り「提出課題」について授業中の指示に従って提出の事（KMULASもしくは講義サイトについても指示します）(30分程度)
と読み替えてください
また二コマ連続で行っていますので，提出課題については日単位で提出となります

課題提出は以下のフォームから
https://forms.gle/mrsbZN2PrCE8bHDZ9

2024年度開講にあたって
https://medbb.net/education/2024init/
困った時，オンラインでのサポートやなにかありましたら以下からご連絡ください
私へ連絡・ｵﾝﾗｲﾝｵﾌｨｽｱﾜｰ予約

この講義では情報処理に関する装置の技術的な話（コンピュータの５大要素（装置））などはしません．
コンピュータを道具としてどのようにデータの取り扱いに関する技術を中心に行っていきます

授業メニュー

第01回　PCの基本操作

第02回　データの形式と四則演算

第03回　代表値

第04回　散布度

第05回　度数

第06回　表の作成(1)

第07回　表の作成(2)

第08回　データの可視化（１）グラフ

第09回　データの可視化（２）様々な可視化

第10回　まとめ

第01回　PCの基本操作

PCの基本的な操作とアプリケーションソフトウェアと用いるファイル形式について演習する
教科書4-1(身近に広がるデータサイエンス),4-2(販売データ),7-3-1(オープンデータの活用方法)
DSliteracy
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-5】データのオープン化（オープンデータ）
【1-4-3】非構造化データ処理：言語処理、画像/動画処理、音声/音楽処理など
【2-3-3】データ解析ツール（スプレッドシート）
【2-3-4】表形式のデータ（csv）

PCで出来ること

デジタル化されたデータを取り扱うことができる

デジタル化されたデータ

数値，文字（記号），音，絵，映像・・・・

画像の例

（情報通信技術の活用による効果的な学修環境の構築について　より）
色深度（bpp）
1bit ■ ■ ■ ■ ■ ■ ■ ■
2bit ■ ■ ■ ■ ■ ■ ■ ■
3bit ■ ■ ■ ■ ■ ■ ■ ■
私たちの物理空間が連続の世界（アナログ）に対してサイバー空間は不連続（離散）の世界（デジタル）である．
サイバー空間が物理空間の世界に近づく（追い越す）には不連続なものを細かくして大量に集めることで連続に近づく
上記は色の不連続なものを細かくした件

演習１

インターネット上にある音や画像，映像のデジタルデータを確認せよ

オープンデータ

（オープンデータで読み解く地域包括ケア－不足の観点からみる医療2.21－　より）
近年は国や地方自治体から様々なデータが提供されている

厚生労働統計一覧（厚生労働省）
https://www.mhlw.go.jp/toukei/itiran/index.html

内部で取り扱うデータ

業務で発生するデータなどは，プライバシーに関する情報も含まれたりするので内部で利用するケースが多い
ログ等大量に発生するものもある．
joho20140730-31.png(262460 byte)

本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)(WAF「Scutum」)
https://www.scutum.jp/information/waf_tech_blog/2021/01/waf-blog-077.html

「統計」は集団のデータを取りまとめることで個々の状態ではなく集団の状態を可視化したり，推測したりする
あるモノやコトからデータとなり情報そして知識の流れ．データや情報や知識をまとめて「情報」ということもある
nmuhlthstat1_2024-0101.png(303517 byte)

（「保健医療分野の情報化」これまでからこれからへ　より）

EXCELの利用

起動してみましょう．
kmuipt2024-0101.png(223463 byte)

キーワード

セル
セル番地
数式バーとセルの表示
計算式
関数
セルの参照（絶対，相対）
グラフの作成
保存は大切
保存形式はありのままなら，標準形式(xlsx），データだけならcsvが便利

注意点

デジタルの世界はアナログと違って自在に複写や移動が出来るので，表現する内容（素材）を最初に作ってそこからデザインを考える方が無難
全体の出来上がりイメージを持つのもいいが，変わるケースが多い

CSV形式

演習１－１

示すファイルを用いてアプリケーションや文字コードによってデータがどのように表示されるか確認せよ
xlsx形式(Excel標準)のファイル

csv形式(文字コードはwindows標準のShift-JIS形式)

csv形式(文字コードは世界中で使われるUTF-8形式)

kmuipt2024-0104.png(285052 byte)

＜参考＞UTF-8：Tech Basics／Keyword（＠IT ITmedia Inc.）
https://atmarkit.itmedia.co.jp/ait/articles/1603/28/news035.html

非構造化データ

構造化データ・・・表形式のようにデータが定義されていて処理しやすいもの（例　住所録）

氏名	住所	電話番号
〇〇一郎	大阪府	06-XXXX－XXXX
山田△〇	奈良県	0742-XXXX-XXXX

ルールがわかりやすく示されているので，見る方も理解できる

非構造化データ・・構造化データと違いデータが定義されていないもの（例　文章）

構造化されていない例

〇〇一郎さん知ってますよ，大阪府にお住まいで，連絡は06-XXXX－XXXXに電話したら取れると思います．
山田さんですか，ちょっと待ってくださいよ．奈良県に引っ越されたんですよね．連絡先は0742-XXXX-XXXXです

第02回　データの形式と四則演算

スプレッドシートソフト（MS-Excel）を用いて取り扱うデータ形式を理解し，四則演算および関数について演習する
教科書7章-1,8章-1,-3 DSliteracy
【2-3-1】データの集計（和、平均）
【2-3-3】データ解析ツール（スプレッドシート）

データ形式(Excel)

例題２－１

演算と関数

四則演算　＋－×÷　→　+ - * /

セルの参照

極力手打ちでデータを入力しないように．（人は間違える）
エクセルに，どのセルの値なのか場所を教えてあげる

例題２－２

例題２－２の結果より合計金額と平均金額を算出する
よく使う計算は関数が用意されている．
合計はsum関数　平均はaverage関数
kmuipt2024-0204.png(333973 byte)

提出課題0102

kmuipt2024-0201.csv
提出するファイル名は学籍番号と氏名と本日の日付とする．
学籍番号　12321 氏名が　大阪一郎　授業日が　2024年4月12日　なら
12321大阪一郎20240412
となる．そのあとに拡張子がついているはずなので
12321大阪一郎20240412.xlsx
注意）英数字は半角のこと（守られていないと減点対象とする）

第03回　代表値

スプレッドシートソフト（MS-EXCEL）を用いて代表値を算出し特性を理解する
教科書7章-1,8章-1,-3
DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値（平均値、中央値、最頻値）
【2-3-3】データ解析ツール（スプレッドシート）
average（その集団でとりまとめたデータを数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています）

平均

算術平均

mean
excel関数【average】（先週利用済み） 1/n・Σx_i
パレートの法則（80-20の法則）
代表値なのに実在しない場合がある　→　集団の指標（重心）であって、事象を代表する値そのものを示しているとは限らない

例題３－１

以下のデータより合計と算術平均を求めよ
kmuipt2024-0301sjis.csv
なお合計は【sum】関数，算術平均は【average】関数を用いること
それぞれA事業所の算出に用いた数式をそのままB事業所，C事業所の欄にコピーして計算の事

幾何平均（相乗平均）

全て掛け合わせて累乗根をとる
例えば１と２と４の平均
算術平均　（１＋２＋４）／３＝2.3333
幾何平均　　^３√（1×２×４）＝２

加重平均

重みづけ平均
例えば　ミニテストと期末試験の平均をとる　→　そのままの平均で良いの？
ミニテスト30%期末試験70%
それぞれ40点，70点の場合
40×0.3+70×0.7＝12+49=61

例題３－２

とある県の公立高校の入試における内申点は中学2年，3年の成績を対象に9教科5段階の評価を2年次は45点満点，3年時は90点満点で算出している
内申点およびそれに基づく評点（内申点より求めた1科目あたりの評価）を求めよ
kmuipt2024-0302sjis.csv

＜参考＞【奈良県】公立高校入試での内申点の計算の仕方（進研ゼミ中学講座ベネッセ）
https://czemi.benesse.ne.jp/open/nyushi/exam/29/feature/1273791_5352.html
高校受験の内申点とは？評価方法と地域ごとの違い・計算方法まで解説（湘ゼミコラム　湘南ゼミナール）
https://www.shozemi.com/column/highexam/16299/
内申点の計算の仕方（小美野塾）
https://kominojuku.ti-da.net/e7184603.html

中央値

median（別名第２四分位数）
量的変量を順序尺度の性質で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値

最頻値

mode（流行，はやり）
違う意味で数の理論（多数決）の世界
量的変量を名義尺度の性質で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記

例題３－３

例題３－２のデータの評点の右側に中央値，最頻値の見出しをつけてそれぞれの値を【median】【mode】関数を用いて求めよ

平均値と中央値の考え方の違い
nmuhimstat2021-11.png(10453 byte)

平均値（14.55）
nmuhlthstat202102-01.png(21147 byte)

こちらは分布なんて関係なく中央値（15）データの分布に依存する（パラメトリック）＝平均値　と　データの分布に依存しない（ノンパラメトリック）＝中央値，最頻値の関係がわかるかなと思います
例えば５が０に変わってしまうと平均値は大きく変わりますが，中央値は変わりません
パラメトリック・・・数値に依存する（数値の分布によって値が影響を受ける）というとイメージしやすいのかな？

注意

ここでは便利な関数を使えば簡単にできる内容もありました．「関数を覚えないと使えない」ではなく「関数を知っていると便利になる」というところが重要と思っています
今回楽にできる，もしくは丁寧に算出できるもので紹介しなかった関数として【sumproduct】【mode.mult】があります．前者は計算が楽になる．後者は【mode】関数の限界を超えれますが第05回の度数を出せれば把握することが出来ます

第04回　散布度

スプレッドシートソフト（MS-EXCEL）を用いて散布度を算出し特性を理解する
教科書7章-1,8章-2,-3
DSliteracy
【2-1-4】データのばらつき（分散、標準偏差、偏差値）
【2-3-3】データ解析ツール（スプレッドシート）

範囲

ある値～ある値までの広さ

範囲

Range
R=最大値－最小値

特徴
　外れ値もひらう
　算出が用意

最大値と最小値がわかればその集団のバラツキがわかる
最大値maximum excel 【max】関数
最小値minimum excel 【min】関数

例題４－１

例題３－２のデータの評点の右側に最小値，最大値，範囲の見出しをつけてそれぞれの値を求めよ

四分位範囲

小さい順（昇順）に並べて集団を4分割
分割する所の値を小さい方から第１四分位数（Q1），第２四分位数（Q2）＝中央値，第３四分位数（Q3）四分位範囲IQR(interquartile range)=Q3-Q1

四分位数の話

四分位数は出し方が何種類かあります．近年は高校で教育されていますがその方法も従来のものと異なるので細かい話はやめておきます
【QUARTILE.INC】関数で

例題４－２

例題３－２のデータの評点の右側に第１四分位数，第３四分位数，四分位範囲の見出しをつけてそれぞれの値を求めよ

パーセンタイルの話

第１四分位数は２５％タイル値，第２四分位数は50%タイル値，第３四分位数は75%タイル値のことです．
混乱しがちなのは第一四分位数が小さい方から数えてなのに，大きい方から数える人がいます
その時はパーセンタイルで整理したほうが良いかもしれません（100%＝最大値）というのは納得できると思うので上から75%＝第3四分位数

偏差

Deviation
ある基準とする値からのズレ
それぞれのズレの平均を求めたら良いのだろう・・・
nmubiostat2016-0302.png(3064 byte)

分散標準偏差

variance
excel関数は【VAR】【stdev】
例題３－１のデータ（A事業所）を使って説明します

偏差の平均

表の右に偏差を列を設けて計算します
偏差の平均を求めると・・・

偏差平方和の平均=分散

偏差の和が0になるので平方するとバラツキ状況が示せる
【VAR】だがいろいろ出てくる

標準偏差＝分散の正の平方根

標準偏差が出せます．関数を使うと一発で出せますのでご確認を
二種類の関数でも出してください【stdev.p】【stdev.s】

記述統計と推測統計

対象としている集団が全体の一部だった時，全体を推測しなければ全体の事は語れない
平均値は全体を推測する際にそのまま用いても良いのだが，標準偏差はそのようなわけにいかない nmuhlthstat1_2023-0201.png(18729 byte)

課題

本日の授業を受講したうえで，以下の2つの質問
１．理解できた内容，理解できなかった内容について
２．本日の授業の内容に関する質問（内容が概ね理解できているのであれば空欄でも可です）
を締切までに提出の事
締切は授業日翌日朝10時までとする

課題について

真実は一つ　でも　答えは一つじゃない

前半は空港名にもなっている名探偵の言葉になります

鳥取砂丘コナン空港
https://www.ttj-ap-bld.co.jp/

ところで真実はいつも一つというのは，事実を明らかにしていく上で推測する部分がどうしてもでてくるので事実とは言えないが，それも含めて関係者（登場人物および視聴している皆様）それぞれの主観（＝真実）が一つに収束するというところと解釈しています
さすが名探偵です．

＜参考＞事実・真理・真実(論文集)（近藤良樹　広島大学学術情報リポジトリ）
https://ir.lib.hiroshima-u.ac.jp/00021048

一つの操作でも多様なアクセスの仕方があるとわかり面白

隣の人が自分と違うやり方でやっていたのは他にも方法があるから

特に印象に残ったのは、答えは1つでは無いと。情報の授業でこんな刺さる話が聞けるとは

地道な取り組みが求められる高等教育

学習の量による世界から学修の質の世界へ

人に頼るばかりではなくしっかり自分で調べながらゆっくりやっていけばできたので、まずは自分で取り組んでみることを学んだ

大体は理解できた。英単語を覚えるのを頑張りたい

関数名ですが覚えなくてもよく使うものは勝手に覚えますし，必要な時に調べて見つけて思い通りのものか判断できる能力が重要になります

偏差平方が少し理解できなかった
STDEV.Pで標準偏差を求めることができるというのは分かったが、STDEV.Sでは何を求められるのかがわからなかった。

この授業の中では内容的に端折り気味でしたが関数が2種類あることを強調したかったので（次年度の保健統計学で取り扱う内容と把握しています）
今の間にモヤモヤを解消ということでしたらzoom対応しますのでご連絡ください

授業より得られた知見

平均値は、極端な数値があると左右されてしまうということと、最頻値は複数ある場合その全てが最頻値になるということを理解した

$マークをつけることによって数字を固定して使うことができるということがわかった

＄を使うところがとても納得できた。これから先ずっと覚えているかはわからないが

後段がドラマのセリフのようでせつないですね．
忘れても良いように以下のブログがありますのでご活用ください

＜参考＞セルの絶対参照，相対参照（エクセル）(Medbb's blog)
https://medbb.hatenablog.com/entry/2022/07/18/120000

パラメトリックとノンパラメトリックという言葉を初めて聞いたが、半分くらいは軽くだが理解

そんな感じでOKです．次年度の保健統計学で取り扱う内容と把握していたので，こちらでどのようなものか触れておけば次年度みなさん楽になるかなと

疑問

何種類ぐらい関数はあるん？

沢山あります．しかも増え続けます．

保存する時にエクセルブックに変更するのはなぜ

この授業では，CSV形式のデータをダウンロードする格好で進めています．実際にエクセルでダウンロードして作業した後上書き保存するとCSV形式だと計算結果のデータしか残りません．罫線とかグラフとか文字の大きさなど保存できないので　ということをこの授業で経験して未来で失敗しないように

大学の授業の目的

大学は聞かなければならないこと

高校でも中学でも小学校でも聞かなければなりませんし，未来においても特に皆さんはそのことを求められる職種ではないでしょうか？本当に様々な方とコミュニケーションをとらなくてはなりませんから

大学の授業の目的は人の話を聞けるようになることであるということを知った

授業の目的は　様々な人の言うことを理解できるように努力すること　でもある　と授業の最初にお伝えするよう心がけております
— めどぶぶ (@medbb) May 26, 2024

第05回　度数

スプレッドシートソフト（MS-EXCEL）を用いて度数を算出し並び替えについて演習し特性を理解する
教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値（平均値、中央値、最頻値）
【2-3-3】データ解析ツール（スプレッドシート）
使うexcel関数・・・countifもしくはcountifs
度数は質的データでも量的データでも求めることができる

質的データの度数分布表の作成

上記のCSV形式ファイル(nmuhlthstat1_2024-0102.csv)

例題５－１

このファイルは以下のテーブル（情報活用論の例題で利用したもの）
プロ野球　セリーグ及びパリーグの２００１年～２０２３年のデータのテーブル構造を少し見直したものです
kmuipt2024-0501sjis.csv セリーグパリーグ関係なく優勝チームの度数分布表および，優勝監督の度数分布表を作成せよ
チーム名変更など考慮しなくてよい（あとで，その方法について解説します）

年度	セリーグ優勝チーム	セリーグ優勝監督	パリーグ優勝チーム	パリーグ優勝監督
2023	阪神タイガース	岡田彰布	オリックス・バファローズ	中嶋聡
2022	東京ヤクルトスワローズ	高津臣吾	オリックス・バファローズ	中嶋聡
2021	東京ヤクルトスワローズ	高津臣吾	オリックス・バファローズ	中嶋聡
2020	読売ジャイアンツ	原辰徳	福岡ソフトバンクホークス	工藤公康
2019	読売ジャイアンツ	原辰徳	埼玉西武ライオンズ	辻発彦
2018	広島東洋カープ	緒方孝一	埼玉西武ライオンズ	辻発彦
2017	広島東洋カープ	緒方孝一	福岡ソフトバンクホークス	工藤公康
2016	広島東洋カープ	緒方孝一	北海道日本ハムファイターズ	栗山英樹
2015	東京ヤクルトスワローズ	真中満	福岡ソフトバンクホークス	工藤公康
2014	読売ジャイアンツ	原辰徳	福岡ソフトバンクホークス	秋山幸二
2013	読売ジャイアンツ	原辰徳	東北楽天ゴールデンイーグルス	星野仙一
2012	読売ジャイアンツ	原辰徳	北海道日本ハムファイターズ	栗山英樹
2011	中日ドラゴンズ	落合博満	福岡ソフトバンクホークス	秋山幸二
2010	中日ドラゴンズ	落合博満	福岡ソフトバンクホークス	秋山幸二
2009	読売ジャイアンツ	原辰徳	北海道日本ハムファイターズ	梨田昌考
2008	読売ジャイアンツ	原辰徳	埼玉西武ライオンズ	渡邉久信
2007	読売ジャイアンツ	原辰徳	北海道日本ハムファイターズ	ヒルマン
2006	中日ドラゴンズ	落合博満	北海道日本ハムファイターズ	ヒルマン
2005	阪神タイガース	岡田彰布	千葉ロッテマリーンズ	バレンタイン
2004	中日ドラゴンズ	落合博満	西武ライオンズ	伊東勤
2003	阪神タイガース	星野仙一	福岡ダイエーホークス	王貞治
2002	読売ジャイアンツ	原辰徳	西武ライオンズ	伊藤春樹
2001	ヤクルトスワローズ	若松勉	大阪近鉄バファローズ	梨田昌考

例題の出来上がりイメージ
kmuipt2024-0501.png(15825 byte)

例題の後で皆さんと一緒に行うセリーグパリーグ別の優勝監督の出来上がりイメージ
kmuipt2024-0502.png(16557 byte)

合計の欄を最後に追加すると，エクセルのお節介が半端ないことを実感できます

第06回　表の作成(1)

スプレッドシートソフト（MS-EXCEL）を用いて量的変量の度数分布表を作成する
教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値（平均値、中央値、最頻値）
【2-3-3】データ解析ツール（スプレッドシート）

量的変量の度数分布表

例えば身長を0.1cm単位で測定して度数分布表を作成しようとしたとき，全て度数は１で全体の状況の把握が出来ないケースがある
その場合ある程度の区間を設けて度数を求める
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある．

「A～B」は「A以上B未満」と読む格好がスタンダードと思っていますが，分野などによって違うようです
「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように．

階級	階級値	度数	相対度数
130～140	135
140～150	145
150～160	155
160～170	165
170～180	175
計

例題６－１

以下のデータの度数分布表を作成せよ
medbbstat2023-0101.png(5728 byte)

上記のCSV形式ファイル(medbbstat2023-0101.csv)
例題の出来上がりイメージ
kmuipt2024-0503.png(3957 byte)

例題６－２　例題６－１よりの度数分布表より求めた平均値と個票データから直接求めた平均値をもとめ，その違いを比較して差が生じる原因を考えよ

課題

課題について

仰るとおり

よくできる友達の話を聞いてから理解しようという姿勢ではなく、自分で一回聞いて理解しようという姿勢が大事

その方がよくできる友達も喜ぶかと思います．互いに高めあうことに繋がるのではないでしょうか

個表の数値の平均と、階級値の平均に差が生まれるのは個表の数値と階級値の差によるもの？

ただ言われた通りにパソコンを動かすのではなく、なぜこうなるのかを考えることが大切であると理解

良かったです

階級値をだすのにROUNDDOWNをしてから＋5を理解したときにとても感動

高校の数学で、もっと真面目に相対度数などの授業を聞いておくべきだった

卒後にもっとまじめに大学の授業を聞いておくべきとはならないと思います

フォローします

残り時間にしていることがわからない　最後の階級平均のところがバタバタしていてよく分からない

ちょっと詰め込み感がありました

もう少しゆっくり

全体の進行とバランスとりながらのつもりですが，困った時はご連絡ください．都度対応します

第07回　表の作成(2)

スプレッドシートソフト（MS-EXCEL）を用いて複数の表のデータを統合し並び替えやランキングについて演習する
教科書7-1-1(質的データと量的データ)
DSliteracy
【2-3-2】データの並び替え、ランキング
【2-3-3】データ解析ツール（スプレッドシート）
病床機能報告制度のデータより関西医科大学と奈良県立医科大学がそれぞれの地域（基礎自治体）の医療機関（病院）なかでどのような位置付けなのか分析を行う
用いるデータは病床機能報告制度の最新版のデータを用いる

病床機能報告（厚生労働省）
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000055891.html

課題７－１　以下の出来上がりイメージのデータを作成せよ

　 sumifs関数

第08回　データの可視化（１）グラフ

スプレッドシートソフト（MS-EXCEL）を用いてグラフを作成する
教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値（平均値、中央値、最頻値）【2-2-1】データ表現（棒グラフ、折線グラフ、散布図、ヒートマップ）【2-2-4】不適切なグラフ表現（チャートジャンク、不必要な視覚的要素）【2-3-2】データの並び替え、ランキング
【2-3-3】データ解析ツール（スプレッドシート）

例題８－１　以下のグラフを作成せよ

rank.eq関数

課題

課題について

sumifs系

sumifsを使ってすることは理解した。パターンはどれも同じ

SUMIFS関数で膨大な数のデータから自分の欲しい情報を引っ張ってこれるということ

レーダーチャート

レーダーチャート作ってみたかった

後半の人は作れました　すみません

レーダーチャートはどこがその病院の強みなのか分かりやすかった

ランクを使ってデータを視覚化することで情報が整理され、特徴などの読み取りがしやすくなることが理解できた

グラフを作ることで、関連病院の比較ができて面白かった

特徴が視覚化できますよね．順位で行うと相対的な話になり役割（特徴）が明確になるというところです

全集中

1度授業に遅れたらついていけなくなる

集中力の問題と優先順位の話で臨床では授業以上に大変なのでトレーニングと思って
授業ではTAついております

ピックアップ

課題7-1を実際に行って、やり方を理解した。また、課題8-1のグラフはパッと見で見やすく、医療の現場でも大事

高校の時にパソコンの授業はあったが、全然Excelを使ったりしなかったのでこんなにしっかりとやったことが初めて

IFERROR関数がとても便利だった

すみません皆さんに説明しますね（ラウンド中に悩んでいる学生がいたので解決法として　みなさんには置換で対応した件です　それも後半だけですが）

第09回～10回の途中まで　データの可視化（２）様々な可視化

Webで利用できるＧＩＳソフト（jSTAT MAP）や形態素解析器（Web茶まめ）を用いて各種分析を行う
DSliteracy
【1-4-2】データ可視化：複合グラフ、2軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など【1-4-3】非構造化データ処理：言語処理、画像/動画処理、音声/音楽処理など

GIS

実空間の情報を取り扱う

jSTAT MAP
https://www.e-stat.go.jp/gis/gislp/

例題９－１　関西医大から自動車で２０分圏内のエリアを表示する

例題９－２

枚方市内の駅（JR，京阪）を調べた上でプロットデータを作成し（グループ名は枚方市内駅）各駅から徒歩で20分圏内のエリア（エリアのグループ名は駅徒歩10分）を表示する

例題９－４　関西医科大学附属病院から半径2km以内に含まれる枚方市内の駅を検索せよ

例題９－５　枚方市内の小地域（町丁・字等）0歳から4歳までの人口（2020国勢調査より）を地図上に表示せよ

例題９－６　例題９－５のデータをエクセルで表示せよ（レポート作成時地図の表示に注意）

例題９－３

橿原市内の駅（JR，近鉄）を調べた上でプロットデータを作成し（グループ名は橿原市内駅）各駅から徒歩で10分圏内のエリア（エリアのグループ名は駅徒歩10分）を表示する

例題９－７　橿原市内の小地域（町丁・字等）0歳から4歳までの人口（2020国勢調査より）を地図上に表示せよ

例題９－８　例題９－７のデータをエクセルで表示せよ（レポート作成時地図の表示に注意）

テキストマイニング

文章を形態素（単語等）で区切って分析
分析例
futuremed20190406-02.png(165988 byte)

保健医療分野におけるフューチャー・デザインの可能性　より
Web茶まめを使って頻度の高い名詞を抽出せよ

Web茶まめ
https://chamame.ninjal.ac.jp/

例題９－９

次の文章
クリスマスケーキ（大阪赤十字看護専門学校の閉校に寄せて）（Medbb's blog）
https://medbb.hatenablog.com/entry/2022/03/31/000000

第10回　まとめ

試験範囲

〇は範囲　△は一部範囲　×は範囲外

情報処理技術２０２４

〇第01回　PCの基本操作

デジタルとアナログ，データと情報と知識，CSV
〇第02回　データの形式と四則演算

セル参照（表計算ソフト）
〇第03回　代表値

平均値，中央値，最頻値
〇第04回　散布度

範囲，四分位範囲，分散（不偏分散は取り使っていないので対象外）〇第05回　度数

countif関数
〇第06回　表の作成(1)

度数分布表
〇第07回　表の作成(2)

複数の表の結合
〇第08回　データの可視化（１）グラフ

〇第09回　データの可視化（２）様々な可視化

様々なグラフについて特に教科書（9章）もご確認を
×第10回　まとめ

電卓持ち込み可・・・注意事項確認の事
https://medbb.net/education/2024init/

Medbb.net

関西医科大学 情報処理技術２０２４（看護学部看護学科）

課題提出は以下のフォームから https://forms.gle/mrsbZN2PrCE8bHDZ9

2024年度開講にあたって https://medbb.net/education/2024init/ 困った時，オンラインでのサポートやなにかありましたら以下からご連絡ください 私へ連絡・ｵﾝﾗｲﾝｵﾌｨｽｱﾜｰ予約

授業メニュー

第01回 PCの基本操作

PCで出来ること

デジタル化されたデータ

画像の例

演習１

オープンデータ

厚生労働統計一覧（厚生労働省） https://www.mhlw.go.jp/toukei/itiran/index.html

内部で取り扱うデータ

本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)(WAF「Scutum」) https://www.scutum.jp/information/waf_tech_blog/2021/01/waf-blog-077.html

EXCELの利用

キーワード

注意点

CSV形式

演習１－１

＜参考＞UTF-8：Tech Basics／Keyword（＠IT ITmedia Inc.） https://atmarkit.itmedia.co.jp/ait/articles/1603/28/news035.html

非構造化データ

構造化されていない例

第02回 データの形式と四則演算

データ形式(Excel)

例題２－１

演算と関数

セルの参照

例題２－２

提出課題0102

第03回 代表値

平均

算術平均

例題３－１

幾何平均（相乗平均）

加重平均

例題３－２

中央値

最頻値

例題３－３

注意

第04回 散布度

範囲

範囲

例題４－１

四分位範囲

四分位数の話

例題４－２

パーセンタイルの話

偏差

分散 標準偏差

偏差の平均

偏差平方和の平均=分散

標準偏差＝分散の正の平方根

記述統計と推測統計

課題

課題について

真実は一つ でも 答えは一つじゃない

鳥取砂丘コナン空港 https://www.ttj-ap-bld.co.jp/

＜参考＞事実・真理・真実(論文集)（近藤良樹 広島大学 学術情報リポジトリ） https://ir.lib.hiroshima-u.ac.jp/00021048

一つの操作でも多様なアクセスの仕方があるとわかり面白

隣の人が自分と違うやり方でやっていたのは他にも方法があるから

特に印象に残ったのは、答えは1つでは無いと。情報の授業でこんな刺さる話が聞けるとは

地道な取り組みが求められる高等教育

人に頼るばかりではなくしっかり自分で調べながらゆっくりやっていけばできたので、まずは自分で取り組んでみることを学んだ

大体は理解できた。英単語を覚えるのを頑張りたい

偏差平方が少し理解できなかった STDEV.Pで標準偏差を求めることができるというのは分かったが、STDEV.Sでは何を求められるのかがわからなかった。

授業より得られた知見

平均値は、極端な数値があると左右されてしまうということと、最頻値は複数ある場合その全てが最頻値になるということを理解した

$マークをつけることによって数字を固定して使うことができるということがわかった

＄を使うところがとても納得できた。これから先ずっと覚えているかはわからないが

＜参考＞ セルの絶対参照，相対参照（エクセル）(Medbb's blog) https://medbb.hatenablog.com/entry/2022/07/18/120000

パラメトリックとノンパラメトリックという言葉を初めて聞いたが、半分くらいは軽くだが理解

疑問

何種類ぐらい関数はあるん？

保存する時にエクセルブックに変更するのはなぜ

大学の授業の目的

大学は聞かなければならないこと

大学の授業の目的は人の話を聞けるようになることであるということを知った

第05回 度数

質的データの度数分布表の作成

関西医科大学　情報処理技術２０２４
（看護学部看護学科）

課題提出は以下のフォームから
https://forms.gle/mrsbZN2PrCE8bHDZ9

2024年度開講にあたって
https://medbb.net/education/2024init/
困った時，オンラインでのサポートやなにかありましたら以下からご連絡ください
私へ連絡・ｵﾝﾗｲﾝｵﾌｨｽｱﾜｰ予約

第01回　PCの基本操作

厚生労働統計一覧（厚生労働省）
https://www.mhlw.go.jp/toukei/itiran/index.html

本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)(WAF「Scutum」)
https://www.scutum.jp/information/waf_tech_blog/2021/01/waf-blog-077.html

＜参考＞UTF-8：Tech Basics／Keyword（＠IT ITmedia Inc.）
https://atmarkit.itmedia.co.jp/ait/articles/1603/28/news035.html

第02回　データの形式と四則演算

第03回　代表値

第04回　散布度

分散標準偏差

真実は一つ　でも　答えは一つじゃない

鳥取砂丘コナン空港
https://www.ttj-ap-bld.co.jp/

＜参考＞事実・真理・真実(論文集)（近藤良樹　広島大学学術情報リポジトリ）
https://ir.lib.hiroshima-u.ac.jp/00021048

偏差平方が少し理解できなかった
STDEV.Pで標準偏差を求めることができるというのは分かったが、STDEV.Sでは何を求められるのかがわからなかった。

＜参考＞セルの絶対参照，相対参照（エクセル）(Medbb's blog)
https://medbb.hatenablog.com/entry/2022/07/18/120000

第05回　度数

第06回　表の作成(1)

例題６－２　例題６－１よりの度数分布表より求めた平均値と個票データから直接求めた平均値をもとめ，その違いを比較して差が生じる原因を考えよ

残り時間にしていることがわからない　最後の階級平均のところがバタバタしていてよく分からない

第07回　表の作成(2)

病床機能報告（厚生労働省）
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000055891.html

課題７－１　以下の出来上がりイメージのデータを作成せよ

第08回　データの可視化（１）グラフ

例題８－１　以下のグラフを作成せよ

第09回～10回の途中まで　データの可視化（２）様々な可視化

jSTAT MAP
https://www.e-stat.go.jp/gis/gislp/

例題９－１　関西医大から自動車で２０分圏内のエリアを表示する

例題９－４　関西医科大学附属病院から半径2km以内に含まれる枚方市内の駅を検索せよ

例題９－５　枚方市内の小地域（町丁・字等）0歳から4歳までの人口（2020国勢調査より）を地図上に表示せよ

例題９－６　例題９－５のデータをエクセルで表示せよ（レポート作成時地図の表示に注意）

例題９－７　橿原市内の小地域（町丁・字等）0歳から4歳までの人口（2020国勢調査より）を地図上に表示せよ

例題９－８　例題９－７のデータをエクセルで表示せよ（レポート作成時地図の表示に注意）

Web茶まめ
https://chamame.ninjal.ac.jp/

第10回　まとめ