関西医科大学 情報処理技術2024
(看護学部看護学科)
シラバス上で
事後学修:講義を振り返り①感想②不明な部分③理解した部分④その他コメントを簡潔にまとめ講義サイトより提出の事(30分程度)
としている部分ですが
事後学修:講義を振り返り「提出課題」について授業中の指示に従って提出の事(KMULASもしくは講義サイトについても指示します)(30分程度)
と読み替えてください
また二コマ連続で行っていますので,提出課題については日単位で提出となります
課題提出は以下のフォームから
https://forms.gle/mrsbZN2PrCE8bHDZ9
2024年度開講にあたって
https://medbb.net/education/2024init/
困った時,オンラインでのサポートやなにかありましたら以下からご連絡ください
私へ連絡・オンラインオフィスアワー予約
この講義では情報処理に関する装置の技術的な話(コンピュータの5大要素(装置))などはしません.
コンピュータを道具としてどのようにデータの取り扱いに関する技術を中心に行っていきます
授業メニュー
第01回 PCの基本操作
第02回 データの形式と四則演算
第03回 代表値
第04回 散布度
第05回 度数
第06回 表の作成(1)
第07回 表の作成(2)
第08回 データの可視化(1)グラフ
第09回 データの可視化(2)様々な可視化
第10回 まとめ
第01回 PCの基本操作
PCの基本的な操作とアプリケーションソフトウェアと用いるファイル形式について演習する教科書4-1(身近に広がるデータサイエンス),4-2(販売データ),7-3-1(オープンデータの活用方法)
DSliteracy
【1-2-1】調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
【1-2-5】データのオープン化(オープンデータ)
【1-4-3】非構造化データ処理:言語処理、画像/動画処理、音声/音楽処理など
【2-3-3】データ解析ツール(スプレッドシート)
【2-3-4】表形式のデータ(csv)
PCで出来ること
デジタル化されたデータを取り扱うことができるデジタル化されたデータ
数値,文字(記号),音,絵,映像・・・・画像の例
(情報通信技術の活用による効果的な学修環境の構築について より)
色深度(bpp)
1bit ■ ■ ■ ■ ■ ■ ■ ■
2bit ■ ■ ■ ■ ■ ■ ■ ■
3bit ■ ■ ■ ■ ■ ■ ■ ■
私たちの物理空間が連続の世界(アナログ)に対してサイバー空間は不連続(離散)の世界(デジタル)である.
サイバー空間が物理空間の世界に近づく(追い越す)には不連続なものを細かくして大量に集めることで連続に近づく
上記は色の不連続なものを細かくした件
演習1
インターネット上にある音や画像,映像のデジタルデータを確認せよオープンデータ
(オープンデータで読み解く地域包括ケア -不足の観点からみる医療2.21- より)
近年は国や地方自治体から様々なデータが提供されている
厚生労働統計一覧(厚生労働省)
https://www.mhlw.go.jp/toukei/itiran/index.html
内部で取り扱うデータ
業務で発生するデータなどは,プライバシーに関する情報も含まれたりするので内部で利用するケースが多いログ等大量に発生するものもある.
本物のウェブアクセスログを使用した、機械学習による異常検知(全データ/ソースコード公開)(WAF「Scutum」)
https://www.scutum.jp/information/waf_tech_blog/2021/01/waf-blog-077.html
「統計」は集団のデータを取りまとめることで個々の状態ではなく集団の状態を可視化したり,推測したりする
あるモノやコトからデータとなり情報そして知識の流れ.データや情報や知識をまとめて「情報」ということもある
(「保健医療分野の情報化」これまでからこれからへ より)
EXCELの利用
起動してみましょう.キーワード
セルセル番地
数式バーとセルの表示
計算式
関数
セルの参照(絶対,相対)
グラフの作成
保存は大切
保存形式はありのままなら,標準形式(xlsx),データだけならcsvが便利
注意点
デジタルの世界はアナログと違って自在に複写や移動が出来るので,表現する内容(素材)を最初に作ってそこからデザインを考える方が無難全体の出来上がりイメージを持つのもいいが,変わるケースが多い
CSV形式
演習1-1
示すファイルを用いてアプリケーションや文字コードによってデータがどのように表示されるか確認せよxlsx形式(Excel標準)のファイル
csv形式(文字コードはwindows標準のShift-JIS形式)
csv形式(文字コードは世界中で使われるUTF-8形式)
<参考>UTF-8:Tech Basics/Keyword(@IT ITmedia Inc.)
https://atmarkit.itmedia.co.jp/ait/articles/1603/28/news035.html
非構造化データ
構造化データ・・・表形式のようにデータが定義されていて処理しやすいもの(例 住所録)氏名 | 住所 | 電話番号 |
---|---|---|
〇〇一郎 | 大阪府 | 06-XXXX-XXXX |
山田△〇 | 奈良県 | 0742-XXXX-XXXX |
非構造化データ・・構造化データと違いデータが定義されていないもの(例 文章)
構造化されていない例
〇〇一郎さん知ってますよ,大阪府にお住まいで,連絡は06-XXXX-XXXXに電話したら取れると思います.山田さんですか,ちょっと待ってくださいよ.奈良県に引っ越されたんですよね.連絡先は0742-XXXX-XXXXです
第02回 データの形式と四則演算
スプレッドシートソフト(MS-Excel)を用いて取り扱うデータ形式を理解し,四則演算および関数について演習する教科書7章-1,8章-1,-3 DSliteracy
【2-3-1】データの集計(和、平均)
【2-3-3】データ解析ツール(スプレッドシート)
データ形式(Excel)
例題2-1
演算と関数
四則演算 +-×÷ → + - * /セルの参照
極力手打ちでデータを入力しないように.(人は間違える)エクセルに,どのセルの値なのか場所を教えてあげる
例題2-2
例題2-2の結果より合計金額と平均金額を算出する
よく使う計算は関数が用意されている.
合計はsum関数 平均はaverage関数
提出課題0102
kmuipt2024-0201.csv
提出するファイル名は学籍番号と氏名と本日の日付とする.
学籍番号 12321 氏名が 大阪一郎 授業日が 2024年4月12日 なら
12321大阪一郎20240412
となる.そのあとに拡張子がついているはずなので
12321大阪一郎20240412.xlsx
注意)英数字は半角のこと(守られていないと減点対象とする)
第03回 代表値
スプレッドシートソフト(MS-EXCEL)を用いて代表値を算出し特性を理解する教科書7章-1,8章-1,-3
DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
【2-3-3】データ解析ツール(スプレッドシート)
average(その集団でとりまとめたデータを数値一つで表す。excelはaverage関数で算術平均を出すが、代表値の代表ということだからと解釈しています)
平均
算術平均
meanexcel関数【average】(先週利用済み) 1/n・Σxi
パレートの法則(80-20の法則)
代表値なのに実在しない場合がある → 集団の指標(重心)であって、事象を代表する値そのものを示しているとは限らない
例題3-1
以下のデータより合計と算術平均を求めよkmuipt2024-0301sjis.csv
なお合計は【sum】関数,算術平均は【average】関数を用いること
それぞれA事業所の算出に用いた数式をそのままB事業所,C事業所の欄にコピーして計算の事
幾何平均(相乗平均)
全て掛け合わせて累乗根をとる例えば1と2と4の平均
算術平均 (1+2+4)/3=2.3333
幾何平均 3√(1×2×4)=2
加重平均
重みづけ平均例えば ミニテストと期末試験の平均をとる → そのままの平均で良いの?
ミニテスト30%期末試験70%
それぞれ40点,70点の場合
40×0.3+70×0.7=12+49=61
例題3-2
とある県の公立高校の入試における内申点は中学2年,3年の成績を対象に9教科5段階の評価を2年次は45点満点,3年時は90点満点で算出している内申点およびそれに基づく評点(内申点より求めた1科目あたりの評価)を求めよ
kmuipt2024-0302sjis.csv
<参考>
【奈良県】公立高校入試での内申点の計算の仕方(進研ゼミ中学講座 ベネッセ)
https://czemi.benesse.ne.jp/open/nyushi/exam/29/feature/1273791_5352.html
高校受験の内申点とは?評価方法と地域ごとの違い・計算方法まで解説(湘ゼミコラム 湘南ゼミナール)
https://www.shozemi.com/column/highexam/16299/
内申点の計算の仕方(小美野塾)
https://kominojuku.ti-da.net/e7184603.html
中央値
median(別名第2四分位数)量的変量を順序尺度の性質で処理した代表値
順番に並べたとき真ん中の順位にきた個体の値
個体数が偶数の時は真ん中2つの数値の平均値
最頻値
mode(流行,はやり)違う意味で数の理論(多数決)の世界
量的変量を名義尺度の性質で処理した代表値
名義尺度でわかることは一緒か違うか
階級毎に度数をカウント
一番多いところの階級値
一位が同点の時は併記
例題3-3
例題3-2のデータの評点の右側に中央値,最頻値の見出しをつけてそれぞれの値を【median】【mode】関数を用いて求めよ
平均値と中央値の考え方の違い 平均値(14.55) こちらは分布なんて関係なく中央値(15) データの分布に依存する(パラメトリック)=平均値 と データの分布に依存しない(ノンパラメトリック)=中央値,最頻値の関係がわかるかなと思います 例えば5が0に変わってしまうと平均値は大きく変わりますが,中央値は変わりません パラメトリック・・・数値に依存する(数値の分布によって値が影響を受ける)というとイメージしやすいのかな? |
注意
ここでは便利な関数を使えば簡単にできる内容もありました.「関数を覚えないと使えない」ではなく「関数を知っていると便利になる」というところが重要と思っています今回楽にできる,もしくは丁寧に算出できるもので紹介しなかった関数として【sumproduct】【mode.mult】があります.前者は計算が楽になる.後者は【mode】関数の限界を超えれますが第05回の度数を出せれば把握することが出来ます
第04回 散布度
スプレッドシートソフト(MS-EXCEL)を用いて散布度を算出し特性を理解する教科書7章-1,8章-2,-3
DSliteracy
【2-1-4】データのばらつき(分散、標準偏差、偏差値)
【2-3-3】データ解析ツール(スプレッドシート)
範囲
ある値~ある値までの広さ範囲
RangeR=最大値-最小値
特徴
外れ値もひらう
算出が用意
最大値と最小値がわかればその集団のバラツキがわかる
最大値maximum excel 【max】関数
最小値minimum excel 【min】関数
例題4-1
例題3-2のデータの評点の右側に最小値,最大値,範囲の見出しをつけてそれぞれの値を求めよ四分位範囲
小さい順(昇順)に並べて集団を4分割分割する所の値を小さい方から第1四分位数(Q1),第2四分位数(Q2)=中央値,第3四分位数(Q3) 四分位範囲IQR(interquartile range)=Q3-Q1
四分位数の話
四分位数は出し方が何種類かあります.近年は高校で教育されていますがその方法も従来のものと異なるので細かい話はやめておきます【QUARTILE.INC】関数で
例題4-2
例題3-2のデータの評点の右側に第1四分位数,第3四分位数,四分位範囲の見出しをつけてそれぞれの値を求めよパーセンタイルの話
第1四分位数は25%タイル値,第2四分位数は50%タイル値,第3四分位数は75%タイル値のことです.混乱しがちなのは第一四分位数が小さい方から数えてなのに,大きい方から数える人がいます
その時はパーセンタイルで整理したほうが良いかもしれません(100%=最大値)というのは納得できると思うので上から75%=第3四分位数
偏差
Deviationある基準とする値からのズレ
それぞれのズレの平均を求めたら良いのだろう・・・
分散 標準偏差
varianceexcel関数は【VAR】【stdev】
例題3-1のデータ(A事業所)を使って説明します
偏差の平均
表の右に偏差を列を設けて計算します偏差の平均を求めると・・・
偏差平方和の平均=分散
偏差の和が0になるので平方するとバラツキ状況が示せる【VAR】だがいろいろ出てくる
標準偏差=分散の正の平方根
標準偏差が出せます. 関数を使うと一発で出せますのでご確認を二種類の関数でも出してください【stdev.p】【stdev.s】
記述統計と推測統計
対象としている集団が全体の一部だった時,全体を推測しなければ全体の事は語れない平均値は全体を推測する際にそのまま用いても良いのだが,標準偏差はそのようなわけにいかない
課題
本日の授業を受講したうえで,以下の2つの質問1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする
課題について
真実は一つ でも 答えは一つじゃない
前半は空港名にもなっている名探偵の言葉になります鳥取砂丘コナン空港
https://www.ttj-ap-bld.co.jp/
ところで真実はいつも一つというのは,事実を明らかにしていく上で推測する部分がどうしてもでてくるので事実とは言えないが,それも含めて関係者(登場人物および視聴している皆様)それぞれの主観(=真実)が一つに収束するというところと解釈しています
さすが名探偵です.
<参考>事実・真理・真実(論文集)(近藤良樹 広島大学 学術情報リポジトリ)
https://ir.lib.hiroshima-u.ac.jp/00021048
一つの操作でも多様なアクセスの仕方があるとわかり面白
隣の人が自分と違うやり方でやっていたのは他にも方法があるから
特に印象に残ったのは、答えは1つでは無いと。情報の授業でこんな刺さる話が聞けるとは
地道な取り組みが求められる高等教育
学習の量による世界から学修の質の世界へ人に頼るばかりではなくしっかり自分で調べながらゆっくりやっていけばできたので、まずは自分で取り組んでみることを学んだ
大体は理解できた。英単語を覚えるのを頑張りたい
関数名ですが覚えなくてもよく使うものは勝手に覚えますし,必要な時に調べて見つけて思い通りのものか判断できる能力が重要になります偏差平方が少し理解できなかった
STDEV.Pで標準偏差を求めることができるというのは分かったが、STDEV.Sでは何を求められるのかがわからなかった。
この授業の中では内容的に端折り気味でしたが関数が2種類あることを強調したかったので(次年度の保健統計学で取り扱う内容と把握しています)今の間にモヤモヤを解消ということでしたらzoom対応しますのでご連絡ください
授業より得られた知見
平均値は、極端な数値があると左右されてしまうということと、最頻値は複数ある場合その全てが最頻値になるということを理解した
$マークをつけることによって数字を固定して使うことができるということがわかった
$を使うところがとても納得できた。これから先ずっと覚えているかはわからないが
後段がドラマのセリフのようでせつないですね.忘れても良いように以下のブログがありますのでご活用ください
<参考>
セルの絶対参照,相対参照(エクセル)(Medbb's blog)
https://medbb.hatenablog.com/entry/2022/07/18/120000
パラメトリックとノンパラメトリックという言葉を初めて聞いたが、半分くらいは軽くだが理解
そんな感じでOKです.次年度の保健統計学で取り扱う内容と把握していたので,こちらでどのようなものか触れておけば次年度みなさん楽になるかなと疑問
何種類ぐらい関数はあるん?
沢山あります.しかも増え続けます.保存する時にエクセルブックに変更するのはなぜ
この授業では,CSV形式のデータをダウンロードする格好で進めています.実際にエクセルでダウンロードして作業した後上書き保存するとCSV形式だと計算結果のデータしか残りません.罫線とかグラフとか文字の大きさなど保存できないので ということをこの授業で経験して未来で失敗しないように大学の授業の目的
大学は聞かなければならないこと
高校でも中学でも小学校でも聞かなければなりませんし,未来においても特に皆さんはそのことを求められる職種ではないでしょうか?本当に様々な方とコミュニケーションをとらなくてはなりませんから大学の授業の目的は人の話を聞けるようになることであるということを知った
授業の目的は 様々な人の言うことを理解できるように努力すること でもある と授業の最初にお伝えするよう心がけております
— めどぶぶ (@medbb) May 26, 2024
第05回 度数
スプレッドシートソフト(MS-EXCEL)を用いて度数を算出し並び替えについて演習し特性を理解する教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
【2-3-3】データ解析ツール(スプレッドシート)
使うexcel関数・・・countifもしくはcountifs
度数は質的データでも量的データでも求めることができる
質的データの度数分布表の作成
上記のCSV形式ファイル(nmuhlthstat1_2024-0102.csv)
例題5-1
このファイルは以下のテーブル(情報活用論の例題で利用したもの)プロ野球 セリーグ及びパリーグの2001年~2023年のデータのテーブル構造を少し見直したものです
kmuipt2024-0501sjis.csv セリーグパリーグ関係なく優勝チームの度数分布表および,優勝監督の度数分布表を作成せよ
チーム名変更など考慮しなくてよい(あとで,その方法について解説します)
年度 | セリーグ優勝チーム | セリーグ優勝監督 | パリーグ優勝チーム | パリーグ優勝監督 |
2023 | 阪神タイガース | 岡田彰布 | オリックス・バファローズ | 中嶋聡 |
2022 | 東京ヤクルトスワローズ | 高津臣吾 | オリックス・バファローズ | 中嶋聡 |
2021 | 東京ヤクルトスワローズ | 高津臣吾 | オリックス・バファローズ | 中嶋聡 |
2020 | 読売ジャイアンツ | 原辰徳 | 福岡ソフトバンクホークス | 工藤公康 |
2019 | 読売ジャイアンツ | 原辰徳 | 埼玉西武ライオンズ | 辻発彦 |
2018 | 広島東洋カープ | 緒方孝一 | 埼玉西武ライオンズ | 辻発彦 |
2017 | 広島東洋カープ | 緒方孝一 | 福岡ソフトバンクホークス | 工藤公康 |
2016 | 広島東洋カープ | 緒方孝一 | 北海道日本ハムファイターズ | 栗山英樹 |
2015 | 東京ヤクルトスワローズ | 真中満 | 福岡ソフトバンクホークス | 工藤公康 |
2014 | 読売ジャイアンツ | 原辰徳 | 福岡ソフトバンクホークス | 秋山幸二 |
2013 | 読売ジャイアンツ | 原辰徳 | 東北楽天ゴールデンイーグルス | 星野仙一 |
2012 | 読売ジャイアンツ | 原辰徳 | 北海道日本ハムファイターズ | 栗山英樹 |
2011 | 中日ドラゴンズ | 落合博満 | 福岡ソフトバンクホークス | 秋山幸二 |
2010 | 中日ドラゴンズ | 落合博満 | 福岡ソフトバンクホークス | 秋山幸二 |
2009 | 読売ジャイアンツ | 原辰徳 | 北海道日本ハムファイターズ | 梨田昌考 |
2008 | 読売ジャイアンツ | 原辰徳 | 埼玉西武ライオンズ | 渡邉久信 |
2007 | 読売ジャイアンツ | 原辰徳 | 北海道日本ハムファイターズ | ヒルマン |
2006 | 中日ドラゴンズ | 落合博満 | 北海道日本ハムファイターズ | ヒルマン |
2005 | 阪神タイガース | 岡田彰布 | 千葉ロッテマリーンズ | バレンタイン |
2004 | 中日ドラゴンズ | 落合博満 | 西武ライオンズ | 伊東勤 |
2003 | 阪神タイガース | 星野仙一 | 福岡ダイエーホークス | 王貞治 |
2002 | 読売ジャイアンツ | 原辰徳 | 西武ライオンズ | 伊藤春樹 |
2001 | ヤクルトスワローズ | 若松勉 | 大阪近鉄バファローズ | 梨田昌考 |
例題の後で皆さんと一緒に行うセリーグパリーグ別の優勝監督の出来上がりイメージ
合計の欄を最後に追加すると,エクセルのお節介が半端ないことを実感できます
第06回 表の作成(1)
スプレッドシートソフト(MS-EXCEL)を用いて量的変量の度数分布表を作成する教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
【2-3-3】データ解析ツール(スプレッドシート)
量的変量の度数分布表
例えば身長を0.1cm単位で測定して度数分布表を作成しようとしたとき,全て度数は1で全体の状況の把握が出来ないケースがあるその場合ある程度の区間を設けて度数を求める
量的変数の場合はその数値だけで度数を積み上げようにもなかなか上手くいかない場合がある.
「A~B」は「A以上B未満」と読む格好がスタンダードと思っていますが,分野などによって違うようです 「A以上B以下」のようにどちらの階級にも属してしまう可能性のある設定はしないように. |
階級 | 階級値 | 度数 | 相対度数 |
---|---|---|---|
130~140 | 135 | ||
140~150 | 145 | ||
150~160 | 155 | ||
160~170 | 165 | ||
170~180 | 175 | ||
計 |
例題6-1
以下のデータの度数分布表を作成せよ上記のCSV形式ファイル(medbbstat2023-0101.csv)
例題の出来上がりイメージ
例題6-2 例題6-1よりの度数分布表より求めた平均値と個票データから直接求めた平均値をもとめ,その違いを比較して差が生じる原因を考えよ
課題
本日の授業を受講したうえで,以下の2つの質問1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする
課題について
仰るとおり
よくできる友達の話を聞いてから理解しようという姿勢ではなく、自分で一回聞いて理解しようという姿勢が大事
その方がよくできる友達も喜ぶかと思います.互いに高めあうことに繋がるのではないでしょうか個表の数値の平均と、階級値の平均に差が生まれるのは個表の数値と階級値の差によるもの?
ただ言われた通りにパソコンを動かすのではなく、なぜこうなるのかを考えることが大切であると理解
良かったです
階級値をだすのにROUNDDOWNをしてから+5を理解したときにとても感動
高校の数学で、もっと真面目に相対度数などの授業を聞いておくべきだった
卒後にもっとまじめに大学の授業を聞いておくべきとはならないと思いますフォローします
残り時間にしていることがわからない 最後の階級平均のところがバタバタしていてよく分からない
ちょっと詰め込み感がありましたもう少しゆっくり
全体の進行とバランスとりながらのつもりですが,困った時はご連絡ください.都度対応します第07回 表の作成(2)
スプレッドシートソフト(MS-EXCEL)を用いて複数の表のデータを統合し並び替えやランキングについて演習する教科書7-1-1(質的データと量的データ)
DSliteracy
【2-3-2】データの並び替え、ランキング
【2-3-3】データ解析ツール(スプレッドシート)
病床機能報告制度のデータより関西医科大学と奈良県立医科大学がそれぞれの地域(基礎自治体)の医療機関(病院)なかでどのような位置付けなのか分析を行う
用いるデータは病床機能報告制度の最新版のデータを用いる
病床機能報告(厚生労働省)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000055891.html
課題7-1 以下の出来上がりイメージのデータを作成せよ
sumifs関数第08回 データの可視化(1)グラフ
スプレッドシートソフト(MS-EXCEL)を用いてグラフを作成する教科書7-1-1(質的データと量的データ) DSliteracy
【2-1-2】データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値) 【2-2-1】データ表現(棒グラフ、折線グラフ、散布図、ヒートマップ) 【2-2-4】不適切なグラフ表現(チャートジャンク、不必要な視覚的要素) 【2-3-2】データの並び替え、ランキング
【2-3-3】データ解析ツール(スプレッドシート)
例題8-1 以下のグラフを作成せよ
rank.eq関数課題
本日の授業を受講したうえで,以下の2つの質問1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする
課題について
sumifs系
sumifsを使ってすることは理解した。パターンはどれも同じ
SUMIFS関数で膨大な数のデータから自分の欲しい情報を引っ張ってこれるということ
レーダーチャート
レーダーチャート作ってみたかった
後半の人は作れました すみませんレーダーチャートはどこがその病院の強みなのか分かりやすかった
ランクを使ってデータを視覚化することで情報が整理され、特徴などの読み取りがしやすくなることが理解できた
グラフを作ることで、関連病院の比較ができて面白かった
特徴が視覚化できますよね.順位で行うと相対的な話になり役割(特徴)が明確になるというところです全集中
1度授業に遅れたらついていけなくなる
集中力の問題と優先順位の話で臨床では授業以上に大変なのでトレーニングと思って授業ではTAついております
ピックアップ
課題7-1を実際に行って、やり方を理解した。また、課題8-1のグラフはパッと見で見やすく、医療の現場でも大事
高校の時にパソコンの授業はあったが、全然Excelを使ったりしなかったのでこんなにしっかりとやったことが初めて
IFERROR関数がとても便利だった
すみません皆さんに説明しますね(ラウンド中に悩んでいる学生がいたので解決法として みなさんには置換で対応した件です それも後半だけですが)第09回~10回の途中まで データの可視化(2)様々な可視化
Webで利用できるGISソフト(jSTAT MAP)や形態素解析器(Web茶まめ)を用いて各種分析を行うDSliteracy
【1-4-2】データ可視化:複合グラフ、2軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など 【1-4-3】非構造化データ処理:言語処理、画像/動画処理、音声/音楽処理など
GIS
実空間の情報を取り扱うjSTAT MAP
https://www.e-stat.go.jp/gis/gislp/
例題9-1 関西医大から自動車で20分圏内のエリアを表示する
例題9-2
枚方市内の駅(JR,京阪)を調べた上でプロットデータを作成し(グループ名は枚方市内駅)各駅から徒歩で20分圏内のエリア(エリアのグループ名は駅徒歩10分)を表示する
例題9-4 関西医科大学附属病院から半径2km以内に含まれる枚方市内の駅を検索せよ
例題9-5 枚方市内の小地域(町丁・字等)0歳から4歳までの人口(2020国勢調査より)を地図上に表示せよ
例題9-6 例題9-5のデータをエクセルで表示せよ(レポート作成時地図の表示に注意)
例題9-3
橿原市内の駅(JR,近鉄)を調べた上でプロットデータを作成し(グループ名は橿原市内駅)各駅から徒歩で10分圏内のエリア(エリアのグループ名は駅徒歩10分)を表示する
例題9-7 橿原市内の小地域(町丁・字等)0歳から4歳までの人口(2020国勢調査より)を地図上に表示せよ
例題9-8 例題9-7のデータをエクセルで表示せよ(レポート作成時地図の表示に注意)
テキストマイニング
文章を形態素(単語等)で区切って分析分析例
保健医療分野におけるフューチャー・デザインの可能性 より
Web茶まめを使って頻度の高い名詞を抽出せよ
Web茶まめ
https://chamame.ninjal.ac.jp/
例題9-9
次の文章クリスマスケーキ(大阪赤十字看護専門学校の閉校に寄せて)(Medbb's blog)
https://medbb.hatenablog.com/entry/2022/03/31/000000
第10回 まとめ
試験範囲
〇は範囲 △は一部範囲 ×は範囲外情報処理技術2024
〇第01回 PCの基本操作デジタルとアナログ,データと情報と知識,CSV
〇第02回 データの形式と四則演算
セル参照(表計算ソフト)
〇第03回 代表値
平均値,中央値,最頻値
〇第04回 散布度
範囲,四分位範囲,分散(不偏分散は取り使っていないので対象外) 〇第05回 度数
countif関数
〇第06回 表の作成(1)
度数分布表
〇第07回 表の作成(2)
複数の表の結合
〇第08回 データの可視化(1)グラフ
〇第09回 データの可視化(2)様々な可視化
様々なグラフについて特に教科書(9章)もご確認を
×第10回 まとめ
電卓持ち込み可・・・注意事項確認の事
https://medbb.net/education/2024init/
課題
本日の授業を受講したうえで,以下の2つの質問1.理解できた内容,理解できなかった内容について
2.本日の授業の内容に関する質問(内容が概ね理解できているのであれば空欄でも可です)
を締切までに提出の事
締切は授業日翌日朝10時までとする