授業の形態
|
|
講義、演習又は実験
|
| |
アクティブラーニング
|
|
学生が議論する、学生が自身の考えを発表する、学生が文献や資料を調べる
|
| |
授業内容と方法
|
本講義は「情報可視化」の理論と実践を段階的に習得し、客観的に情報を理解するスキルを身につけるだけでなく,自身の研究や課題のブラッシュアップすることを目的とする。
【授業の流れ】 第1部(第1〜3回):オリエンテーション・NDA署名・最初のLT(各自の課題における議論の明確化・理解) 学生は自身の課題や問いを4分のライトニングトーク(LT)で紹介する。聴衆は Google Form で質問を記入し、「質問バンク(Question Bank)」として共有スプレッドシートに蓄積する。
第2部(第4〜11回):座学+演習(毎回:理論30〜40分・演習50〜60分) 視覚変数・ゲシュタルト原則・EDA・Tidy Data・クレンジング・高次元データ・時系列・インタラクティブ可視化を順に学ぶ。演習は Google Colab を使用し、共通オープンデータ(Gapminder・e-Stat等)を3種類(整備済み・未整備・実世界データ)使い回して理解を深める。
第12回:LLM×可視化の最新動向と倫理的考察
第3部(第13〜15回):最終LT準備・ピアレビュー・最終LT(デモ大会形式) 第1〜3回における自身の課題探求(最初のLT)を理論習得後に再発表する。「課題への問いの変遷カード」(第1回の付箋→第3回の仮宣言→最終の問い)を掲示し、Question Bank で受けた質問への最終回答も発表に組み込む。
|
| |
URGCC学習教育目標
|
|
コミュニケーション・スキル、情報リテラシー、問題解決力、専門性
|
| |
達成目標
|
① 脳の知覚の癖(ゲシュタルト原則)を理解し、データ型に応じた視覚変数を選択できる。 ② データの種類と課題の目的に応じた適切な図表を設計できる(EDA・Tufte の誠実性原則)。 ③ Tidy Data 原則に基づきデータを整理し、クレンジング処理を再現可能なスクリプトとして記録できる。 ④ 高次元・時系列・カテゴリデータの構造を可視化し、特徴を言語化できる。 ⑤ 自身の課題を「課題に対する問い×データ×図」の構造で整理し、4分のLTとして論理的に発表できる。 ⑥ 他者の課題に対して論理的・客観的・誠実な質問を立て、自身の課題探求への問いにも答えられる。
|
| |
評価基準と評価方法
|
【評価配分・合計100点】
①最初のLT+Form質問(第2・3回):20点 4分LTの明確さ、および他者の課題への質問の論理性・客観性・尊重する姿勢を評価する。
②実践課題(第7・10回の2回分):20点 クレンジング・ログ(.ipynb)とグラフィカル・アブストラクト(A4×1枚)。 処理の論理的説明と再現可能なスクリプトが整っているかを評価する。
③ピアレビューシート(第14回):10点 フィードバックの具体性・建設性・尊重する姿勢を評価する。
④最終LT(第15回):50点 可視化設計の適切さ(15点)、Results文章200字の論理性(10点)、 Question Bank最終回答の誠実さ・成長の反映(15点)、発表の明確さと対話(10点)。
合格基準:60点以上
|
| |
履修条件
|
Python(Google Colab)の基本操作ができることが望ましい。 自身の研究テーマを持つ大学院修士課程の学生を対象とする。 第1回にNDA(守秘義務契約)のデジタル署名を行うこと。
|
| |
授業計画
|
【第1部:導入・最初のLT】 第1回:オリエンテーション、情報可視化の意義(歴史・事例)、NDAデジタル署名、Google Form設定確認、LTグループ決定、付箋ブレスト「私の課題で一番伝えたい発見・問いは何か」。
第2回:最初のLT A(Group A・15名)。4分LT(課題の背景・問い・データ・困りごと)、全員静聴後にGoogle FormでQ3「この課題への質問を1つ」を全員分記入(義務)。Form回答は共有スプレッドシート(Question Bank)に蓄積し全員が閲覧可能。
第3回:最初のLT B(Group B・15名)。同フォーマットで実施。冒頭10分で第2回FormデータをPythonで可視化するデモを行う。全員発表後に課題の問い(仮宣言)(全員が自分の課題の問いを1文で黒板に書く)。
【第2部:座学+演習(毎回:理論30〜40分・Google Colab演習50〜60分)】 第4回:脳の「癖」と視覚変数。ゲシュタルト原則(近接・類似・閉合・連続・前景と背景)、Bertinの視覚変数、認知負荷理論、色覚多様性対応。演習:Gapminder データを5種類の視覚変数でエンコードして比較。
第5回:EDAと誠実なグラフ設計。Tufteの誠実性原則(Lie Factor・Data-Ink Ratio・Chartjunk)、データ種別と推奨チャート対応。演習:「問題のある図」3例のリデザイン。
第6回:Tidy Dataとデータパイプライン。Tidy Dataの3原則、Wide/Long変換(pivot/melt)、原本保護・再現性の設計思想。演習:意図的に「汚い」形式のデータをTidy形式に変換。
第7回:データクレンジング実践。重複・欠損・外れ値・表記揺れの処理と判断基準、クレンジング・ログの書き方。演習:汚しデータのクレンジング実践。【実践課題①:クレンジング・ログ提出(.ipynb)】
第8回:高次元データの構造発見。散布図行列・相関ヒートマップ、PCA(主成分分析)の直感的理解、K-meansクラスタリング、類似度・距離。演習:e-Stat データに PCA とクラスタリングを適用。
第9回:時系列データの可視化。トレンド・季節性・残差の分解、移動平均・変化点の可視化、時系列グラフの設計原則。演習:公開時系列データの構成要素を可視化。
第10回:カテゴリ・比較・分布の可視化とグラフィカル・アブストラクト。棒グラフ・箱ひげ図・バイオリンプロットの使い分け、課題の概要を1枚の図で語る方法。演習:比較・分布の図を複数作成し最も伝わる1枚を選ぶ。【実践課題②:グラフィカル・アブストラクト(手書き可・A4×1枚)】
第11回:インタラクティブ可視化。静的・インタラクティブの使い分け、Plotlyの基本構造(Figure・Trace・Layout)。演習:Gapminderデータで動くバブルチャートを作成。
第12回:LLM×可視化の最新動向。最新論文紹介、Colab×Copilot/ChatGPTの実演、AIがクレンジングを誤った場合の影響と倫理。
【第3部:最終LT準備・発表】 第13回:最終LT準備。「課題の問いの変遷カード」作成(第1回付箋→第3回仮宣言→最終の問い)、自分のデータへの可視化手法の適用、Question Bankで受けた質問への最終回答の準備。
第14回:ピアレビュー。4〜5名グループで最終LT草稿を相互批評(各8分発表+グループ討議)。レビュー観点:①課題の問いと図の対応②視覚エンコーディング③Question Bank回答の有無。「褒める1つ・改善提案2つ」ルール。
第15回:最終LT(デモ大会形式・全員同時展示・2ラウンド制)。発表ブース構成:「課題の問いの変遷カード」・主要な可視化成果(図2〜3枚)・Question Bank最終回答・Results文章(200字)。振り返りカード(100字)「この授業で自分の課題探求がどう変わったか」を提出。
|
| |
事前学習
|
【全回共通】前回の演習コードを見直し、エラーがあれば解消しておくこと。
第1回:Nightingale/Snowの可視化事例をWeb検索で調べておく(30分)。 第2・3回:LTスライド(4枚以内)を作成して前日までに提出。 第4回〜:指定したWilke「Fundamentals of Data Visualization」の該当章を読んでおく(30分)。 第13回:最終LTスライドの草稿を作成しておく。 第15回:発表ブース掲示物・提出物をすべて仕上げて臨むこと。
|
| |
事後学習
|
【全回共通】演習で作成したコード・図をGoogle Driveに保存・整理しておくこと(30分)。
第1回:「自分の課題で一番伝えたい発見・問い」を100字でメモする(15分)。 第2・3回:受け取ったQuestion Bankの質問を読み、なぜその疑問が生まれたかを考える(30分)。 第4回:演習で作った図から「最もゲシュタルト原則を活かしている図」と「最も逆らっている図」を選んで理由を1文ずつメモする。 第5回:自身の課題で「最初に作りたい図」を手書きスケッチで描く(チラシの裏でよい)。 第6回:変換スクリプトに日本語コメントを追加して提出(半年後の自分が読めるレベルに)。 第7回:クレンジング・ログを整理して提出形式に整える(60分)。 第8回:PCAの第1・第2主成分が何を表しているかを3〜5行で解釈メモとして記録する。 第13回:ピアレビューに向けてスライドを修正する。 第14回:受けたフィードバックをもとに最終LTを仕上げる。
|
| |
教科書にかかわる情報
|
|
|
| |
教科書全体備考
|
|
教科書は指定しない。講義資料(スライド・コードサンプル・演習データ)をGoogle Classroomで配布する。
|
| |
参考書にかかわる情報
|
|
|
9781492031086
|
無料公開: https://clauswilke.com/dataviz/ ← 毎回の座学参照先
|
|
Claus O. Wilke
|
|
O'Reilly Media
|
2019
|
|
|
|
9781466508910
|
VAD:可視化設計の標準教科書。付属データも演習で参照可能
|
|
Tamara Munzner
|
|
CRC Press
|
2014
|
|
|
Tidy Data(論文)
|
|
無料公開: https://vita.had.co.nz/papers/tidy-data.pdf
|
|
Hadley Wickham
|
|
Journal of Statistical Software
|
2014
|
|
|
|
9780961392147
|
|
|
Edward R. Tufte
|
|
Graphics Press
|
2001
|
|
|
|
9780691181622
|
無料公開: https://socviz.co/
|
|
Kieran Healy
|
|
Princeton University Press
|
2018
|
|
|
|
| |
参考書全体備考
|
・Wilke, C. O. (2019). Fundamentals of Data Visualization. O'Reilly. (無料公開:https://clauswilke.com/dataviz/)← 毎回の座学の参照先として使用 ・Munzner, T. (2014). Visualization Analysis and Design. CRC Press. (VAD:可視化設計の標準教科書。付属データも演習で参照可能) ・Wickham, H. (2014). Tidy Data. Journal of Statistical Software. (無料公開:https://vita.had.co.nz/papers/tidy-data.pdf) ・Tufte, E. R. (2001). The Visual Display of Quantitative Information (2nd ed.). Graphics Press.
|
| |
使用言語
|
|
日本語
|
| |
メッセージ
|
この講義では「きれいな図を作ること」よりも「なぜその図を選んだか」「データをどう整備したか」「他者の課題や話題にどんな質問を立てられるか」を重視します。 最初のLTと最終LTを並べたとき、自分の課題の問いがどう深まったかを実感できることがこの講義の目標です。 手書きのスケッチや付箋からスタートしていい。チラシの裏からでも問いは深まります。
|
| |
オフィスアワー
|
|
|
| |
メールアドレス
|
|
この項目は教務情報システムにログイン後、表示されます。
|
| |
URL
|
|
|
| |
|
|