タイトル

科目番号 教室 登録人数 履修登録方法
学共119  文講114  60  抽選対象 
開講年度 期間 曜日時限 開講学部等
2020 前学期 火1 国際地域創造学部国際地域創造学科  
講義コード 科目名[英文名] 単位数
g00580001 データサイエンス初級   2 
担当教員[ローマ字表記]
山田 健太 [Kenta Yamada] 
授業の形態
講義
 
アクティブラーニング
学生が自身の考えを発表する、学生が文献や資料を調べる
 
授業内容と方法
【授業内容】
 コンビニの売り上げ,電車の乗降記録,インターネット上の書き込みなど身の回りの様々なものやサービスが電子化され,コンピュータには日々膨大なデータが蓄積される時代になりました.そして,多くの企業がこれらのデータを活用した事業に取り組もうとし始めていますが,膨大なデータの解析は,まだ歴史も浅くExcelなど表計算ソフトでは解析できない場合もしばしばあります.このような背景から,膨大なデータを解析でき,そこから有用な知見を引き出せる人材(データサイエンティスト)が社会から強く求められていますが,まだ少ないのが現状です.そこで,Excelを用いた基本的なデータ分析から始め,大規模なデータも処理可能であり多くのデータサイエンティストにも利用されているプログラミング言語「Python」を用いて,できる限り身の回りのデータの解析を行い,社会のニーズに応えられる技術力を身につけられるよう授業を行います.

【授業の方法】
 最初に統計学の知識などを説明した後,実データを「Excel」「Python」を用いて自らの手で解析,グラフ化を行い簡単なレポートにまとめる.データ解析プロジェクトでは,自ら解析するデータを選び,これまでの知識をフル活用したデータ解析を行い,得られた結果の発表を行う.
 
URGCC学習教育目標
情報リテラシー、問題解決力
 
達成目標
・「Excel」や「Python」を用いたデータ解析ができるようになる.
・自分の興味のある現象や課題に対して,データサイエンスの基礎的な知識を用いることで,現象の理解や課題の解決を図れるようになる.
・得られた知識を効果的に他人に説明できるようになる.
 
評価基準と評価方法
毎回授業内で作成する小レポート 50%
データ分析プロジェクト発表会の内容 25%
データ分析プロジェクトを基にした期末レポート 25%
 
履修条件
ノートパソコンを持参すること
 
授業計画
1. ガイダンス:データサイエンスとは何か?なぜデータサイエンスを学ぶのか?
2. データ分析のための環境構築:「Excel」「Python」「MeCab」などのインストール,Pythonの基本的操作
3. みんなの好きな数を調べてみよう(Excel, Pythonによる単変量解析):平均値,標準偏差,中央値,四分位,標準化(z値),箱ひげ図
4. サッカーの得点や身長の分布を描いてみよう(Pythonによる分布の描画):ヒストグラム,確率密度関数,ポアソン分布,正規分布,べき分布
5. 野球のスコアの関係を調べよう(Excel, Pythonによる多変量解析):相関係数(ピアソンの積率相関,スピアマンの順位相関),最小二乗法、回帰分析
6. 小説(走れメロス)を解析してみよう(pythonによるテキストマイニング):形態素解析、単語の頻度分布
7. 薬に効果があるかを検定してみよう(pythonによる検定):p値,Fisher検定,カイ二乗検定
8. タピオカブームの推移を調べてみよう(pythonによる時系列の分析):時系列の描画,指数関数,べき関数,自己相関関数
9. 効率的に作業をしよう(pythonでの作業の効率化):スクリプト,自作関数,繰り返しの処理(for文), 条件分岐(if文)
10. 地下鉄の路線図ネットワークを解析してみよう(pythonによる複雑ネットワーク分析):ネットワークの可視化,リンク数,ノード数,コミュニティースモールワールド性,中心性
11. データ解析プロジェクト1:解析するデータを決める,データの下処理を行う
12. データ解析プロジェクト2:データを解析する①
13. データ解析プロジェクト3:データを解析する②
14. データ解析プロジェクト4:発表資料の作成
15. データ解析プロジェクト発表会
 
事前学習
事前に配布資料に目を通しどのような内容を学習するのかを確認する.
 
事後学習
授業を行った内容を確認し,「python」のコマンドをもう一度実行する.
 
教科書にかかわる情報
 
教科書全体備考
 
 
参考書にかかわる情報
参考書 書名 ISBN
487311845X
備考
著者名
Wes McKinney著 ; 瀬戸山雅人, 小林儀匡, 滝口開資訳
出版社
オライリー・ジャパン
出版年
2018
NCID
参考書 書名 ISBN
4535556784
備考
著者名
高安美佐子編著
出版社
日本評論社
出版年
2012
NCID
 
参考書全体備考
 
 
使用言語
日本語
 
メッセージ
新型コロナウイルスの影響のため初回の授業は,5月12日の予定です.
 
オフィスアワー
木曜10:30〜11:30 文系講義棟 521
事前に下記メールアドレスへ連絡しアポイントメントをとるようにしてください
 
メールアドレス
k-yamada@eve.u-ryukyu.ac.jp
 
URL
 
 

ページの先頭へ