科目番号
教室
登録人数
履修登録方法
対面/遠隔
30
抽選対象
対面授業
開講年度
期間
曜日時限
開講学部等
2017
前学期
火5
理工学研究科情報工学専攻
講義コード
科目名[英文名]
単位数
R01672001
データマイニング論
2
担当教員[ローマ字表記]
當間 愛晃
授業の形態
アクティブラーニング
授業内容と方法
*特別プログラム(留学生向けプログラム)と同時開講のため、留学生受講時には英語になります。
データから再利用可能な知識を掘り起こす一連のプロセスをデータマイニングと呼ぶ。
本授業は以下2,3のパートに分けて実施する予定である。
[Part 1] では、データマイニング・プロセスもしくはプロセスの一手段である機械学習について学ぶ。
[Part 2] では、最新の研究論文輪読を通して応用例について議論する。
また、調整により、最後の数週間を「各自研究への応用検討」に変更する可能性がある。
毎回2名程度受講者を発表担当者に割り当て、担当する文献について解説発表を行う。
URGCC学習教育目標
達成目標
・データマイニングの代表的なプロセス、もしくは機械学習のモデルについて説明することができる。[Part 1]
・最新事例を読み、各プロセスを説明することができる。[Part 2]
応用検討を実施する際には、下記目標を追加する。
・1つ以上のプロセスを、自身の身近な例に適用を試みる(設計する)ことができる。
・生データや結果観察を通し、プロセスを評価・考察することができる。
評価基準と評価方法
文献により割り当てられたトピックについて発表を行い議論する。発表は英語を標準とする。
発表(50%)、発表資料(20%)、質疑応答(30%)。
履修条件
線形代数学、統計学、プログラミング経験を有すること。
授業計画
第1回: ガイダンス、書籍輪読調整
======================================
[Part 1] データマイニング・プロセス、もしくは機械学習モデルの基礎学習
<データマイニング・プロセス編>
第2回: データマイニングとは?(定義や例題から考えてみよう)
第3回: 機械学習と統計処理、個人情報等の観点
第4回: 入力(インスタンスと属性)と出力(知識表現)
第5回: 基本的な考え方・アルゴリズム1
第6回: 基本的な考え方・アルゴリズム2
第7回: 信頼性のある実験・評価方法
<機械学習編>
第2回:機械学習概観
第3回:パーセプトロンによる分類学習
第4回:Scikit-learnが有する分類器概観
第5回:学習用データの構築・前処理
第6回:次元削減によるデータ圧縮
第7回:モデル評価とハイパーパラメータ調整
第8回:予備日(パート2調整)
======================================
[Part 2] 応用事例に関する輪読&討論
第9回:事例読解1
第10回:事例読解2
第11回:事例読解3
第12回:事例読解4
第13回:事例読解5
======================================
[Part 3] Part 2の続き or 自身の研究紹介を通した応用検討
第14回:事例読解6 or 研究紹介
第15回:事例読解7 or 研究紹介
事前学習
参考書および関連事例に目を通すこと。
事後学習
参考書および関連事例に目を通すこと。
教科書にかかわる情報
教科書全体備考
教科書指定なし。
参考書にかかわる情報
参考書
書名
Data Mining: Practical Machine Learning Tools and Techniques, Third Edition
ISBN
0123748569
備考
Part 1にて輪読予定。
著者名
Ian H. Witten, Eibe Frank, Mark A. Hall, Morgan Kaufmann
出版社
Morgan Kaufmann
出版年
2011
NCID
参考書
書名
Python Machine Learning: Unlock Deeper Insights into Machine Learning With This Vital Guide to Cutting-edge Predictive Analytics
ISBN
1783555130
備考
Part 1にて輪読予定。
著者名
Sebastian Raschka
出版社
Packt Publishing
出版年
2015
NCID
参考書全体備考
使用言語
日本語
メッセージ
*特別プログラム(留学生向けプログラム)と同時開講のため、留学生受講時には英語になります。
パート2では以下学会における過去5年間におけるベストペーパーの輪読を想定している。ただしデータマイニングは幅広いテーマであることから、これ以外の学術論文であっても解説紹介をしても構わない。希望のある学生は相談すること。
・アプリケーション寄り
IEEE/WIC/ACM International Conference on Web Intelligence (IEEE/WIC/ACM WI)
ACM International Conference on Web Search and Data Mining (ACM WSDM)
ACM Special Interest Group on Information Retrieval (SIG-IR)
・理論・技術寄り
IEEE International Conference on Data Mining (ICDM)
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (ACM KDD)
オフィスアワー
場所: 工1-705
オフィスアワー: 毎週木曜日の3時限目を予定。
メールアドレス
この項目は教務情報システムにログイン後、表示されます。
URL
http://ie.u-ryukyu.ac.jp/~tnal/2017/dm-theory/
ページの先頭へ