タイトル

科目番号
  
開講年度 期間 曜日時限 開講学部等
2020 前学期 火4 理工学研究科情報工学専攻  
講義コード 科目名[英文名] 単位数
R01672001 データマイニング論   2 
担当教員[ローマ字表記]
當間 愛晃 
授業の形態
 
 
アクティブラーニング
学生が議論する、学生が自身の考えを発表する、学生が文献や資料を調べる
 
授業内容と方法
*特別プログラム(留学生向けプログラム)と同時開講のため、留学生受講時には英語になります。

データから再利用可能な知識を掘り起こす一連のプロセスをデータマイニングと呼ぶ。
本授業は以下2,3のパートに分けて実施する予定である。
[Part 1] では、データマイニング・プロセスもしくはプロセスの一手段である機械学習について輪読する。
[Part 2] では、最新の研究論文輪読を通して応用例について議論する。
また、調整により、最後の数週間を「Part 3 各自研究への応用検討」に変更する可能性がある。

毎回2グループを発表担当者に割り当て、担当する文献について解説発表を行う。
 
URGCC学習教育目標
自律性、地域・国際性、コミュニケーション・スキル、問題解決力、専門性
 
達成目標
・データマイニングの代表的なプロセス、もしくは機械学習のモデルについて説明することができる。[Part 1](専門性)3. 応用科目
・最新事例を読み、各プロセスを説明することができる。[Part 2](専門性)3. 応用科目
・各モデルや事例について関心を持ち、主体的に考え、公平な視点から気になる事柄を指摘し論じることができる。[Part 1, 2](専門性、創造性、倫理性)5. 関連科目

応用検討(Part 3)を実施する際には、下記目標を追加する。
・1つ以上のプロセスを、自身の身近な例に適用を試みる(設計する)ことができる。(専門性)
・生データや結果観察を通し、プロセスを評価・考察することができる。(専門性)

なお各項目後尾の丸カッコ内は、URGCC-advanced(http://www.ged.skr.u-ryukyu.ac.jp/divisions/division-2/kaihatusitu)との対応関係を示している。
また数字はカリキュラム・ポリシー(https://www.u-ryukyu.ac.jp/admissions/3policy/gra_curriculumpolicy/#cat13)との対応関係を示している。
 
評価基準と評価方法
文献により割り当てられたトピックについて発表を行い議論する。発表は英語を標準とする。
発表(50%)、発表資料(20%)、質疑応答(30%)。

発表は受講人数により調整するが、おおよそ各パートにおいて1〜2回程度で割り当てる。
発表と発表資料で満点を取れたとしても70%にしかならない点に注意すること。毎週確保する質疑応答時における討論への自主的な参加が求められる。
 
履修条件
線形代数学、統計学、プログラミング経験を有すること。
 
授業計画
第1回: ガイダンス、書籍輪読調整

======================================
[Part 1] データマイニング・プロセス、もしくは機械学習モデルの基礎学習
<データマイニング・プロセス編>
第2回: データマイニングとは?(定義や例題から考えてみよう)
第3回: 機械学習と統計処理、個人情報等の観点
第4回: 入力(インスタンスと属性)と出力(知識表現)
第5回: 基本的な考え方・アルゴリズム1
第6回: 基本的な考え方・アルゴリズム2
第7回: 信頼性のある実験・評価方法

<機械学習編>
第2回:機械学習概観
第3回:パーセプトロンによる分類学習
第4回:Scikit-learnが有する分類器概観
第5回:学習用データの構築・前処理
第6回:次元削減によるデータ圧縮
第7回:モデル評価とハイパーパラメータ調整

第8回:予備日(パート2調整)

======================================
[Part 2] 応用事例に関する輪読&討論
第9回:事例読解1
第10回:事例読解2
第11回:事例読解3
第12回:事例読解4
第13回:事例読解5
第14回:事例読解6
第15回:事例読解7
 
事前学習
参考書および関連事例に目を通すこと。
 
事後学習
参考書および関連事例に目を通すこと。
 
教科書にかかわる情報
 
教科書全体備考
教科書指定なし。
 
参考書にかかわる情報
参考書 書名 ISBN
0123748569
備考
Part 1にて輪読予定。
著者名
Ian H. Witten, Eibe Frank, Mark A. Hall, Morgan Kaufmann
出版社
Morgan Kaufmann
出版年
2011
NCID
参考書 書名 ISBN
9781787125933
備考
Part 1にて輪読予定。
著者名
Sebastian Raschka, Vahid Mirjalili
出版社
Packt Pub.
出版年
2017
NCID
 
参考書全体備考
 
 
使用言語
日本語
 
メッセージ
*G-mailが必要です。
*特別プログラム(留学生向けプログラム)と同時開講のため、留学生受講時には英語になります。

Part 2では、下記学会における過去5年間におけるベストペーパーの輪読を想定している。ただしデータマイニングは幅広いテーマであることから、これ以外の学術論文であっても解説紹介をしても構わない。希望のある学生は事前に相談すること。

・アプリケーション寄り
IEEE/WIC/ACM International Conference on Web Intelligence (IEEE/WIC/ACM WI)
ACM International Conference on Web Search and Data Mining (ACM WSDM)
ACM Special Interest Group on Information Retrieval (SIG-IR)

・理論・技術寄り
IEEE International Conference on Data Mining (ICDM)
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (ACM KDD)


***重要***
・4/4(土), 追記。
https://translate.google.com/translate?hl=en&sl=auto&tl=en&u=https%3A%2F%2Fwww.tec.u-ryukyu.ac.jp%2Fblog%2F2020%2F04%2F03%2Fコロナウイルス感染症防止について%2F

For Coronavirus Infection Prevention, all classes with "face-to-face" under Faculty of Engineering will begin on April 23 (Thu). As an alternative, (1) please read a textbook from chapter 1 to chapter 2, and run examples on your PC. (2) If you have any questions, please contact me with email.

P.S.
For download the textbook, you should tell me G-mail address. After that, I will athorize you to access it.
 
オフィスアワー
場所: 工1-705
オフィスアワー: 毎週金曜日の3時限目を予定。
 
メールアドレス
tnal@ie.u-ryukyu.ac.jp
 
URL
http://ie.u-ryukyu.ac.jp/~tnal/2020/dm-theory/
 

ページの先頭へ