タイトル

科目番号 教室 登録人数 履修登録方法 対面/遠隔
ESCI12040   [水1]地創棟508       抽選対象   対面授業  
開講年度 期間 曜日時限 開講学部等
2022 後学期 水1 理工学研究科工学専攻  
講義コード 科目名[英文名] 単位数
R10106002 データマイニング特論   2  
担当教員[ローマ字表記]
當間 愛晃  
授業の形態
講義
 
アクティブラーニング
学生が議論する、学生が自身の考えを発表する、学生が文献や資料を調べる
 
授業内容と方法
*旧カリキュラム「データマイニング論」、特別プログラム「Data Mining Theory」、
 新カリキュラム「データマイニング特論」、特別プログラム「Advanced Data Mining」の4科目同時開講です。
*留学生受講時には英語になります。
*原則としてオンライン実施を予定しています。1週目のZoom URLはWebclassにて告知します。

データから再利用可能な知識を掘り起こす一連のプロセスをデータマイニングと呼ぶ。
本授業は以下2つのパートに分けて実施する予定である。
[Part 1] では、データマイニング・プロセスおよびプロセスの一手段である機械学習について輪読する。
[Part 2] では、各自研究についての討論を行う。

毎回2グループを発表担当者に割り当て、担当する文献について解説発表を行う。
 
URGCC学習教育目標
自律性、地域・国際性、コミュニケーション・スキル、問題解決力、専門性
 
達成目標
・データマイニングの代表的なプロセス、もしくは機械学習のモデルについて説明することができる。[Part 1](専門性)3. 応用科目
・最新事例を読み、各プロセスを説明することができる。[Part 2](専門性)3. 応用科目
・各モデルや事例について関心を持ち、主体的に考え、公平な視点から気になる事柄を指摘し論じることができる。[Part 1, 2](専門性、創造性、倫理性)5. 関連科目

なお各項目後尾の丸カッコ内は、URGCC-advanced(http://www.ged.skr.u-ryukyu.ac.jp/divisions/division-2/kaihatusitu)との対応関係を示している。
また数字はカリキュラム・ポリシー(https://www.u-ryukyu.ac.jp/admissions/3policy/gra_curriculumpolicy/#cat13)との対応関係を示している。
 
評価基準と評価方法
文献により割り当てられたトピックについて発表を行い議論する。発表は英語を標準とする。
発表(60%)、質疑応答(20%)、最終レポート(20%)。

発表は受講人数により調整するが、おおよそPart 1では2〜4回程度で割り当てる。Part 2 は1回のみである。
発表と発表資料で満点を取れたとしても80%にしかならない点に注意すること。毎週確保する質疑応答時における討論への自主的な参加が求められる。
 
履修条件
線形代数学、統計学、プログラミング経験を有すること。
 
授業計画
第1回: ガイダンス、書籍輪読調整

======================================
[Part 1] データマイニング・プロセスおよび機械学習モデルの基礎学習
第2回
 ・Chap. 1, What's it all about?
 ・Chap. 2, Input: concepts, instances, attributes
第3回
 ・Chap. 3, Output: knowledge representation
 ・Chap. 4, Algorithms: the basic methods, sec. 4.1 to 4.5
第4回
 ・cont., Chap. 4, Algorithms, section 4.6 to remains
 ・Chap. 5, Credibility: evaluating what's been learned
第5回
 ・Chap. 6, Trees and rules
 ・Chap. 7, Extending instance-based and linear models
第6回
 ・Chap. 8, Data transformations, section 8.1 to 8.3
 ・Cont., section 8.4 to remains
第7回
 ・Chap. 9, Probabilistic methods, section 9.1 to 9.5
 ・Cont., section 9.5 to remains
第8回
 ・Chap .10, Deep learning, section 10.1 to 10.3
 ・Cont., section 10.4 to remains
第9回
 ・Chap. 11, Beyond supervised and unsupervised learning
 ・Chap. 12, Ensemble learning
第10回
 ・Chap. 13, Moving on: applications and beyond

======================================
[Part 2] 応用事例(受講生本人の研究)に関する討論
第11回〜第15回
 ・毎週数人程度を想定。
 ・時間に余裕があるなら国際会議の論文輪読も実施。
 
事前学習
参考書および関連事例に目を通すこと。
 
事後学習
参考書および関連事例に目を通すこと。
 
教科書にかかわる情報
教科書 書名 ISBN
978-0128042915
備考
Part 1にて輪読。
著者名
Ian H. Witten ... [et al.]
出版社
Morgan Kaufmann
出版年
2017
NCID
 
教科書全体備考
教科書指定なし。
 
参考書にかかわる情報
参考書 書名 ISBN
9781787125933
備考
著者名
Sebastian Raschka, Vahid Mirjalili
出版社
Packt Pub.
出版年
2017
NCID
 
参考書全体備考
 
 
使用言語
日本語
 
メッセージ
Part 2 で時間が余るようなら、下記学会における最近のベストペーパー輪読を想定している。ただしデータマイニングは幅広いテーマであることから、これ以外の学術論文であっても解説紹介をしても構わない。希望のある学生は事前に相談すること。

・アプリケーション寄り
IEEE/WIC/ACM International Conference on Web Intelligence (IEEE/WIC/ACM WI)
ACM International Conference on Web Search and Data Mining (ACM WSDM)
ACM Special Interest Group on Information Retrieval (SIG-IR)

・理論・技術寄り
IEEE International Conference on Data Mining (ICDM)
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (ACM KDD)
 
オフィスアワー
場所: 工1-705
オフィスアワー: 毎週金曜日の3時限目を予定。
 
メールアドレス
この項目は教務情報システムにログイン後、表示されます。
 
URL
http://ie.u-ryukyu.ac.jp/~tnal/2022/adm/
 

ページの先頭へ