科目番号
教室
登録人数
履修登録方法
対面/遠隔
ESCI13020
[金2]工1-321 [金3]工1-321
抽選対象
対面授業
開講年度
期間
曜日時限
開講学部等
主要授業科目
2026
第2クォーター
金2〜3
理工学研究科工学専攻
講義コード
科目名[英文名]
単位数
R10095001
人工知能特論
2
担当教員[ローマ字表記]
遠藤 聡志
主授業科目は、令和7年度からの表示項目です。
授業の形態
講義
アクティブラーニング
学生が議論する、学生が自身の考えを発表する、学生が文献や資料を調べる
授業内容と方法
本講義では,大規模言語モデル(LLM)の研究利用をテーマとし,代表的論文の精読と批判的検討を通じて,AI技術を研究として扱う力の涵養を目的とする。具体的には,In-context learning,Chain-of-Thought推論,Retrieval-Augmented Generation,LLMによる評価手法(LLM-as-a-Judge)に関する主要論文を取り上げ,背景・手法・実験・評価の観点から分析する。授業は講義とディスカッションを組み合わせて進め,学生による要約・発表・批判的レビューを課す。さらに,LLMを用いた簡易実験を通じて評価手法の妥当性や限界を検証し,最終的に研究提案へと接続する。
URGCC学習教育目標
問題解決力、専門性
達成目標
本講義の到達目標は,
・第一に,大規模言語モデル(LLM)に関する代表的研究の背景・手法・評価を理解し,その意義と限界を説明できること
・第二に,論文の批判的読解を通じて,問題設定や評価手法の妥当性を検討する力を身につけること
・第三に,LLMを用いた応用や研究課題を自ら設計し,適切な評価方法を含めて提案できること
である。
評価基準と評価方法
講義内のプレゼン内容(50%)、レポート(50%)により評価を行う。
履修条件
知能情報プログラム向けの講義である。
授業計画
授業計画
第1週
・ガイダンス(講義の目的・評価方法・論文読解の方法)
・LLM研究の概観と論文の構造理解
第2週
・担当論文の精読とプレゼン準備
第3週
・GPT-3論文①(背景・問題設定・In-context learningの理解)
・GPT-3論文②(実験・評価・限界の検討)
第4週
・Chain-of-Thought論文①(推論能力とプロンプト設計)
・Chain-of-Thought論文②(性能評価・適用範囲・課題)
第5週
・RAG論文①(外部知識統合とモデル拡張)
・RAG論文②(システム設計・評価・応用可能性)
第6週
・LLM-as-a-Judge論文①(評価問題の背景と手法)
・LLM-as-a-Judge論文②(人間評価との比較・バイアス分析)
第7週
・自身の研究への応用設計を発表する
第8週
・最終レポート作成
事前学習
参考となる資料の調査、プレゼンテーションの事前準備等必要に応じて指示する。
事後学習
輪読後の復習と最終回に向けたショートプレゼンの準備を行なって下さい。
教科書にかかわる情報
教科書全体備考
教科書は指定しない。
以下のLLM関連論文を扱う予定(変更の可能性があります。)
Language Models are Few-Shot Learners
Brown, T. B. et al. (2020)
→ In-context learningの成立と大規模言語モデルの基礎
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
Wei, J. et al. (2022)
→ 推論能力の向上とプロンプト設計の重要性
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Lewis, P. et al. (2020)
→ 外部知識を統合した実用的生成モデル
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena
Zheng, L. et al. (2023)
→ LLMによる評価手法と人間評価との関係
参考書にかかわる情報
参考書全体備考
院生の研究活動を考慮しオンラインを基本とします。
使用言語
日本語
メッセージ
特別コースの学生と合同の際には英語による実施となります。
オフィスアワー
mon 10:20-11:50
wed 10:20- 11:50
その他、メールにて個別に調整する。
メールアドレス
この項目は教務情報システムにログイン後、表示されます。
URL
ページの先頭へ