MIT 6.S191 (2023): The Modern Era of Statistics
페이지 정보

본문
[일시] 2025.10,27
[세미나 주제] The Moder Era of Statistics
[발표자] 박소영
[요약]
본 리뷰는 The Moder Era of Statstics에 대한 설명이다. 강의는 거대 모델과 대규모 데이터로 성능을 끌어올리는 scale의 시대를 전제로 단순 정확도보다 신뢰 가능한 일반화가 핵심 과제임을 강조한다. 구체적으로 모델이 학습 분포 안에서는 잘 맞추지만 분포가 달라지면 성능이 흔들릴 수 있음을 지적하고 이를 다루기 위해 불확실성 추정, robustness, 설명가능성 등에 대해 설게해야 한다고 말한다. 또한 대규모 모델이 지식을 기억하고 문맥에 따라 추론을 하는 능력을 구조적으로 지원하는 아키텍처의 중요성을 짚으며 예시로 연속시간 동역학을 활용한 설계방향인 Liquid Neural Networks(LNN)을 소개한다. 정리하면 scale은 필요조건이지만 충분조건은 아니며 실제 환경에서는 OOD 상황에서도 믿을 수 있는 예측을 목표로 평가 지표와 모델 구조를 재설계해야 한다.
[녹화 영상 링크]
https://us06web.zoom.us/rec/share/_MnSeM_it8vHRnXNEYF8XlqXcwIakY0OIuqeM4FRoGidzw9pJ3mZIqcYFX640cxl.ndVjBwDcNH_n-Zbf
[세미나 주제] The Moder Era of Statistics
[발표자] 박소영
[요약]
본 리뷰는 The Moder Era of Statstics에 대한 설명이다. 강의는 거대 모델과 대규모 데이터로 성능을 끌어올리는 scale의 시대를 전제로 단순 정확도보다 신뢰 가능한 일반화가 핵심 과제임을 강조한다. 구체적으로 모델이 학습 분포 안에서는 잘 맞추지만 분포가 달라지면 성능이 흔들릴 수 있음을 지적하고 이를 다루기 위해 불확실성 추정, robustness, 설명가능성 등에 대해 설게해야 한다고 말한다. 또한 대규모 모델이 지식을 기억하고 문맥에 따라 추론을 하는 능력을 구조적으로 지원하는 아키텍처의 중요성을 짚으며 예시로 연속시간 동역학을 활용한 설계방향인 Liquid Neural Networks(LNN)을 소개한다. 정리하면 scale은 필요조건이지만 충분조건은 아니며 실제 환경에서는 OOD 상황에서도 믿을 수 있는 예측을 목표로 평가 지표와 모델 구조를 재설계해야 한다.
[녹화 영상 링크]
https://us06web.zoom.us/rec/share/_MnSeM_it8vHRnXNEYF8XlqXcwIakY0OIuqeM4FRoGidzw9pJ3mZIqcYFX640cxl.ndVjBwDcNH_n-Zbf
첨부파일
-
6S191_MIT_DeepLearning_L9.pdf (13.8M)
DATE : 2025-10-29 12:24:15
- 이전글MIT 6.S191 (2022): Uncertainty in Deep Learning 25.11.02
댓글목록
등록된 댓글이 없습니다.