2025 춘계 공동학술대회(KIIE2025) - 오수진

페이지 정보

profile_image
작성자 오수진
댓글 0건 조회 2회 작성일 25-06-26 13:22

본문

<발표 후기>
6월 19일 (목)
세션: 산업인공지능(13)
제목: 강화 학습 기반 GPU 스케줄링 프레임 워크
이번 발표에서는 PPO 기반 GPU 스케줄링 기법을 통해 LLM 추론 지연을 줄이고 자원 활용률을 높이는 방법을 소개했습니다. 실험에서는 Llama 3.1 8B 모델을 기반으로 한 시뮬레이션에서 기존 MuxServe나 BinPack 대비 우수한 성능을 보였다는 점이 인상 깊었습니다. 다만 발표를 준비하면서 Llama 3.1에만 지나치게 의존한 감이 있어, 다른 모델이나 환경에서도 성능이 재현되는지 확인이 필요하다는 아쉬움이 남았습니다. 실제 발표 이후에도 다양한 참석자분들로부터 “보다 범용적인 GPU 작업에도 적용할 수 있으면 좋겠다”는 피드백을 받았고, 저 역시 그 필요성에 공감했습니다.
그 외에도 학습 파라미터 자동 조정, 실서비스 벤치마크 등의 기술적인 요소에 대한 질문이 이어지며, 발표 내용이 실무와 연결될 수 있다는 점에서 긍정적인 반응을 확인할 수 있었습니다. 전반적으로는 제안한 방식이 GPU 스케줄링의 한계를 일정 부분 해소할 수 있다는 가능성을 전달할 수 있어 의미 있었던 자리였습니다. 다만 후속 실험에서 다른 크기의 모델, 다양한 워크로드를 반영한 테스트를 추가로 진행해야겠다는 과제를 다시금 느꼈습니다. 앞으로는 이러한 보완점을 반영해 보다 확장성 있는 스케줄링 프레임워크로 발전시켜 나가고자 합니다.


<청취 후기>
6월 18일 (수)
세션: 디지털트윈/시뮬레이션(1)
제목: 다중집객 사고 관리를 위한 DEVS 기반 시뮬레이션 모델 개발
이태원 10‧29 참사를 사례로 삼아 지하철 승‧하차 인원·생활인구·보행 네트워크 데이터를 한데 묶어 DEVS 기반 군중 시뮬레이션을 구축하는 과정인데 핵심인 Pedestrian / Walkway 원자 모델이 분 단위로 이동‧정체 상태를 추적하도록 설계돼 실제 현장 혼잡 변화를 세밀하게 따라가는 모습이 인상적이었다. 이때 서울열린데이터광장의 유동 인구, 네이버 지도에서 추출한 거리망, 그리고 직접 조사한 체류 시간·목적지 유형까지 파라미터에 녹여 현실감을 높였다고 한다. 더불어 전 세계 압사 사고 사례를 함께 제시해 시뮬레이션 결과와 실제 참사를 교차 검증함으로써 모델 신뢰도를 입증하려는 시도가 돋보였다. 본 모델은 이태원 참사 데이터를 기반으로 설계되어 있어, 다른 지역이나 상황에 바로 적용하기에는 범용성이 떨어진다는 한계가 남아 있다.

6월 19일 (목)
세션: 산업 인공지능(11)
제목 : 불균일한 환경에서의 연합 학습을 위한 상관관계 기반 어텐션 메커니즘
실제 현장에서는 각 단말기의 데이터 분포가 서로 달라서 (Non-IID) 모델이 잘 모이지 않는 다는 점에서 개인정보 보호, 통신 비용, 느린 수렴이 FL의 세가지 난제여서 연구를 진행하게 되었다고 한다. Correlation-aware Attention 을 적용해서 각 클라이언트가 입력-출력 상관계수를 계산해 중요한 특성에 높은 가중치를 주고, 이렇게 얻은 '가벼운'특징 맵을 다중 스트림 CNN으로 전송해 지식 전이를 촉진한다. 베터리 RUL(수명예측) 데이터를 세개 클라이언트로 나눠 Non-IID 상황을 만들고, 기존 FedAvg·Fed-RUL과 비교 했으며, 30라운드 만에 제안 모델이 모든 클라이언트에서 최고 정확도와 가장 빠른 수렴을 달성했다. 초기학습효율이 중요하다는걸 다시 확인 했고, 추가 실험으로 클라이언트 수 확대, 통시 지연까지 고려하겠다고 밝힌 점도 현실적인 다음 과제로 보였다.

첨부파일

댓글목록

등록된 댓글이 없습니다.