2025 하계 데이터마이닝학회(KDMS2025) - 고예진

페이지 정보

profile_image
작성자 고예진
댓글 0건 조회 2회 작성일 25-09-01 11:55

본문

<발표 후기>
8월 28일 (목)
세션: 포스터 세션 #1 (P1-24)
제목: Improving Lip Synchronization in Talking Head Generation via Bayesian Optimization of Initialization
본 연구는 Talking Head Generation에서 립싱크 품질을 향상시키기 위해, 입력 이미지의 입 모양을 자동으로 최적화하는 기법을 제안한다. 기존 립싱크 모델은 초기 이미지의 입 모양에 따라 성능이 저하되는 문제가 있으며, 이를 해결하기 위해 StyleGAN 기반 latent inversion, PTI(Pivotal Tuning Inversion), InterFaceGAN 방향 조정 등의 과정을 포함한 프레임워크를 설계한다.
제안하는 프레임워크의 핵심은 Bayesian Optimization을 활용하여 InterFaceGAN의 입 모양 조절 강도 값을 최적화하는 데 있다. 립싱크 신뢰도, 정체성 유지, 자연스러움 지표를 조합한 목적 함수를 정의하고, 이를 기반으로 최적의 초기 이미지를 탐색한다. 실험은 CelebA 데이터셋을 활용하였으며, Wav2Lip, DreamTalk 등 다양한 립싱크 모델에서 제안 기법의 성능을 검증하였다.
다만, 본 기법은 latent space에서의 속성 조작이 가능한 이미지를 전제로 하므로, 표현력이 제한된 입력 이미지에는 효과가 감소할 수 있다. 또한 계산 효율성 측면에서도 추가적인 개선이 필요할 것으로 생각된다.

<청취 후기>
8월 28일(목)
세션: 구두 발표 세션 #2
제목: 도구 증강 에이전트 연구 동향
이번 세션에서 서울대학교 데이터사이언스대학원 조요한 교수님께서 Tool Agents를 주제로 강연을 진행해주셨다. 이번 학회의 전반적인 화두가 LLM이었는데, 나는 아직 LLM을 깊이 다뤄본 경험이 많지 않은 입장에서 이번 강연이 도움이 되었다. 교수님께서는 LLM의 기본 개념과 함께 현재 직면한 여러 문제점들을 설명해주셨고, 그에 대한 해결 방향을 구체적으로 제시해주셔서 이해가 훨씬 잘 되었다.
예를 들어, 첫 번째 문제 상황인 Compositional API Calls에서는 여러 API를 조합해서 호출할 때 생기는 복잡함을 다루는 방법을 소개해주셨다. 단순히 data-driven 방식으로 학습시키는 것이 아니라, API 문서를 그래프 형태로 구조화해서 API들 간의 관계를 이해하도록 만드는 접근이었는데, 단순히 데이터를 다루는 것이 아니라 관계를 바라본다는 점이 흥미로웠다.

<학회 후기>
2025년 8월 28일부터 29일까지 평창 알펜시아 컨벤션 센터에서 열린 한국데이터마이닝학회 하계 학술대회에 참석하였다. 개인적으로 이번 학회는 발표자로서도, 청자로서도 여러 가지를 배우고 느낄 수 있었던 시간이었다. 포스터 세션을 통해 내 연구에 대해 다양한 분들로부터 피드백을 받을 수 있었고, 그 과정에서 스스로도 미처 인지하지 못했던 부분들을 발견할 수 있었다. 특히, 생각지 못했던 방향에서 질문을 받을 때마다 내 연구를 다시 설명해보고, 그 맥락을 정리해보는 과정 자체가 큰 도움이 되었다. 또 다른 연구실들이 어떤 주제와 방향성으로 연구를 진행하고 있는지도 자연스럽게 접할 수 있었고, 몇몇은 내 연구와 연결될 수 있는 부분이 보이기도 해 흥미로웠다. 구두 발표 세션에서는 여러 교수님들이 강연을 해주셨는데, 주제나 기술적인 내용뿐 아니라 연구를 대하는 태도에 대한 이야기들이 많아서 오히려 더 깊게 와닿았다. 이러한 기회를 만들어주신 교수님과 함께한 연구원들에게 감사드린다.

첨부파일

댓글목록

등록된 댓글이 없습니다.