[20250825 특별 세미나] Deformable registration network based on multi-scale…

페이지 정보

profile_image
작성자 박소영
댓글 0건 조회 12회 작성일 25-08-26 16:09

본문

[일시] 2025.08.25

[리뷰 논문] Deformable registration network based on multi-scale features and cumulative optimization for medical image alignment

[요약]

기존 의료 영상 정합 방법들은 전통적 접근과 딥러닝 기반 접근 모두에서 한계가 있었다. 전통적 방법은 마커 삽입이나 픽셀 강도 직접 비교에 의존하여 침습적이고 속도가 느리며 범용성이 부족했고, 딥러닝 기반 방법 역시 Ground Truth 변형장 확보의 어려움, label 의존성, 그리고 large deformation 상황에서 정확도가 급락하거나 topology 깨짐 문제가 발생했다.
이러한 한계를 해결하기 위해 제안된 것이 Multi-Scale Feature Fusion Module과 Cumulative Optimization Module이다.
1. Multi-Scale Feature Fusion Modul : 서로 다른 크기의 3D 커널을 병렬 적용해 local과 global 특징을 동시에 추출하고 attention  메커니즘을 통해 중요한 스케일의 정보를 강조하여 세밀하고 안정적인 특징 표현을 학습한다.
2. Cumulative Optimization Module : 디코더 각 단계에서 변형장 후보를 예측하고 GRU-like 구조로 누적 최적화를 수행한다. 이를 통해 local + global 정보를 모두 반영하며 folding을 줄이고 large deformation 상황에서도 안정적이고 위상 보존적인 결과를 낼 수 있다.

실험은 Lung CT, Liver CT, Brain MRI데이터셋에서 진행되었다. 결과적으로 제안 방법은 기존 방법들보다 DSC 향상, ASD 감소, JD 개선을 모두 달성하였다.

결론적으로 이 연구는 Multi-Scale Feature Fusion Module과 Cumulative Optimization Module를 결합한 네트워크를 통해 의료 영상에서의 large deformation 문제를 효과적으로 해결하며 unsupervised 상황에서도 안정적이고 정확한 registration을 달성할 수 있음을 보여주었다.

[녹화 영상 링크]
https://us06web.zoom.us/rec/share/Li9GqnAjE0iTnD0b_eRwXbH4x2J-k5lVGBNVIRjVei_8ZujIMjpWhCkiCtGzxDpW.XhIOyxJYg1lWKJAO

[Q&A]
Q : COM에서 GRU-like 구조를 써서 변형장을 예측했다고 했는데 이 과정이 왜 필요한지에 대해 설명해주실 수 있을까요?
A : 기존 U-Net decoder는 마지막 단계에서 한번에 최종 변형장을 예측합니다. 이경우에는 local 정보에 과도하게 치중되어 large deformation 상황에서는 불안정해져 folding 현상이 발생합니다. 또한 large deformation은 한번의 에측으로 처리하기 어려워 각 단계에서 다른 스케일의 변형 정보를 조금씩 예측하고 이를 누적하여 최종 변형장을 완성하는 방식입니다. 이 과정에서 GRU-like 구조를 쓰면 이전 단계의 변형상태와 현재 후보를 게이트 단위로 통합할 수 있어 local과 gloable 정보를 균형있게 반영합니다.

Q :  Transformer 계열로 사용했을 때 성능이 더 좋게 나올 것 같은데 Backbone 모델을 U-Net 구조로 사용한 이유에 대해서는 나와있지 않나요?
A : 논문에서 해당 부분에 대한 구체적인 설명은 직접적으로 제시되지 않았습니다. 다만 제가 추측하기에는 Transformer는 전역 문맥 정보를 포착하는데 강점이 있으나 의료 데이터에서 연산량과 메모리 사용량이 과도하게 커지는 문제가 있으며 효율성과 안정성 측면에서 부담이 큽니다. 하지만 U-Net은 인코더-디코더 구조와 skip connection을 통해 비교적 적은 연산으로 global 구조와 local 세부 정보를 동시에 학습하기에 안정적으로 사용되는 구조여서 U-Net을 backbone으로 했다고 생각합니다.

첨부파일

댓글목록

등록된 댓글이 없습니다.