Development of a Framework for Analyzing Lesion Classification Models Using Real and Generated Fundus Images

의료 영상 분석 분야에서 딥러닝 모델은 높은 성능을 보이지만, 개인정보 보호와 데이터 불균형 문제로 학습데이터 확보에 한계가 있다. 본 연구에서는 실제 및 생성 안저 이미지를 다양한 비율로 혼합한 데이터셋을 기반으로, 6가지 병변 분류 모델의 성능과 안정성을 평가하기 위한 분석 프레임워크를 제안한다. 제안된 프레임워크는 혼동 행렬 기반 지표와 회귀 및 통계 분석 지표를 산출하고, 이를 통합하여 모델별 안정성 지수를 계산한다. 분석결과, DenseNet121, InceptionV3 등의 모델은 생성 데이터 비율이 높아져도 안정적인 성능을 유지하였으며, 일부 구간에서는 실제 데이터만 사용한 경우보다 더 높은 성능을 보였다. 반면, MobileNetV2와 NASNetMobile은 생성 데이터가 증가함에 따라 급격한 성능 저하와 낮은 안정성 지수를 보였다. 본 연구는 의료 영상 인공지능 분야에서 생성 데이터를 활용할 때 모델 구조와 데이터 비율의 영향을 체계적으로 평가 및 비교할 수 있는