MEDICAL CONTEST

주제1

[심전도를 이용한 파형 분석] Artifact가 포함된 12 리드 심전도 신호 분류

[ 2024년 08월 28일 수요일 ~ 2024년 10월 14일 월요일 ]

연구주제 제안 배경

심전도(ECG)의 artifact는 심전도 측정 도중 심장의 전기 활동과 관련이 없이 발생한 신호를 의미하며 병원과 외래 환경 모두에서 심전도 인공 신호는 매우 흔하게 발생함. 대부분의 artifact는 인체 내부(생리학적) 및 외부(비생리학적) 원인에서 비롯되며,일부는 심전도 기기 자체에서 발생함. 심전도 신호 내에 존재하는 artifact는 심전도 신호와 유사한 형태를 띄고 있거나 심전도가 내포하는 정보를 손상시켜,이를 탐지 및 인식하지 못하면 해석 오류, 불필요한 치료 및 기타 의학적 오류로 이어질 수 있음. ECG 신호를 기반으로 artifact를 식별하는 인공지능 모델을 개발하면 심전도 신호의 질을 향상시키고 심장 질환의 진단에 도움이 될 것임.

연구주제 정의

Artifact가 포함된 심전도(ECG) 신호 분류를 위한 인공지능 모델 개발

연구 설명

1. 연구 데이터 고려대학교 안암병원에서 수집된 데이터를 기반으로 합성된 12-lead 심전도 신호가 학습 및 테스트 입력 데이터로 제공 (DOI: 10.1007/s13755-023-00241-y) (1) Data Set: 3,000건의 합성 12-lead 심전도 신호 (Training set 2,400건, Public test set 300건, Private test set 300건)


데이터 세트별 라벨 건수	정상 심전도	Artifact가 포함된 심전도
Training set	1,799	601
Public test set	225	75
Private test set	225	75

(2) Label: 12-lead 심전도에서 artifact의 발생 여부. 학습 데이터에서만 공개되며 정상 심전도 신호는 0, artifact가 포함된 심전도 신호는 1로 표기.
12개의 lead 중 하나의 lead에서라도 artifact가 발생하면 1로 표기

2. 데이터 프로토콜 Marquette Universal System for Electrocardiography (MUSE; GE)에서 500 Hz로 10초 동안 수집한 12-lead ECG 데이터를 기반으로 합성된 데이터. 각 환자의 데이터에는 다음과 같은 12-lead ECG가 포함됨: Lead 1, Lead 2, Lead 3, aVR, aVL, aVF, V1, V2, V3, V4, V5, V6.
3. 데이터 포맷 12-lead ECG 신호 데이터는 각 환자별로 [5000,12] 형태의 Dataframe을 포함한 pickle 형식(.pkl)으로 제공됨. 레이블 데이터는 각 환자 인덱스 및 라벨에 대한 하나의 Dataframe을 포함한 pickle 형식(.pkl)으로 제공됨. (1) Signal_Train.pkl & Target_Train.pkl
(2) Signal_Test_Public.pkl
4. 샘플 데이터

정상 심전도

Artifact가 포함된 심전도

* 데이터는 signal 형태로 제공되나 편의를 위해 시각화하여 예시를 제시함.
** Training set에서 잘못된 라벨링이라고 생각된 경우 일부 수정해서 학습해도 무방함(보고서 내 수정 사항 표기).
Public/Private test set 에 대한 평가는 주최 측에서 확정한 라벨링을 기반으로 성능 검증

평가기준

- Test set은 public 및 private set으로 구성되어 있으며, 참가자들은 Public test set으로 모델 성능 중간 평가 후 모델 고도화 진행
- 대회 종료 후, Private test set 예측 확률 및 보고서 심사를 통해 최종 score 공개

1. 제출된 private test set 예측 확률에 대한 F1 Score, AUROC 및 MCC 기반 CPI
(Composite performance index) 산출(80점) * CPI = 0.25*F1 Score + 0.25*AUROC + 0.5*MCC
** MCC : Matthew’s Correlation Coefficient
2. 보고서 심사(20점)
3. 상기 두 가지 기준으로 합산하여 최종 score 기준으로 최상위 선정

결과물 제출

- 2024년 09월 27일 (금; 31일차) 11시까지: 중간 결과물 제출(폴더명: Public_result)

1) Public test set 대상 예측 확률
* 중간 결과물은 “팀명_날짜_Public_Possibility.xlsx” 형식으로 제출 예) A팀_240927_Public_Possibility.xlsx

- 2024년 10월 14일 (월; 48일차) 16시까지: 최종 결과물 제출(폴더명: Final_result)

1) Private test set 대상 예측 확률 예) A팀_241014_Private_Possibility.xlsx
2) 최종모델 예) A팀_241014_Model.zip
3) 코드(검증용) 예) A팀_241014_Code.zip
4) 보고서(3페이지 이내; 결과 도출 과정, 코드설명 및 모식도 포함) 예) A팀_241014_최종보고서.doc

진행일정

2024년 08월 28일(수: 1일차) 11시 > Training set 공개

2024년 08월 28일(수: 1일차) ~ 2024년 09월 24일 (화: 28일차) > Training set 대상 모델학습
2024년 09월 25일(수; 29일차) 11시 > Public test set 공개
2024년 09월 27일(금; 31일차) 11시까지 > Public test set 모델 예측 확률 제출(폴더명: Public_result)

2024년 09월 27일(금; 31일차) 16시 > Public test set 기준 CPI 및 순위 홈페이지 내 공개
2024년 09월 27일(금; 31일차) ~ 2024년 10월 09일(수; 43일차) > Public test set 대상 모델 고도화
2024년 10월 10일(목; 44일차) 11시 > Private test set 공개

2024년 10월 14일(월; 48일차) 16시까지 > 최종 모델 예측 확률 및 보고서 제출 (폴더명: Final_result)
2024년 10월 15일(화; 49일차) > 심사위원 평가

Public test set 대상 Leaderboard 운영안내

2024년 09월 27일(금; 31일차) 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: Public_result)

2024년 09월 27일(금; 31일차) 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
2024년 10월 01일(화; 35일차): 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: pu_241001)

2024년 10월 01일(화; 35일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
2024년 10월 04일(금; 38일차): 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: pu_241004)

2024년 10월 04일(금; 38일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
2024년 10월 08일(화; 42일차): 11시까지 Public test set 대상 모델 예측 확률 제출 (폴더명: pu_241008)

2024년 10월 08일(화; 42일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개

* 중간 및 Leaderboard용 결과물 제출은 “팀명_날짜_Public_Possibility.xlsx” 형식으로 제출 예) A팀_240927_Public_Possibility.xlsx
** 제출기간 내 제출을 하지않으면, Leaderboard에 표시되지 않거나 랭크를 확인할 수 없음