주제1
[심전도를 이용한 파형 분석]
Artifact가 포함된 12 리드 심전도 신호 분류
[ 2024년 08월 28일 수요일 ~ 2024년 10월 14일 월요일 ]
연구주제 제안 배경
심전도(ECG)의 artifact는 심전도 측정 도중 심장의 전기 활동과 관련이 없이 발생한 신호를 의미하며 병원과 외래 환경 모두에서 심전도 인공 신호는
매우 흔하게 발생함. 대부분의 artifact는 인체 내부(생리학적) 및 외부(비생리학적) 원인에서 비롯되며,일부는 심전도 기기 자체에서 발생함.
심전도 신호 내에 존재하는 artifact는 심전도 신호와 유사한 형태를 띄고 있거나 심전도가 내포하는 정보를 손상시켜,이를 탐지 및 인식하지 못하면
해석 오류, 불필요한 치료 및 기타 의학적 오류로 이어질 수 있음. ECG 신호를 기반으로 artifact를 식별하는 인공지능 모델을 개발하면 심전도 신호의 질을
향상시키고 심장 질환의 진단에 도움이 될 것임.
연구주제 정의
Artifact가 포함된 심전도(ECG) 신호 분류를 위한 인공지능 모델 개발
연구 설명
-
1. 연구 데이터
고려대학교 안암병원에서 수집된 데이터를 기반으로 합성된 12-lead 심전도 신호가 학습 및 테스트 입력 데이터로 제공 (DOI: 10.1007/s13755-023-00241-y)
(1) Data Set: 3,000건의 합성 12-lead 심전도 신호 (Training set 2,400건, Public test set 300건, Private test set 300건)
데이터 세트별 라벨 건수 |
정상 심전도 |
Artifact가 포함된 심전도 |
Training set |
1,799 |
601 |
Public test set |
225 |
75 |
Private test set |
225 |
75 |
(2) Label: 12-lead 심전도에서 artifact의 발생 여부. 학습 데이터에서만 공개되며 정상 심전도 신호는 0, artifact가 포함된 심전도 신호는 1로 표기.
12개의 lead 중 하나의 lead에서라도 artifact가 발생하면 1로 표기
-
2. 데이터 프로토콜
Marquette Universal System for Electrocardiography (MUSE; GE)에서 500 Hz로 10초 동안 수집한 12-lead ECG 데이터를 기반으로 합성된 데이터. 각 환자의 데이터에는 다음과 같은 12-lead ECG가 포함됨: Lead 1, Lead 2, Lead 3, aVR, aVL, aVF, V1, V2, V3, V4, V5, V6.
-
3. 데이터 포맷
12-lead ECG 신호 데이터는 각 환자별로 [5000,12] 형태의 Dataframe을 포함한 pickle 형식(.pkl)으로 제공됨. 레이블 데이터는 각 환자 인덱스 및 라벨에 대한 하나의 Dataframe을 포함한 pickle 형식(.pkl)으로 제공됨.
(1) Signal_Train.pkl & Target_Train.pkl
(2) Signal_Test_Public.pkl
-
4. 샘플 데이터
정상 심전도
Artifact가 포함된 심전도
* 데이터는 signal 형태로 제공되나 편의를 위해 시각화하여 예시를 제시함.
** Training set에서 잘못된 라벨링이라고 생각된 경우 일부 수정해서 학습해도 무방함(보고서 내 수정 사항 표기).
Public/Private test set 에 대한 평가는 주최 측에서 확정한 라벨링을 기반으로 성능 검증
평가기준
- Test set은 public 및 private set으로 구성되어 있으며, 참가자들은 Public test set으로 모델 성능 중간 평가 후 모델 고도화 진행
- 대회 종료 후, Private test set 예측 확률 및 보고서 심사를 통해 최종 score 공개
1. 제출된 private test set 예측 확률에 대한 F1 Score, AUROC 및 MCC 기반 CPI
(Composite performance index) 산출(80점)
* CPI = 0.25*F1 Score + 0.25*AUROC + 0.5*MCC
** MCC : Matthew’s Correlation Coefficient
2. 보고서 심사(20점)
3. 상기 두 가지 기준으로 합산하여 최종 score 기준으로 최상위 선정
결과물 제출
- 2024년 09월 27일 (금; 31일차) 11시까지: 중간 결과물 제출(폴더명: Public_result)
1) Public test set 대상 예측 확률
* 중간 결과물은 “팀명_날짜_Public_Possibility.xlsx” 형식으로 제출 예) A팀_240927_Public_Possibility.xlsx
- 2024년 10월 14일 (월; 48일차) 16시까지: 최종 결과물 제출(폴더명: Final_result)
1) Private test set 대상 예측 확률 예) A팀_241014_Private_Possibility.xlsx
2) 최종모델 예) A팀_241014_Model.zip
3) 코드(검증용) 예) A팀_241014_Code.zip
4) 보고서(3페이지 이내; 결과 도출 과정, 코드설명 및 모식도 포함) 예) A팀_241014_최종보고서.doc
진행일정
-
2024년 08월 28일(수: 1일차) 11시 > Training set 공개
2024년 08월 28일(수: 1일차) ~ 2024년 09월 24일 (화: 28일차) > Training set 대상 모델학습
-
2024년 09월 25일(수; 29일차) 11시 > Public test set 공개
-
2024년 09월 27일(금; 31일차) 11시까지 > Public test set 모델 예측 확률 제출(폴더명: Public_result)
2024년 09월 27일(금; 31일차) 16시 > Public test set 기준 CPI 및 순위 홈페이지 내 공개
-
2024년 09월 27일(금; 31일차) ~ 2024년 10월 09일(수; 43일차) > Public test set 대상 모델 고도화
-
2024년 10월 10일(목; 44일차) 11시 > Private test set 공개
2024년 10월 14일(월; 48일차) 16시까지 > 최종 모델 예측 확률 및 보고서 제출 (폴더명: Final_result)
-
2024년 10월 15일(화; 49일차) > 심사위원 평가
Public test set 대상 Leaderboard 운영안내
-
2024년 09월 27일(금; 31일차) 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: Public_result)
2024년 09월 27일(금; 31일차) 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
-
2024년 10월 01일(화; 35일차): 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: pu_241001)
2024년 10월 01일(화; 35일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
-
2024년 10월 04일(금; 38일차): 11시까지 Public test set 대상 모델 예측 확률 제출(폴더명: pu_241004)
2024년 10월 04일(금; 38일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
-
2024년 10월 08일(화; 42일차): 11시까지 Public test set 대상 모델 예측 확률 제출 (폴더명: pu_241008)
2024년 10월 08일(화; 42일차): 16시 Public test set 기준 CPI 및 순위 홈페이지 내 공개
* 중간 및 Leaderboard용 결과물 제출은 “팀명_날짜_Public_Possibility.xlsx” 형식으로 제출 예) A팀_240927_Public_Possibility.xlsx
** 제출기간 내 제출을 하지않으면, Leaderboard에 표시되지 않거나 랭크를 확인할 수 없음