HEALTHCARE BIGDATA SHOWCASE
ANALYTICS
CHALLENGE
헬스케어 빅데이터 쇼케이스 분석 챌린지란?
질병관리청과 한국보건산업진흥원에서 제공한 헬스케어 빅데이터 쇼케이스 사업의
실제 데이터를 통해 분석 과제를 해결하는 헬스케어 빅데이터 활용 온라인 분석 챌린지입니다.
참가자는 헬빅쇼 홈페이지의 전처리 파이프라인(링크)과 사례발굴 주피터 노트북과 행렬데이터(링크)를 참고하여 다음 두 가지 작업을 수행해야 합니다.
하나헬빅쇼 멀티오믹스 데이터에서 의미 있는 가치를 발굴하기 위한 분석 아이디어 설명
둘위 아이디어를 실제 코드와 상세 문서로 설명한 주피터 노트북 (.ipynb 파일)
목표
멀티오믹스 등 헬스케어 빅데이터를 활용하여 건강을 위해 어떠한 가치와 의미를 찾을 수 있을지에 대한 다양한 아이디어를 수집하는 것에 첫 번째 목표가 있으며, 이를 위한 과정을 체계적으로 코드화하여 산업계에 공유하는 것에 두 번째 목표가 있습니다. 선정된 아이디어와 주피터 노트북은 전문가 평가와 피드백 반영을 거친 후, 포럼을 통해 공개될 예정입니다.
목표
Goal
멀티오믹스 등 헬스케어 빅데이터를 활용하여 건강을 위해 어떠한 가치와 의미를 찾을 수 있을지에 대한 다양한 아이디어를 수집하는 것에 첫 번째 목표가 있으며, 이를 위한 과정을 체계적으로 코드화하여 산업계에 공유하는 것에 두 번째 목표가 있습니다. 선정된 아이디어와 주피터 노트북은 전문가 평가와 피드백 반영을 거친 후, 포럼을 통해 공개될 예정입니다.
동기 부여
동일한 환자/샘플에 대해 서로 다른 오믹스 계층의 데이터가 이용할 수 있는 멀티오믹스 데이터는 질병 등 표현형에 대한 작용 기작을 정밀하게 확인할 수 있으며, 치료 표적이나 진단 마커를 발굴하는 데 유용합니다. 개별 오믹스 계층만 분석하는 것 보다 훨씬 정밀한 탐색이 가능합니다. 쉽게 수집하기 어려운 고가의 데이터이며, 이것의 분석 과정은 생명현상의 숨겨진 의미를 찾을 수 있는 도전적인 분야입니다.
동기 부여
Goal
동일한 환자/샘플에 대해 서로 다른 오믹스 계층의 데이터가 이용할 수 있는 멀티오믹스 데이터는 질병 등 표현형에 대한 작용 기작을 정밀하게 확인할 수 있으며, 치료 표적이나 진단 마커를 발굴하는 데 유용합니다. 개별 오믹스 계층만 분석하는 것 보다 훨씬 정밀한 탐색이 가능합니다. 쉽게 수집하기 어려운 고가의 데이터이며, 이것의 분석 과정은 생명현상의 숨겨진 의미를 찾을 수 있는 도전적인 분야입니다.
방법
아래 신청란에 참가신청서를 제출한 후, 챌린지 마감일 이전에 분석 아이디어와 주피터 노트북을 이메일로 제출합니다.
방법
Goal
아래 신청란에 참가신청서를 제출한 후, 챌린지 마감일 이전에 분석 아이디어와 주피터 노트북을 이메일로 제출합니다.
참조
- Akbar, Shazia, 외. “종양 부하 평가를 위한 디지털 슬라이드에서 종양 세포질의 자동 및 수동 정량화.” 과학 보고서 9.1 (2019): 1-9.
- Akbar, Shazia, 외. “resnet을 사용하여 디지털 슬라이드에서 종양 세포성을 결정합니다.” 의료 이미징 2018: 디지털 병리학. Vol. 10581. SPIE, 2018.
- 왕, 핀, 외. “유방암 조직병리학 이미지의 자동 세포 핵 세분화 및 분류.” 신호 처리 122(2016): 1-13.
- Pei, Ziang, 외. “전이 학습을 사용한 유방암 조직병리학 이미지에 대한 직접적인 세포성 추정.” 의학 2019 PAIP 2023의 전산 및 수학적 방법: 췌장암(감독 학습) 및 결장암(전이 학습) 4(2019)의 종양 세포성 예측.
- Heid, Irina, 외. “췌장암 ADC에서 종양 세포질의 공동 임상 평가는 췌장암에서 생존을 예측합니다.” 임상 암 연구 23.6 (2017): 1461-1470.
- Rakhlin, 알렉산더, 외. “심층 신경망을 이용한 유방 종양 세포성 평가.” IEEE/CVF 국제 컴퓨터 비전 워크숍 간행물. 2019.
참조
Goal
- Akbar, Shazia, 외. “종양 부하 평가를 위한 디지털 슬라이드에서 종양 세포질의 자동 및 수동 정량화.” 과학 보고서 9.1 (2019): 1-9.
- Akbar, Shazia, 외. “resnet을 사용하여 디지털 슬라이드에서 종양 세포성을 결정합니다.” 의료 이미징 2018: 디지털 병리학. Vol. 10581. SPIE, 2018.
- 왕, 핀, 외. “유방암 조직병리학 이미지의 자동 세포 핵 세분화 및 분류.” 신호 처리 122(2016): 1-13.
- Pei, Ziang, 외. “전이 학습을 사용한 유방암 조직병리학 이미지에 대한 직접적인 세포성 추정.” 의학 2019 PAIP 2023의 전산 및 수학적 방법: 췌장암(감독 학습) 및 결장암(전이 학습) 4(2019)의 종양 세포성 예측.
- Heid, Irina, 외. “췌장암 ADC에서 종양 세포질의 공동 임상 평가는 췌장암에서 생존을 예측합니다.” 임상 암 연구 23.6 (2017): 1461-1470.
- Rakhlin, 알렉산더, 외. “심층 신경망을 이용한 유방 종양 세포성 평가.” IEEE/CVF 국제 컴퓨터 비전 워크숍 간행물. 2019.
상세일정 안내
-
2023. 05. 10(수) ~ 2023. 05. 30(화)
참가 신청
-
2023. 05. 25(목) ~ 2023. 06. 07(수)
분석 진행 및 결과 제출
-
2023. 06. 08(목) ~ 2023. 06. 09(금)
수상 후보자 선발
2023. 06. 12(월) ~ 2023. 06. 20(화)최종 수상자 선발
-
2023. 06. 21(수)
시상 및 발표
* 오송 한국보건산업진흥원
참가신청
분석 챌린지 진행 기간에 참여가 가능하신 분이라면 누구나 참가 자격이 주어집니다.
늦지 않게 참가 신청서를 다운받아 양식을 작성하시고, 참가 신청을 완료해주세요!
홍길동
인실리코젠 소속
2023 HBS ANALYSIS CHALLENGE
분석 데이터 제출하기
참가자 신청이 완료된 분만 분석 데이터 다운받기가 가능합니다. 이후 분석 기간 동안 분석한
데이터를 업로드해주세요. 업로드해주신 분석 데이터를 평가하여 최종 수상자에겐 메일로 개별 안내해 드립니다.
-
분석 데이터 다운받기 버튼을 클릭하여 Github에서
분석 데이터를 다운 받아주세요.분석 데이터 다운받기참가신청 완료된 분들에 한하여 Github 분석 데이터 다운로드가 가능한 권한을 부여해드립니다.
-
공개된 분석 데이터를 활용하여
분석을 진행한 결과 파일(.zip)을 업로드해주세요. -
분석 데이터가 정상적으로 제출되었는지,
제출 확인하기 버튼을 통해 확인할 수 있습니다.
ANALYTICS CHALLENGE에
이렇게 많은 관심을 주셨어요!
누적 접속수
4867 명
수상 기준
심사 후 상위 10명의 참가자에게 이메일로 통보되며, 최종 2팀에는 시상 일정과 함께 개별로 안내해 드립니다. HBS Analytics Challenge 주최자는 1위 상금 200만 원, 2위 우승자에게 상금 100만 원을 수여합니다.
(랭크당 한 팀). 상금은 계좌이체로 지급되며, 당첨자는 본인 명의의 계좌로만 송금이 가능합니다.
-
{ 1위 _ 아이디어+코드 우수 }
한국보건산업진흥원장상 (1팀)상금 200 만 원
-
{ 2위 _ 아이디어 우수 }
한국보건산업진흥원장상 (1팀)상금 100 만 원
참여 규칙 및 정책
- 모든 챌린지 참가자는 데이터 액세스를 위해 데이터 사용 및 기밀 유지 계약(DUA)의 범위 내에서만 제공된 데이터를 사용하는 데 동의해야 합니다.
- 모든 챌린지 참가자는 데이터 다운로드 및 결과 제출을 위해 하나 이상의 계정을 만들지 않는 데 동의해야 합니다.
- 모든 챌린지 참가자는 주최자의 결정이 챌린지와 관련된 모든 문제에 대해 최종 구속력이 있다는 데 동의해야 합니다. 예상치 못한 이벤트(부정행위, 바이러스, 버그, 데이터/챌린지 형식의 결함 등) 또는 제어(불가항력이라고도 함)가 이 챌린지의 공정성 및 무결성에 영향을 미치는 경우 주최자는 이 챌린지를 취소, 변경, 중단할 권리가 있습니다. 이는 이벤트가 인적, 기술적 오류로 인한 것인지와 관계없이 보유됩니다.
- 컴퓨터 “해킹”은 불법입니다. 어떤 참가자가 어떤 식으로든 해킹이나 속임수, 사기 행위를 통해 챌린지의 무결성 또는 적법한 운영을 손상시키려고 시도하는 경우 주최자는 법이 허용하는 최대 범위 내에서 손해 배상을 청구할 수 있습니다.
- 이 챌린지에 결과를 제출함으로써 참가자는 방법 비교를 위해 해당 결과를 포함하는 것을 이해하고 동의합니다. 이 비교는 챌린지 주최자가 작성 프로세스를 주도하는 공동 출판물을 준비하는 데 사용됩니다.
- 주최자의 연구 그룹 구성원은 챌린지에 참가할 수 있지만 수상 자격이 없으며 순위표에 나열되지 않습니다.
- 모든 챌린지 참가자는 챌린지 계정에 대한 ID 인증을 받아야 합니다. 확인되지 않은 사용자는 챌린지에 분석 아이디어 및 코드를 제출할 수 없습니다.
- 제출한 주피터 노트북을 실행하기 위한 추가 라이브러리나 프로그램이 필요할 경우, 상단에 프로그램과 버전을 명시합니다. 모든 주피터 노트북은 리눅스 운영체제(Ubuntu 18, CentOS 7 이상)와 파이썬 3.10 이상의 주피터 실행환경에서 오류 없이 정상 실행되어야 합니다.
라이선스 고지
다음 조건에 따라서 변경사항을 표시하여야 한다.
HBS Analytics Challenge에서 제공하는 공개데이터 활용 시 라이선스에 대한 링크를 제공하고 변경 사항이 있는지 표시해야 합니다.
HBS Analytics Challenge 데이터셋은 Creative Commons Attribution-NonCommercial 4.0 International License(CC BY-NC 4.0)에 따라 제공됩니다.
HBS Analytics Challenge에서 제공하는 데이터셋은 비상업적 사용을 원칙으로 하며, 상업적으로 사용할 경우 관련 법령에 따라 제재될 수 있음을 명시하는 바입니다.
FAQ
- 챌린지 데이터 세트는 어떻게 다운로드하나요?
-
헬빅쇼 홍보 홈페이지의 "사례 발굴"에 예시용 주피터 노트북과 함께, 분석용 데이터가 제공됩니다. 이 데이터는 헬빅쇼 전처리 및 정제 파이프라인을 통해 얻은 오믹스 별 행렬자료입니다.
- 이번 챌린지에 팀으로 참가할 수 있나요?
-
네. 팀으로 참가할 수 있습니다. 참가신청서의 팀원 작성 부분에 모든 팀원을 작성하십시오.
- 분석 아이디어에 대한 설명은 어떤 형식으로 얼마나 써야 하나요?
-
일반 텍스트 문서에 분석의 목표와 가치, 그리고 전체 과정을 이해하기 쉽게 작성하면 됩니다. (Markdown, PDF, MS-Word, HWP 모두 가능합니다)
- 제출한 아이디어와 코드는 어떻게 되나요?
-
전문가 심사를 거친 수상작은 피드백 과정을 거친 후, 헬빅쇼 홈페이지를 통해 공개됩니다. 수상하지 않은 제출물은 별도로 공개되지 않습니다.
- 주피터 노트북 코드는 파이썬으로 작성해야 하나요?
-
주피터 노트북은 실행 커널로 파이썬 뿐 아니라, R, Julia, C++, Ruby 등을 지원합니다. (https://jupyter.org/try 참고) 원하는 언어로 작성하십시오. 정상 실행만 되면 됩니다.
- 오믹스 별 전처리된 행렬자료를 이용하는데, 전처리 방식을 변경하고 싶습니다. 어떻게 해야 하나요?
-
공개된 데이터 전처리 및 정제 파이프라인의 코드를 참고하신 후, 내용을 수정하셔서 알려주시면 됩니다. Github 공개 저장소를 통해 clone 후, branch를 만들고, push 하시면 됩니다. 그러면 변경된 전처리 코드를 통해 생성된 행렬자료를 다시 제공하겠습니다.
도움이 더 필요하시면 dsc@insilicogen.com 으로 연락주세요.