WGS-Signature
변이 시그니처 분석은 대표적인 유전체 데이터 차원축소 방법입니다. 환자의 변이 타입별 카운팅 행렬을 가중치행렬(W)와 특성행렬(H)로 분해하면서 그 안에 숨겨진 특성을 유추할 수 있습니다. 본 페이지에서는 혈액샘플의 WGS (whole genome sequencing) 데이터로부터 변이 종류별 변이 갯수를 카운팅한후, NMF 방법을 통해 11개의 시그니처를 생성한 결과를 확인합니다.
Fig1. NMF reconstruction errors
NMF 행렬분해시 r 값을 선택하기 위해 reconstruction errors를 확인합니다. r=11을 선택합니다.
Fig2. WGS mutation signatures for normal
정상군(NNN)의 시그니처 분포를 확인합니다.
Fig3. WGS mutation signatures for hyperlipidemia
고지혈증 환자군(CCC)의 시그니처 분포를 확인합니다.
Fig4. WGS mutation signatures for gastric cancer
위암 환자군(GGG)의 시그니처 분포를 확인합니다.
Fig5. WGS mutation signatures for colon cancer
대장암 환자군(RRR)의 시그니처 분포를 확인합니다.
Fig6. WGS mutation signatures for breast cancer
유방암 환자군(BBB)의 시그니처 분포를 확인합니다.
Fig7. heatmap with clinic
환자별 시그니처 특성과 기본 임상정보를 이용한 상관분석을 통해 특정 임상정보와 연관된 시그니처를 찾아봅니다.
행렬분해 후 특성행렬(H)를 테이블로 표시하면 다움과 같습니다.
Signature 행렬
Fig8. h chart
특성행렬(H)의 변이종류별 분포는 위와 같습니다.
각 시그니처별로 변이종류별 분포를 다음과 같이 확인합니다.
Fig9. Signature 1
Fig10. Signature 2
Fig11. Signature 3
Fig12. Signature 5
Fig13. Signature 9
Fig14. Signature 10
Fig15. Signature 11
WGS vs. Liquidbx
헬빅쇼 데이터셋에는 혈액샘플로 부터 추출한 WGS 데이터와 Liquid biopsy 암패널 데이터가 함께 존재합니다. 둘다 유전체 서열을 결정하기 위한 NGS 실험이지만, Liquid biopsy는 낮은 빈도의 체세포 변이를 확인하기 위한 NGS 실험이라는 차이점이 있습니다. 본 페이지에서는 Liquid biopsy 시퀀싱 결과가 커버하는 영역을 확인하고, 이를 WGS 데이터와 비교한 결과를 확인합니다.
전체 유전체 영역에 대해 liquid biopsy 결과의 depth 를 맨하튼플랏처럼 표시합니다.
Fig1. Liquid Biopsy Variation Distribution Manhattan Plot
시퀀싱 영역이 유전체 전체에 분포하지만 특정 좌위만 deep sequencing 한 패널 데이터임을 알 수 있습니다. 이를 염색체별로 자세히 확인합니다.
Fig2. Liquid Biopsy Variation Distribution Manhattan Plot by chr1
Fig3. Liquid Biopsy Variation Distribution Manhattan Plot by chr2
Fig4. Liquid Biopsy Variation Distribution Manhattan Plot by chr3
Fig5. Liquid Biopsy Variation Distribution Manhattan Plot by chr4
Fig6. Liquid Biopsy Variation Distribution Manhattan Plot by chr5
Fig7. Liquid Biopsy Variation Distribution Manhattan Plot by chr6
Fig8. Liquid Biopsy Variation Distribution Manhattan Plot by chr7
Fig9. Liquid Biopsy Variation Distribution Manhattan Plot by chr8
Fig10. Liquid Biopsy Variation Distribution Manhattan Plot by chr9
Fig11. Liquid Biopsy Variation Distribution Manhattan Plot by chr10
Fig12. Liquid Biopsy Variation Distribution Manhattan Plot by chr11
Fig13. Liquid Biopsy Variation Distribution Manhattan Plot by chr12
Fig14. Liquid Biopsy Variation Distribution Manhattan Plot by chr13
Fig15. Liquid Biopsy Variation Distribution Manhattan Plot by chr14
Fig16. Liquid Biopsy Variation Distribution Manhattan Plot by chr15
Fig17. Liquid Biopsy Variation Distribution Manhattan Plot by chr16
Fig18. Liquid Biopsy Variation Distribution Manhattan Plot by chr17
Fig19. Liquid Biopsy Variation Distribution Manhattan Plot by chr18
Fig20. Liquid Biopsy Variation Distribution Manhattan Plot by chr19
Fig21. Liquid Biopsy Variation Distribution Manhattan Plot by chr20
Fig22. Liquid Biopsy Variation Distribution Manhattan Plot by chr21
Fig23. Liquid Biopsy Variation Distribution Manhattan Plot by chr22
depth가 10,000 이상인 좌위만 간추리면 712개의 좌위만을 확인할 수 있습니다. 이들에 대해 reference의 depth와 alternative의 depth를 변이 빈도(frequency)라 하고, 이 분포를 확인하면 다음과 같습니다.
Fig24. Variation Frequency Distribution Histogram
Heterozygote의 비율인 0.5와 Reference Homo의 비율인 1이 높은 분포를 보이는 것을 확인할 수 있습니다.
Fig25. Variation Number and Gene size by gene
염색체별로 depth가 10,000 이상인 좌위가 몇개인지 확인합니다. chr17 에 가장 많은 좌위가 있으며, 이는 염색체 크기(붉은선)과 상관없음을 알 수 있습니다.
Fig26. Same match ratio with WGS
염색체별로 depth가 10,000 이상인 좌위에 대해 WGS에서 확인한 유전자형이 얼마나 일치하는지의 분포를 확인합니다. Liquid Biopsy 결과와 WGS 결과가 겹치는 좌위 669개에 대해, 202명의 환자별로 Liquid biopsy genotype (0, 1, 2)와 WGS genotype (0, 1, 2)가 일치하는 비율은 평균 60% 로 그리 높지 않습니다.
Relation analysis Methyl-seq & RNA-seq
Fig1. Methyl-seq 전체 메틸화 비율 분포
Fig2. RNA-seq 전체 발현량 분포
Fig3. Methyl-seq vs. RNA-seq 환자별 상관도 분포
Fig4. Methyl-seq vs. RNA-seq 유전자별 상관도 분포
Fig5. 음의 상관 관계가 높은 유전자 1
Fig6. 음의 상관 관계가 높은 유전자 2
Relation analysis Microbiome & F/B ratio
Fig1. 전체 Phylum 분포
Fig2. F/B ratio 그룹별 분석
Fig3. F/B ratio BMI와 비교
Fig4. F/B ratio BMI 그룹 비교 boxplot
Fig5. F/B ratio BMI 그룹 비교 violinplot
Fig6. F/B ratio age와 비교