bbpScore智能算法
是基于遺傳學,生物信息學,及統計學相關理論,結合遺傳數據解讀專家的分析經驗,設計出的一套簡化二代測序遺傳病變異有害性評分模型。
目前熱門的機器學習模型(包括深度學習)都不適用于遺傳病目前的數據結構(高維特征/低維樣本/稀疏數據),因此通過人工建立的模型是目前經過多次嘗試后得到的最優化結果。
1
算法模型(不依賴于表型的算法模型)
算法特征
隨機挑選100例臨床案例數據,對bpScore智能篩選算法進行測試,結果表明:在超過90%的案例中,致病性變異的致病性打分排名位于前三。
在100例常染色體隱性遺傳基因致病的案例中,90%的致病性變異的致病性打分排名第一。
2
案例分享
Case 1:
苯丙酮尿癥
bpVast篩選:
bpScore排名前2位突變信息,為PAH基因報道致病性的變異。
Case 2:
雙眼屈光不正,雙眼視網膜色素變性
bpVast篩選:
bpScore排名第一的位點為CDHR1基因的純合突變,相關疾病為視錐-視桿營養不良15型。通過變異的類型、所處位置、軟件預測、人群攜帶率、表型符合度相關信息結合ACMG指南的評級確定該變異為可能致病的。
Case 3:
熱性驚厥
bpVast篩選:
bpScore排名第一的位點為SCN1A基因的無義突變,在參考人群基因數據庫中未有收錄,該疾病相關表型和患者癥狀相符,經家系驗證結果表明該變異為新發突變,符合該患者家系共分離證據。
Case 4:
間斷抽搐2月余,共5次
bpVast篩選:
bpScore排名第一的位點為ATP1A2基因的錯義突變,被HGMD數據庫報道為致病性的,在GnomAD數據庫中的等位基因頻率約為十萬分之一,包括Revel、 ClinPred、 SIFT、 PolyPhen多個軟件均預測該變異為致病性的,查看該疾病信息發現該變異為該基因最高發的致病性變異。經家系驗證結果表明該變異為新發突變,符合該患者家系共分離證據。