【佳学基因检测】提高乳腺癌靶向用药基因检测准确性的人工智能分析方法S-PrediXcan
佳学基因不断提升肿瘤靶向药物分析的智能算法
在基因检测领域,虽然佳学基因提供的报告是针对每一个患者的。以乳腺癌为例,佳学基因的质量控制程序中,首先要求获得的信息要全,测得的基因序列要多。尽管很多机构为了降低检测成本,采用各种患者不理解的方式降低检测范围,佳学基因始终以推荐更全的基因序列以为乳腺癌者获得靶向药物、化疗药物选择的可能性。靶向药物基因检测的第二个质量控制或者是影响药物选择有效性的方法是基因信息的解码算法。佳学基因不仅推出了基于结构的基因解码分析方法,克服了数据库分析方法的局限性。同时还从多种角度提升分析的准确性和全面性,人工智能、神经网络算法是佳学基因重点投入的另一个领域。
乳腺癌靶向药物基因检测人工智能云分析的实现措施
佳学基因在多次腾讯课堂中展示了乳腺癌靶向药物治疗云计算人工智能方法Summary PrediXcan, 采用这一分析主法分析了乳腺癌预测基因表达与表型之间关联的Z评分(Wald统计)的主要分析表达式。在乳腺癌靶向药物精准度分析中的输入变量是用于预测给定基因表达的权重、预测中包含的标记的方差和协方差以及每个标记的GWAS系数。原则上,公式中的最后一个因子可以使计算更准确。但这一额外参数无法在经典的GWAS汇总统计分析结果中并不存在。这些智能分析因子包括表型方差和样本量。但佳学基因开发的这一分析体系从计算公式中删除不会影响结果的准确性。佳学基因的多次结果示例中显示了S-PrediXcan和PrediXcan智能算法的一致性。
其中wlg是SNP l在预测基因g表达中的权重;βˆl是SNP l的GWAS回归系数;se(βˆl)是βˆ的标准误差,σˆl是SNP l的估计方差,σˆg是基因g预测表达的估计方差;假设剂量和替代等位基因相同。
为了实现乳腺癌靶向药物基因检测的准克计算,佳学基因需要准备三个不同来源的数据:研究集(如GWAS研究集)、表达训练集(如GTEx、DGN)、群体参考集(如训练集或1000基因组)。
研究集是收集与乳腺癌靶向药物治疗相关联的基因型和表型的主要数据集。回归系数和标准误差是根据研究集中的个体水平数据或多个GWAS的SNP水平荟萃分析计算的。训练集是用于预测模型(GTEx、DGN、Framingham等)训练的参考转录组数据集,因此权重wlg是从该集合计算出来的。训练集也可用于生成遗传标记的方差和协方差,这通常与研究集不同。当训练集中没有个体水平的数据时,乳腺癌靶向用药云计算中使用群体参考集,如1000个基因组数据。在通常的运算过程中,佳学基因优化了计算算法,基因解码工程师将只需要使用他们的研究集提供GWAS结果。其余参数都已经预先计算的,并在PredictDB中发布。
(责任编辑:佳学基因)