Q值:测序准确度的量化指标
Q值Quality Score是高通量测序中用于衡量单个碱基测序错误概率的关键参数,其计算公式为: Q = -10log₁₀(P) 其中,P代表该碱基被错误识别的概率。Q值越高,表明碱基识别错误率越低,测序准确度越高。Q20:错误率1%的质量阈值
Q20表示该碱基的错误率为1%,对应准确度为99%。根据Q值计算公式,当Q=20时,错误概率P=10^(-20/10)=0.01即1%,因此碱基正确识别的概率为1-P=99%。在测序数据中,Q20常作为基础质量标准,确保数据满足初步分析需求。Q30:错误率0.1%的严格标准
Q30表示该碱基的错误率为0.0010.1%,对应准确度为99.9%。此时错误概率P=10^(-30/10)=0.001,正确识别概率达99.9%。Q30是更严格的质量指标,直接影响对低丰度变异、复杂基因组区域的准确分析。Q20与Q30的实际应用
实际测序中,Q20和Q30通常以“比例”形式呈现,即所有碱基中Q值≥20或≥30的占比。例如,某项目Q30比例为85%,意味着85%的碱基错误率≤0.1%。行业普遍:Q20比例需≥90%,Q30比例需≥80%,方可满足基因组组装、变异检测等下游分析的可靠性。低Q值比例的样本可能因错误碱基积累,导致假阳性变异或组装片段断裂。Q20和Q30通过量化碱基错误概率,成为高通量测序数据质量控制的“金标准”。二者数值越高,数据可信度越强,是保障测序结果从实验到分析全流程可靠的核心指标。
