本文最后更新于:星期日, 五月 31日 2020, 2:37 下午

image
测序得到的原始图像数据经 base calling 转化为序列数据,我们称之为 raw dataraw reads ,结果以 fastq 文件格式存储, fastq 文件为用户得到的最原始文件,里面存储 reads 的序列以及 reads 的测序质量。在 fastq 格式文件中每个 read 由四行描述:

@read ID
TGGCGGAGGGATTTGAACCC
+
bbbbbbbbabbbbbbbbbbb
  • Single-end(SE)测序:1个fastq文件
  • Pair-end(PE)测序:2个fastq文件分别存放read1和read2的数据

每个序列共有4行,第1行和第3行是序列名称(有的 fq 文件为了节省存储空间会省略第三行“+”后面的序列名称);第2行是序列;第4行是序列的测序质量,每个字符对应第2行每个碱基,第4行每个字符对应的 ASCII 值减去64,即为该碱基的测序质量值,比如 h 对应的 ASCII 值为104,那么其对应的碱基质量值是40。
碱基质量值范围为0到40。下表为 Solexa 测序错误率与测序质量值简明对应关系,具体计算公式如下:

Q = -10 log10P

Solexa测序错误率与测序质量值简明对应关系:

image



本文标题:生物信息分析中的reads是什么
文章作者:潘高
发布时间:2018年01月04日 - 22:43:22
最后更新:2020年05月31日 - 14:37:59
原始链接:https://blog.pangao.vip/%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E5%88%86%E6%9E%90%E4%B8%AD%E7%9A%84reads%E6%98%AF%E4%BB%80%E4%B9%88/
许可协议:署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

生物信息分析中的测序概念 上一篇
外显子、内含子、mRNA、CDS、ORF的区别与联系 下一篇
如果这篇文章对你有帮助,或者想给我微小的工作一点点资瓷,请随意打赏。
潘高 微信支付

微信支付

潘高 支付宝

支付宝

 目录