资讯中心
全长转录本测序基于单分子实时测序Pacbio Sequel平台,它以长读长的优势、结合多片段文库筛选技术,实现了无需拼接的转录本分析,克服了传统二代转录组转录本拼接短、信息不完整的缺陷,可大大提高可变剪接、基因融合等分析的准确性。
当然全长转录组测序除了不能定量以外的另一缺点就是价格昂贵,因为转录组信息存在组织差异,单一组织得到的全长转录本对该物种其他部位组织可能不是很全面或不太适用,所有部位单独建库测序的成本也很高,所以用一个物种不同部位组织混样进行高深度测序,会得到相对比较全面的参考转录本库信息,也是降低测序成本的理想方法之一。
因为Pacbio 测序的原理:直径只有几十纳米的零模波导孔,单分子的DNA聚合酶被固定在这个孔内,将构建好的全长转录组文库需要loading进去后进行测序。但是loading因为其对短片段的偏好性,会导致短片段占据过多数据量,而大部分长片段没有测到,因此一般会推荐构建片段分级文库。为了降低loading偏差的影响,构建分级文库越多,也会得到更全面的全长转录本。全长转录组测序一般推荐至少构建三种文库类型,1-2Kb、2-3Kb和3-6Kb文库,但随着Sequel和Sequel II数据产出爆炸性的增长,一般选择构建混合文库即1-2Kb,2-4Kb,4-10Kb,将三部分片段进行等量混合构建一个混库测序,可选择加Barcode混其他样品共同测序或者单样本测序,一般推荐多片段混库数据量在10-15G左右,当然测序数据量越多,检测到的全长转录本也会越全面。
影响测序产出的因素有很多,包括样品初始质量、RNA质量、文库的质量、文库的上机定量、测序仪的状态等,因此前期的质检步骤是不可或缺的,从RNA提取后的质量测定,到分片段浓度和片段大小的测定和最后出库是文库的浓度和大小的测定,都是保证测序产出质量的前提。
三代建库对提取的total RNA的完整性要求相对较高,以Qsep检测为例,一般要求RQN>8,浓度>300ng/ul,总量>3ug,基线波动较小。
三代RNA建库过程中,需要质控的是各部分片段的大小和浓度,以便后续的各片段样品等量混合建库,以保证覆盖的均一性。另外需要质控步骤是文库的大小和浓度,为后续上机的loading的量提供数据,保证loading率以保证后续的数据产出。使用Qsep系列检测可以同时测定浓度和片段大小,一步到位。浓度和片段的测定的方法可参见之前的文章“浓度测定新选择,助力核酸定量”。