单细胞全长转录组相较于二代的单细胞转录组有什么不同?
单细胞全长转录组相较于二代的单细胞转录组(如10x Genomics的短读长技术),主要差异体现在以下几个方面:
1、测序技术原理
(1)读长能力
二代单细胞转录组基于短读长(如Illumina平台)仅能捕获mRNA的3'或5'端标签,丢失中间序列的isoform信息。而单细胞全长转录组采用三代测序技术,可对全长mRNA进行直接测序,实现5'到3'端的全覆盖。
(2)建库方式
二代技术依赖标签化建库,需通过PCR扩增生成文库,可能引入偏好性。单细胞全长转录组通过单细胞分离、全长反转录和扩增,减少扩增噪声。
2、分析能力提升
(1)可变剪切与异构体检测
二代技术仅能分析基因表达量,无法识别同一基因的不同转录本(isoform)。单细胞全长转录组可精准鉴定可变剪切位点、融合基因及新转录本,揭示细胞异质性。例如,肿瘤细胞中融合基因的检测对靶向治疗至关重要。
(2)非编码RNA与突变分析
支持长链非编码RNA(lncRNA)的检测,并能发现基因组SNV和RNA层面的突变,为疾病机制研究提供新线索。二代技术通常仅聚焦于蛋白编码基因。

3、应用场景扩展
(1)复杂生物事件研究
在神经科学中,可追踪神经元发育中的可变剪切异常;在肿瘤研究中,识别耐药亚群及融合基因。二代技术因分辨率限制,难以解析此类精细结构。
(2)多组学整合潜力
单细胞全长转录组可与单细胞表观组、空间转录组联合分析,提供更全面的细胞状态解析
案例一 整合短读长和长读长单细胞RNA测序技术,全面揭示小鼠视网膜的转录组特征 (Genome Research,IF=6.2)
视网膜是一个由130多种不同的神经元细胞类型组成的复杂神经组织,这些细胞被分类为七个主要细胞类别。视网膜具有显著的组织特异性剪接事件,全面了解基因的转录本亚型对于理解剪接和基因调控的基本机制至关重要。然而,迄今为止,尚未系统地注释和量化小鼠视网膜中的RNA转录本亚型,并尚未将其应用于细胞类型特异性的研究中。
本研究对来自四个小鼠视网膜样本(两个野生型视网膜样本,两个富集了星形细胞(AC)和双极细胞(BC)的样本)分别进行了短读长和长读长单细胞转录组测序。在超3万个视网膜细胞中生成了1.54亿条lumina短读长reads和1.4亿条Oxford Nanopore长读长reads。通过比较短读长和长读长数据集的单个细胞注释发现,超过98.0%的细胞类型注释结果是一致的,其中双极细胞(BCs)的一致性达到了99.8%。
长读长数据在BC类型中识别出了一个额外的BC4类型,这在短读长数据中并未被检测到。两种数据的基因表达呈极强的正相关性(0.87)。
长读长测序能够提供更长的读长,从而可以更精确地测定转录本的完整结构和剪接事件。长读长测序确定了44,325个转录异构体,其中38%是未知的,17%仅在特定细胞亚型中表达。尽管许多转录异构体在多种细胞类型中共享,但它们在不同细胞类型中的相对丰度存在显著差异。这种差异可能反映了不同细胞类型在功能和代谢需求方面的不同,为深入理解视网膜细胞的特异性机制提供了重要线索。


案例二 长读长测序对人和小鼠单细胞全长异构体的综合鉴定(Genome Biology,IF=13.583)
作者基于10X Genomics平台开发了单细胞异构体测序技术(FLT-seq)和数据分析流程(FLAMES),整合了短读长和Nanopore测序技术的优点,可以检测和定量单个细胞的Isoform。识别出数干种未被注释的Isoform。在不同的细胞群体中发现了保守的功能模块。该方法揭示了以前未发现的Isoform复杂性,为多组学数据集提供了一个更好的框架。

材料:scmixology混合细胞系(scmixology1和scmixology2)、小鼠静态和活化肌肉干细胞(MuSCs)、来自患者(CLL2)的外周血单核细胞(PBMC)。

按照与参考转录本的比对情况,将转录本主要分为4种剪接类型,且在不同样品中的丰度不同。3个人样本中,均有许多特异转录本。CLL细胞和静止的肌肉干细胞具有更高比例的新转录本,约80%的基因可以表达多种isoform。每个基因平均表达3-6个isoform,且两种表达量最高的isoform占总数的80%。细胞受多种因素影响以一定频率随机选择isoform,包括转录活性和细胞异质性。在每个样品中鉴定了500-1,000个基因具有差异转录本(gDTU)。近一半的gDTU在scmixology1和scmixology2之间共享。揭示了不同样品之间共享通路,尤其是与转录和翻译相关的通路。RPS24是小鼠和人之间高度保守的基因,不同的RPS24 isoform表达具有组织特异性,有些与肿瘤发展相关。而二代数据的基因水平分析中缺失了RPS24 isoform表达的异质性。
参考文献:
Wang M, et al. Cellular heterogeneity in red and melanized focal muscle changes in farmed Atlantic salmon (Salmo salar) visualized by spatial transcriptomics. Genome Research, 2025
Tian L, et al. Comprehensive characterization of single-cell full-length isoforms in human and mouse with long-read sequencing. Genome Biology, 2021