原文pdf连接
摘要
Progress | Challenge | Demand | |
Background | |||
Solve |
What | How | Effect |
通过实际数据分析评估不同的策略组合 | 参考数据的影响以及参考数据的处理策略 | 提供了使用监督细胞分型方法的指南和经验法则 | |
Result |
Study design Methods under comparison 3种现成的:random forest, SVM with linear kernel, and SVM with radial basis function kernel 2种基于scRNA相关性的方法: scmap and CHETAH 2种监督深度学习方法:multi-layer perceptron (MLP) and graph-embedded deep neural network (GEDFN) 2种半监督深度学习:ItClust with transfer-learning and MARS with meta-learning concepts 虽然还有其他方法,但基于已有的研究,SVM with rejection, scmap, and CHEAH是他们中最好的 纳入GEDFN方法是为了研究基因网络信息是否有帮助 ItClust 只是用ref数据得到非监督聚类的参考值 Feature selection methods Datasets 10X,Smart-seq2,CEL-seq2 pbmc2 fresh 人胰腺 Evaluation metrics Summary of the study design |
||
F-test on reference datasets + MLP 特征选择和MLP的组合 |
|||
Impact of the reference data size 基于学习的方法细胞数越多排名越高(MLP,SVM) |
|||
Impact of number of cell types 一个组织中有少数主要类型,有许多子类,子类的比较相似,不好区分 |
|||
Impact of cell type annotations 上述注释结果来自marker,现在以分选数据作为金标准 |
|||
Impact of data preprocessing 评估去除batch效应或者数据插补带来的影响 先评估三种插补方法:没有明显提升,结论为不必要 在评估batch效应去除:Harmony and fastMNN 批量效应不会影响预测性能,可能不需要校正,我们直接将数据集连接起来进行以下分析。 |
|||
Drop-seq frontal cortex “Mouse brain FC” Condition effect | |||
Conclusion& Discussion | |||
Method | |||
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/tech/pnotes/278532.html