真沒想到(readingnovels)readingnewspaper,ReadingNotes|COEM: Cross-Modal Embedding for MetaCell Identification,u.com,
目錄:
1.真沒想到,武契奇成了中國武器的最好海外推銷員
2.真沒想到作文
3.真沒想到作文600字
4.真沒想到作文400字
5.真沒想到___半命題作文
6.真沒想到作文500字
7.真沒想到作文300字
8.真沒想到作文400字寫事20篇
9.真沒想到___半命題作文500字
10.真沒想到作文450字
1.真沒想到,武契奇成了中國武器的最好海外推銷員
Title:COEM: Cross-Modal Embedding for MetaCell Identificationlinks:https://arxiv.org/pdf/2207.07734The 2022 ICML Workshop on Comput華東五市旅游攻略必玩的景點ational Biology.
2.真沒想到作文
Abstract元細胞是不相交和均勻的單細胞組,代表離散和高度顆粒狀的細胞狀態(tài)現(xiàn)有的元細胞算法往往只使用一種模態(tài)來推斷元細胞,即使單細胞多組學(xué)數(shù)據(jù)描述了同一細胞的多種分子模態(tài)第一次接觸metacells,對此概念不是很理解,原文如下:。
3.真沒想到作文600字
Metacells are disjoint and homogeneous groups of single-cell profiles, representing discrete and highly granular cell states.
4.真沒想到作文400字
本文提出了一種基于華東五市旅游攻略必玩的景點跨模態(tài)嵌入的元細胞識別算法(cross-modal Embedding for MetaCell Identification, COEM),該算法在嵌入空間中同時利用了scATAC-seq和scRNA-seq的信息來進行聚類,在高分辨率和高測序覆蓋率之間取得了平衡。
5.真沒想到___半命題作文
COEM方法能夠在連續(xù)和離散細胞類型的數(shù)據(jù)集上高效地識別出精確且分離良好的元細胞,其性能優(yōu)于目前最先進的SEACells方法此外,COEM顯著改善了峰-基因(peak-to-gene)關(guān)聯(lián)分析,并促進了復(fù)雜的基因調(diào)控推斷任務(wù)。
6.真沒想到作文500字
Discussion實驗表明,整合來自scRNA-se華東五市旅游攻略必玩的景點q和scATAC-seq的信息有利于從單細胞數(shù)據(jù)中準(zhǔn)確和穩(wěn)健的識別元細胞特別是聯(lián)合嵌入的低維表示可以識別 細胞類型純度高和分離良好的元細胞 的細胞狀態(tài)。
7.真沒想到作文300字
其他優(yōu)勢:faster running time避免了大量錯誤的負的峰到基因鏈接(peak-to-gene links)Hence,聯(lián)合分析的序列數(shù)據(jù)能夠描繪細胞階段的全面景觀 (conprehensive lanscape)。
8.真沒想到作文400字寫事20篇
此外,(Bilous et al.,2021) 已經(jīng)證明從scRNA-seq推斷的元細胞與RNA速度模型(velocity model)兼容因此,COEM也可以用華東五市旅游攻略必玩的景點于估計表觀基因組和轉(zhuǎn)錄組動力學(xué)的多組學(xué)速度模型。
9.真沒想到___半命題作文500字
Future work:探索更多用于多模態(tài)序列數(shù)據(jù)集成(multi-modal data integration)和元細胞識別(metacell identification)的機器學(xué)習(xí)技術(shù)因為scRNA-seq和scATAC-seq具有自然的因果關(guān)系,utilizing this relation to learn more robust, causally sufficient, and efficient representations is interesting.。
10.真沒想到作文450字
Besid華東五市旅游攻略必玩的景點es, the results are promising for use of an optimal transport approach to model cellular stage changes across different modalities
on the metacell level (Schiebinger et al., 2019).Schiebinger, G., Shu, J., Tabaka, M., Cleary, B., Subramanian, V., Solomon, A., Gould, J., Liu, S., Lin, S., Berube, P., 華東五市旅游攻略必玩的景點et al. Optimal-transport analysis of single-cell gene expression identifies developmental trajectories in reprogramming. Cell, 176(4):928–943, 2019.
Bilous, M., Tran, L., Cianciaruso, C., Gabriel, A., Michel, H., Carmona, S., Pittet, M., and Gfeller, D. Metacells untangle large and complex single-cel華東五市旅游攻略必玩的景點l transcriptome networks (preprint). 2021.
注:可以理解為(scRNA-seq和scATAC-seq)data integration后的一個下游任務(wù)?IntroductionBackground:單細胞技術(shù)的最新進展使在單細胞分辨率下同時測量染色質(zhì)可及性和基因表達水平成為可能。
各種測序技術(shù),如Sci-CAR、SNARE-seq、SHARE-seq和10X Genomics Multiome,已被開發(fā)并應(yīng)用于細胞異質(zhì)性、發(fā)育動力學(xué)和順式調(diào)控(cis-regulatory)元件(CRE)的綜合研究。
然而,在scRNA-seq和scATAC-seq數(shù)據(jù)的單細華東五市旅游攻略必玩的景點胞測序測定中觀察到極端的數(shù)據(jù)稀疏性(sparsity)這阻礙了單細胞水平的順式調(diào)控推斷生物樣本的高通量單細胞分析通常會導(dǎo)致高度相似的和統(tǒng)計等效的細胞被重復(fù)抽樣。
元細胞的概念(Baran等人,2019年)已被提出以保持統(tǒng)計置信度元細胞是一組scRNA-seq細胞圖譜,代表不同的、高度粒狀的細胞狀態(tài)元細胞聚集體具有足夠的測序覆蓋率,有助于減少下游分析中的稀疏性問題。
Baran, Y., Bercovich, A., Sebe-Pedros, A., Lubling, Y., Giladi, A., Chomsky, E., Meir, Z., Hoichman, M., Lifshitz, A.,華東五市旅游攻略必玩的景點 and Tanay, A. Metacell: analysis of single-cell rnaseq data using k-nn graph partitions. Genome biology, 20 (1):1–19, 2019.。
cis-regulatory-順式調(diào)控:基因啟動子發(fā)生突變,使調(diào)控蛋白不能識別啟動子結(jié)構(gòu),基因不能表達,這種只影響基因本身表達、不影響其它等位基因調(diào)控的突變,稱順式調(diào)控Related works:MetaCells Algorithm 僅基于scRNA-seq數(shù)據(jù)上的k最近鄰(KNN)相似性圖的劃分推斷元細胞,但它在scATAC-seq數(shù)據(jù)上失敗。華東五市旅游攻略必玩的景點
SEACell方法(Single-cell aggregation of cell-states)旨在以RNA或ATAC模態(tài)識別元細胞它顯著改善了峰到基因的關(guān)聯(lián),即染色質(zhì)可及性峰和基因表達之間的關(guān)聯(lián)然而
,SEACell僅基于一種模式識別元細胞:提出嚴(yán)格的生物學(xué)假設(shè),即可及染色質(zhì)與活性轉(zhuǎn)錄一致相關(guān),盡管不同的數(shù)據(jù)模式可能在基因的染色質(zhì)重塑與其轉(zhuǎn)錄之間表現(xiàn)出時間差.這種“時滯”的發(fā)生表現(xiàn)在: 1.染色質(zhì)在轉(zhuǎn)錄開始前打開;2.染色質(zhì)關(guān)閉后mRNA降解。
Persad, S., Choo, Z.-N., Dien, C., Masilionis, I., Chalign ? e, R., Nawy, T華東五市旅游攻略必玩的景點., Brown, C. C., Pe’er, I., Setty, M., and Pe’er, D. Seacells: Inference of transcriptional and epigenomic cellular states from single-cell genomics data. bioRxiv, 2022.
Main work:這篇文章的目的是研究scATAC-seq和scRNA-seq數(shù)據(jù)的綜合分析,以提高發(fā)現(xiàn)和表征細胞狀態(tài)的能力,同時避免有偏差的關(guān)聯(lián)文章提出的新算法COEM旨在綜合分析多組測序單細胞數(shù)據(jù)(例如,在同一細胞中測量的基因表達和染色質(zhì)可及性)。
COEM華東五市旅游攻略必玩的景點首先通過多視圖、多模態(tài)變分自編碼器(VAE)模型學(xué)習(xí)scRNA-seq和scATAC-seq數(shù)據(jù)的聯(lián)合低維潛在表示來解決數(shù)據(jù)整合問題(Baltru saitis等人,2018年);進一步利用基于圖連通性的譜聚類方法
來識別RNA和染色質(zhì)水平上代表高度粒度、不同細胞狀態(tài)的元細胞發(fā)現(xiàn)COEM在具有離散細胞類型和連續(xù)發(fā)育軌跡的數(shù)據(jù)集中對元細胞的識別中比SEACell更準(zhǔn)確此外,COEM識別的元細胞大大改善了峰到基因的關(guān)聯(lián)分析,并支持CRE預(yù)測。
注:peak-to-gene 暫時還是不清楚,關(guān)聯(lián)分析我認為可以理解為,之前數(shù)據(jù)整合中會將峰矩陣轉(zhuǎn)化為基因表達矩陣后再與scRNA-seq進行整合。Method華東五市旅游攻略必玩的景點
1. 多模態(tài)聯(lián)合嵌入Multi-Modal Joint EmbeddingCOEM從同一細胞中測量的scRNA-seq和scATAC-seq數(shù)據(jù)中聯(lián)合學(xué)習(xí)低維表征,采用改進的多視圖(multi-view)VAE來提取兩種數(shù)據(jù)模態(tài)的公共潛在空間。
VAEs的生成模型如下:Given a cell, the scRNA gene expression x x∈Pxx\in P_{x}, scATAC chromatin accessibility data
y∈Pyy\in P_{y} , cell type cc , and the common latent representation zz ,華東五市旅游攻略必玩的景點 we have the following probability densities,
其中 θ\theta 表示生成模型的參數(shù)xx 和 yy 的似然函數(shù)取決于 共同潛在空間 zz 和細胞類型 cc ,當(dāng)給定 zz 和 cc , xx 和 yy 的分布是獨立的所以可以得到聯(lián)合生成模型:
對于具有條件變分近似 q?q_{\phi} 的兩個模態(tài),我們有以下證據(jù)下界(ELBO, evidence lower bound),
通常使用推斷網(wǎng)絡(luò)inference network(編碼器)來學(xué)習(xí)變分近似q?q_{\phi},和生成網(wǎng)絡(luò)generative network(解碼器)來學(xué)習(xí) pθp_{\thet華東五市旅游攻略必玩的景點a}特別地,我們假設(shè) 。
pθ(x|z,c)p_{\theta}(x|z,c) 是零膨脹泊松分布,pθ(y|z,c)p_{\theta}(y|z,c)是負二項式(NB)分布,pθ(z|c)p_{\theta}(z|c)是高斯混合模型。
給定聯(lián)合嵌入生成式模型,我們采用scMVP(Li et al.,2022)架構(gòu)對生成網(wǎng)絡(luò)和推理網(wǎng)絡(luò)進行建模具體來說,對于scRNA-seq和scATAC-seq輸入,存在一個基于雙通道注意力的編碼器網(wǎng)絡(luò),然后將它們連接以導(dǎo)出后驗分布。
p?(z|x,y,c)p_{\phi}(z|x,y,c)接下來,通過基于注意力的雙通道解碼器網(wǎng)絡(luò)重建估算的scRNA和scATAC p華東五市旅游攻略必玩的景點rofiles,以計算似然pθ(x,y|z,c)p_{\theta}(x,y|z,c)。
2. 元細胞認定Metacells IdentificationCOEM是一種基于圖,采用譜聚類來計算元細胞的方法更具體地說,COEM由以下四個步驟組成: 應(yīng)用跨模態(tài)聯(lián)合嵌入VAE來學(xué)習(xí)低維公共表征z,如何編碼scRNA-seq和scATAC-seq的公共信息。
基于歐式距離在低維嵌入空間z上構(gòu)建k-近鄰(KNN)圖通過連通性從KNN圖構(gòu)建相似性矩陣相似性矩陣基于徑向基函數(shù)(radial basis function-RBF)核來編碼z中的非線性關(guān)系利用譜聚類來識別簇,并隨后聚合元細胞,如(Persad,20華東五市旅游攻略必玩的景點22)中所述。
Persad, S., Choo, Z.-N., Dien, C., Masilionis, I., Chalign ? e, R., Nawy, T., Brown, C. C., Pe’er, I., Setty, M., and Pe’er, D. Seacells: Inference of transcriptional and epigenomic cellular states from single-cell genomics data. bioRxiv, 2022.
COEM與SEACells都基于graph,區(qū)別是元細胞認定COEM采用譜聚類,而SEACells華東五市旅游攻略必玩的景點采用原型分析(archetypal analysis)COEM的譜聚類純粹利用圖的連通性信息,運行速度更快。
且文章驗證了譜聚類可以提高元細胞識別和運行時間
采用不同的低維嵌入空間,比較原型分析和譜聚類的運行時間Experiment & Results正如在SEACells論文中一樣,我們使用致密性、分離度和細胞類型純度作為元細胞基準(zhǔn)致密性衡量元細胞內(nèi)細胞的同質(zhì)程度。
分離評估元細胞之間的差異相反,細胞類型純度衡量構(gòu)成元細胞的細胞之間細胞類型的一致性我們使用來自RNA測定(RNA_PCA)的主成分、或來自ATAC測定(ATAC_SVD)的奇異值計算擴散成分,然后量化元細胞的致密性和分離度。
由于SEA華東五市旅游攻略必玩的景點Cells從一個模態(tài)識別元細胞,我們將它們表示為SeaC-ATAC和SeaC-RNA
我們評估了sci-CAR數(shù)據(jù)集中的細胞類型純度,來自COEM算法的元細胞比SeaCATAC(0.67)和SeaC-RNA(0.74)具有更高的純度(0.91),這表明利用兩種模式提高了我們定義細胞狀態(tài)的能力。
(sci-CAR 是有標(biāo)簽的數(shù)據(jù)集)
然后測量了具有離散細胞類型的數(shù)據(jù)集之間的致密性和分離度通常,基于COEM的方法比表2、3和4至6中所示的SeaC-ATAC和SeaC-RNA更好地分離元細胞但是它們可能僅基于一種模態(tài)具有更高的緊致度,因為COEM同時平衡了兩種模態(tài)的細胞可變性。
SEACells識別的元細胞華東五市旅游攻略必玩的景點具有較低的緊致度,因為元細胞識別和緊致度評估基于來自單個模態(tài)的擴散成分但這些元細胞可能不能很好地分離和壓實,因為它們的擴散成分來自于其他模態(tài)因此,使用僅從一種模態(tài)推斷的元細胞來分析基因表達和峰值可及性之間的關(guān)聯(lián)可能會有偏差。
此外,基于低維嵌入z,譜聚類在識別高細胞類型純度和分離度的元細胞方面優(yōu)于原型分析我們還測量了原型分析和譜聚類使用相同的低維嵌入z的運行時間,如表1所示我們可以看到,譜聚類在四個數(shù)據(jù)集中的運行時間通常要短一個數(shù)量級。
通過分析染色質(zhì)可及性和基因表達,我們可以推斷開染色質(zhì)峰和轉(zhuǎn)錄活性之間的關(guān)系,這有助于COEM在CRE的發(fā)現(xiàn)元細胞可以作為一種明智的策略,具有高分辨率和足夠的測序覆華東五市旅游攻略必玩的景點蓋范圍,用于從單細胞數(shù)據(jù)進行基因調(diào)控推斷。
我們通過計算每個峰值在基因+/- 100kb范圍內(nèi)的Pearson相關(guān)性來評估跨元細胞染色質(zhì)可及性和基因表達的共變異我們觀察到SeaC-ATATC metaccells (CD34+骨髓:25.1%;t細胞耗盡骨髓:23.0%)(圖1),而在骨髓中發(fā)現(xiàn)一小部分負性峰值與基因關(guān)聯(lián)(CD34+骨髓:1.3%;t細胞耗盡骨髓:3.0%),這與單細胞水平上報道的負峰與基因關(guān)聯(lián)比率(1.2 ~ 11%)一致。
這表明分化過程中“時間滯后”現(xiàn)象的偏差在SEACells metacells中被夸大,而在COEM中沒有此外,基于COEM元細胞,我們可以觀察到更強的核心基華東五市旅游攻略必玩的景點因峰-基因相關(guān)性例如,GATA2基因是造血干細胞和祖細胞增殖和維持的主要調(diào)控因子。
來自CD34+骨髓數(shù)據(jù)集的COEM元細胞中,GATA2的峰值與基因的相關(guān)性為0.73,而在SeaC-ATAC元細胞中,其相關(guān)性為0.62(在單細胞水平上,GATA2峰峰與基因的相關(guān)性為0.1)注:數(shù)據(jù)分析這里不是很明白
個人觀點:這篇文章篇幅很短,用的模型和方法原創(chuàng)性不高,主要是結(jié)合了VAE和譜聚類,所做的metacells identification,因為我對metacell的定義和意義暫時不是很清楚,所以有點迷糊,不知道這樣做的意義和優(yōu)勢?我之前主要看的是單細胞數(shù)據(jù)整合的內(nèi)容,最多做到聚類這樣的下游任務(wù),來判華東五市旅游攻略必玩的景點斷方法的性能,還沒有看到針對元細胞聚類的文章,感覺是個不錯的可以結(jié)合的下游任務(wù)(可以用來豐富文章內(nèi)容)。