真沒(méi)想到(readingnovels)readingnewspaper,ReadingNotes|COEM: Cross-Modal Embedding for MetaCell Identification,u.com,
目錄:
1.真沒(méi)想到,武契奇成了中國(guó)武器的最好海外推銷(xiāo)員
2.真沒(méi)想到作文
3.真沒(méi)想到作文600字
4.真沒(méi)想到作文400字
5.真沒(méi)想到___半命題作文
6.真沒(méi)想到作文500字
7.真沒(méi)想到作文300字
8.真沒(méi)想到作文400字寫(xiě)事20篇
9.真沒(méi)想到___半命題作文500字
10.真沒(méi)想到作文450字
1.真沒(méi)想到,武契奇成了中國(guó)武器的最好海外推銷(xiāo)員
Title:COEM: Cross-Modal Embedding for MetaCell Identificationlinks:https://arxiv.org/pdf/2207.07734The 2022 ICML Workshop on Comput華東五市旅游攻略必玩的景點(diǎn)ational Biology.

2.真沒(méi)想到作文
Abstract元細(xì)胞是不相交和均勻的單細(xì)胞組,代表離散和高度顆粒狀的細(xì)胞狀態(tài)現(xiàn)有的元細(xì)胞算法往往只使用一種模態(tài)來(lái)推斷元細(xì)胞,即使單細(xì)胞多組學(xué)數(shù)據(jù)描述了同一細(xì)胞的多種分子模態(tài)第一次接觸metacells,對(duì)此概念不是很理解,原文如下:。
3.真沒(méi)想到作文600字
Metacells are disjoint and homogeneous groups of single-cell profiles, representing discrete and highly granular cell states.
4.真沒(méi)想到作文400字
本文提出了一種基于華東五市旅游攻略必玩的景點(diǎn)跨模態(tài)嵌入的元細(xì)胞識(shí)別算法(cross-modal Embedding for MetaCell Identification, COEM),該算法在嵌入空間中同時(shí)利用了scATAC-seq和scRNA-seq的信息來(lái)進(jìn)行聚類(lèi),在高分辨率和高測(cè)序覆蓋率之間取得了平衡。
5.真沒(méi)想到___半命題作文
COEM方法能夠在連續(xù)和離散細(xì)胞類(lèi)型的數(shù)據(jù)集上高效地識(shí)別出精確且分離良好的元細(xì)胞,其性能優(yōu)于目前最先進(jìn)的SEACells方法此外,COEM顯著改善了峰-基因(peak-to-gene)關(guān)聯(lián)分析,并促進(jìn)了復(fù)雜的基因調(diào)控推斷任務(wù)。
6.真沒(méi)想到作文500字
Discussion實(shí)驗(yàn)表明,整合來(lái)自scRNA-se華東五市旅游攻略必玩的景點(diǎn)q和scATAC-seq的信息有利于從單細(xì)胞數(shù)據(jù)中準(zhǔn)確和穩(wěn)健的識(shí)別元細(xì)胞特別是聯(lián)合嵌入的低維表示可以識(shí)別 細(xì)胞類(lèi)型純度高和分離良好的元細(xì)胞 的細(xì)胞狀態(tài)。
7.真沒(méi)想到作文300字
其他優(yōu)勢(shì):faster running time避免了大量錯(cuò)誤的負(fù)的峰到基因鏈接(peak-to-gene links)Hence,聯(lián)合分析的序列數(shù)據(jù)能夠描繪細(xì)胞階段的全面景觀 (conprehensive lanscape)。
8.真沒(méi)想到作文400字寫(xiě)事20篇
此外,(Bilous et al.,2021) 已經(jīng)證明從scRNA-seq推斷的元細(xì)胞與RNA速度模型(velocity model)兼容因此,COEM也可以用華東五市旅游攻略必玩的景點(diǎn)于估計(jì)表觀基因組和轉(zhuǎn)錄組動(dòng)力學(xué)的多組學(xué)速度模型。
9.真沒(méi)想到___半命題作文500字
Future work:探索更多用于多模態(tài)序列數(shù)據(jù)集成(multi-modal data integration)和元細(xì)胞識(shí)別(metacell identification)的機(jī)器學(xué)習(xí)技術(shù)因?yàn)閟cRNA-seq和scATAC-seq具有自然的因果關(guān)系,utilizing this relation to learn more robust, causally sufficient, and efficient representations is interesting.。
10.真沒(méi)想到作文450字
Besid華東五市旅游攻略必玩的景點(diǎn)es, the results are promising for use of an optimal transport approach to model cellular stage changes across different modalities
on the metacell level (Schiebinger et al., 2019).Schiebinger, G., Shu, J., Tabaka, M., Cleary, B., Subramanian, V., Solomon, A., Gould, J., Liu, S., Lin, S., Berube, P., 華東五市旅游攻略必玩的景點(diǎn)et al. Optimal-transport analysis of single-cell gene expression identifies developmental trajectories in reprogramming. Cell, 176(4):928–943, 2019.
Bilous, M., Tran, L., Cianciaruso, C., Gabriel, A., Michel, H., Carmona, S., Pittet, M., and Gfeller, D. Metacells untangle large and complex single-cel華東五市旅游攻略必玩的景點(diǎn)l transcriptome networks (preprint). 2021.
注:可以理解為(scRNA-seq和scATAC-seq)data integration后的一個(gè)下游任務(wù)?IntroductionBackground:?jiǎn)渭?xì)胞技術(shù)的最新進(jìn)展使在單細(xì)胞分辨率下同時(shí)測(cè)量染色質(zhì)可及性和基因表達(dá)水平成為可能。
各種測(cè)序技術(shù),如Sci-CAR、SNARE-seq、SHARE-seq和10X Genomics Multiome,已被開(kāi)發(fā)并應(yīng)用于細(xì)胞異質(zhì)性、發(fā)育動(dòng)力學(xué)和順式調(diào)控(cis-regulatory)元件(CRE)的綜合研究。
然而,在scRNA-seq和scATAC-seq數(shù)據(jù)的單細(xì)華東五市旅游攻略必玩的景點(diǎn)胞測(cè)序測(cè)定中觀察到極端的數(shù)據(jù)稀疏性(sparsity)這阻礙了單細(xì)胞水平的順式調(diào)控推斷生物樣本的高通量單細(xì)胞分析通常會(huì)導(dǎo)致高度相似的和統(tǒng)計(jì)等效的細(xì)胞被重復(fù)抽樣。
元細(xì)胞的概念(Baran等人,2019年)已被提出以保持統(tǒng)計(jì)置信度元細(xì)胞是一組scRNA-seq細(xì)胞圖譜,代表不同的、高度粒狀的細(xì)胞狀態(tài)元細(xì)胞聚集體具有足夠的測(cè)序覆蓋率,有助于減少下游分析中的稀疏性問(wèn)題。
Baran, Y., Bercovich, A., Sebe-Pedros, A., Lubling, Y., Giladi, A., Chomsky, E., Meir, Z., Hoichman, M., Lifshitz, A.,華東五市旅游攻略必玩的景點(diǎn) and Tanay, A. Metacell: analysis of single-cell rnaseq data using k-nn graph partitions. Genome biology, 20 (1):1–19, 2019.。
cis-regulatory-順式調(diào)控:基因啟動(dòng)子發(fā)生突變,使調(diào)控蛋白不能識(shí)別啟動(dòng)子結(jié)構(gòu),基因不能表達(dá),這種只影響基因本身表達(dá)、不影響其它等位基因調(diào)控的突變,稱順式調(diào)控Related works:MetaCells Algorithm 僅基于scRNA-seq數(shù)據(jù)上的k最近鄰(KNN)相似性圖的劃分推斷元細(xì)胞,但它在scATAC-seq數(shù)據(jù)上失敗。華東五市旅游攻略必玩的景點(diǎn)
SEACell方法(Single-cell aggregation of cell-states)旨在以RNA或ATAC模態(tài)識(shí)別元細(xì)胞它顯著改善了峰到基因的關(guān)聯(lián),即染色質(zhì)可及性峰和基因表達(dá)之間的關(guān)聯(lián)然而
,SEACell僅基于一種模式識(shí)別元細(xì)胞:提出嚴(yán)格的生物學(xué)假設(shè),即可及染色質(zhì)與活性轉(zhuǎn)錄一致相關(guān),盡管不同的數(shù)據(jù)模式可能在基因的染色質(zhì)重塑與其轉(zhuǎn)錄之間表現(xiàn)出時(shí)間差.這種“時(shí)滯”的發(fā)生表現(xiàn)在: 1.染色質(zhì)在轉(zhuǎn)錄開(kāi)始前打開(kāi);2.染色質(zhì)關(guān)閉后mRNA降解。
Persad, S., Choo, Z.-N., Dien, C., Masilionis, I., Chalign ? e, R., Nawy, T華東五市旅游攻略必玩的景點(diǎn)., Brown, C. C., Pe’er, I., Setty, M., and Pe’er, D. Seacells: Inference of transcriptional and epigenomic cellular states from single-cell genomics data. bioRxiv, 2022.
Main work:這篇文章的目的是研究scATAC-seq和scRNA-seq數(shù)據(jù)的綜合分析,以提高發(fā)現(xiàn)和表征細(xì)胞狀態(tài)的能力,同時(shí)避免有偏差的關(guān)聯(lián)文章提出的新算法COEM旨在綜合分析多組測(cè)序單細(xì)胞數(shù)據(jù)(例如,在同一細(xì)胞中測(cè)量的基因表達(dá)和染色質(zhì)可及性)。
COEM華東五市旅游攻略必玩的景點(diǎn)首先通過(guò)多視圖、多模態(tài)變分自編碼器(VAE)模型學(xué)習(xí)scRNA-seq和scATAC-seq數(shù)據(jù)的聯(lián)合低維潛在表示來(lái)解決數(shù)據(jù)整合問(wèn)題(Baltru saitis等人,2018年);進(jìn)一步利用基于圖連通性的譜聚類(lèi)方法
來(lái)識(shí)別RNA和染色質(zhì)水平上代表高度粒度、不同細(xì)胞狀態(tài)的元細(xì)胞發(fā)現(xiàn)COEM在具有離散細(xì)胞類(lèi)型和連續(xù)發(fā)育軌跡的數(shù)據(jù)集中對(duì)元細(xì)胞的識(shí)別中比SEACell更準(zhǔn)確此外,COEM識(shí)別的元細(xì)胞大大改善了峰到基因的關(guān)聯(lián)分析,并支持CRE預(yù)測(cè)。
注:peak-to-gene 暫時(shí)還是不清楚,關(guān)聯(lián)分析我認(rèn)為可以理解為,之前數(shù)據(jù)整合中會(huì)將峰矩陣轉(zhuǎn)化為基因表達(dá)矩陣后再與scRNA-seq進(jìn)行整合。Method華東五市旅游攻略必玩的景點(diǎn)

1. 多模態(tài)聯(lián)合嵌入Multi-Modal Joint EmbeddingCOEM從同一細(xì)胞中測(cè)量的scRNA-seq和scATAC-seq數(shù)據(jù)中聯(lián)合學(xué)習(xí)低維表征,采用改進(jìn)的多視圖(multi-view)VAE來(lái)提取兩種數(shù)據(jù)模態(tài)的公共潛在空間。
VAEs的生成模型如下:Given a cell, the scRNA gene expression x x∈Pxx\in P_{x}, scATAC chromatin accessibility data
y∈Pyy\in P_{y} , cell type cc , and the common latent representation zz ,華東五市旅游攻略必玩的景點(diǎn) we have the following probability densities,

其中 θ\theta 表示生成模型的參數(shù)xx 和 yy 的似然函數(shù)取決于 共同潛在空間 zz 和細(xì)胞類(lèi)型 cc ,當(dāng)給定 zz 和 cc , xx 和 yy 的分布是獨(dú)立的所以可以得到聯(lián)合生成模型:

對(duì)于具有條件變分近似 q?q_{\phi} 的兩個(gè)模態(tài),我們有以下證據(jù)下界(ELBO, evidence lower bound),

通常使用推斷網(wǎng)絡(luò)inference network(編碼器)來(lái)學(xué)習(xí)變分近似q?q_{\phi},和生成網(wǎng)絡(luò)generative network(解碼器)來(lái)學(xué)習(xí) pθp_{\thet華東五市旅游攻略必玩的景點(diǎn)a}特別地,我們假設(shè) 。
pθ(x|z,c)p_{\theta}(x|z,c) 是零膨脹泊松分布,pθ(y|z,c)p_{\theta}(y|z,c)是負(fù)二項(xiàng)式(NB)分布,pθ(z|c)p_{\theta}(z|c)是高斯混合模型。
給定聯(lián)合嵌入生成式模型,我們采用scMVP(Li et al.,2022)架構(gòu)對(duì)生成網(wǎng)絡(luò)和推理網(wǎng)絡(luò)進(jìn)行建模具體來(lái)說(shuō),對(duì)于scRNA-seq和scATAC-seq輸入,存在一個(gè)基于雙通道注意力的編碼器網(wǎng)絡(luò),然后將它們連接以導(dǎo)出后驗(yàn)分布。
p?(z|x,y,c)p_{\phi}(z|x,y,c)接下來(lái),通過(guò)基于注意力的雙通道解碼器網(wǎng)絡(luò)重建估算的scRNA和scATAC p華東五市旅游攻略必玩的景點(diǎn)rofiles,以計(jì)算似然pθ(x,y|z,c)p_{\theta}(x,y|z,c)。
2. 元細(xì)胞認(rèn)定Metacells IdentificationCOEM是一種基于圖,采用譜聚類(lèi)來(lái)計(jì)算元細(xì)胞的方法更具體地說(shuō),COEM由以下四個(gè)步驟組成: 應(yīng)用跨模態(tài)聯(lián)合嵌入VAE來(lái)學(xué)習(xí)低維公共表征z,如何編碼scRNA-seq和scATAC-seq的公共信息。
基于歐式距離在低維嵌入空間z上構(gòu)建k-近鄰(KNN)圖通過(guò)連通性從KNN圖構(gòu)建相似性矩陣相似性矩陣基于徑向基函數(shù)(radial basis function-RBF)核來(lái)編碼z中的非線性關(guān)系利用譜聚類(lèi)來(lái)識(shí)別簇,并隨后聚合元細(xì)胞,如(Persad,20華東五市旅游攻略必玩的景點(diǎn)22)中所述。
Persad, S., Choo, Z.-N., Dien, C., Masilionis, I., Chalign ? e, R., Nawy, T., Brown, C. C., Pe’er, I., Setty, M., and Pe’er, D. Seacells: Inference of transcriptional and epigenomic cellular states from single-cell genomics data. bioRxiv, 2022.
COEM與SEACells都基于graph,區(qū)別是元細(xì)胞認(rèn)定COEM采用譜聚類(lèi),而SEACells華東五市旅游攻略必玩的景點(diǎn)采用原型分析(archetypal analysis)COEM的譜聚類(lèi)純粹利用圖的連通性信息,運(yùn)行速度更快。
且文章驗(yàn)證了譜聚類(lèi)可以提高元細(xì)胞識(shí)別和運(yùn)行時(shí)間

采用不同的低維嵌入空間,比較原型分析和譜聚類(lèi)的運(yùn)行時(shí)間Experiment & Results正如在SEACells論文中一樣,我們使用致密性、分離度和細(xì)胞類(lèi)型純度作為元細(xì)胞基準(zhǔn)致密性衡量元細(xì)胞內(nèi)細(xì)胞的同質(zhì)程度。
分離評(píng)估元細(xì)胞之間的差異相反,細(xì)胞類(lèi)型純度衡量構(gòu)成元細(xì)胞的細(xì)胞之間細(xì)胞類(lèi)型的一致性我們使用來(lái)自RNA測(cè)定(RNA_PCA)的主成分、或來(lái)自ATAC測(cè)定(ATAC_SVD)的奇異值計(jì)算擴(kuò)散成分,然后量化元細(xì)胞的致密性和分離度。
由于SEA華東五市旅游攻略必玩的景點(diǎn)Cells從一個(gè)模態(tài)識(shí)別元細(xì)胞,我們將它們表示為SeaC-ATAC和SeaC-RNA

我們?cè)u(píng)估了sci-CAR數(shù)據(jù)集中的細(xì)胞類(lèi)型純度,來(lái)自COEM算法的元細(xì)胞比SeaCATAC(0.67)和SeaC-RNA(0.74)具有更高的純度(0.91),這表明利用兩種模式提高了我們定義細(xì)胞狀態(tài)的能力。
(sci-CAR 是有標(biāo)簽的數(shù)據(jù)集)

然后測(cè)量了具有離散細(xì)胞類(lèi)型的數(shù)據(jù)集之間的致密性和分離度通常,基于COEM的方法比表2、3和4至6中所示的SeaC-ATAC和SeaC-RNA更好地分離元細(xì)胞但是它們可能僅基于一種模態(tài)具有更高的緊致度,因?yàn)镃OEM同時(shí)平衡了兩種模態(tài)的細(xì)胞可變性。
SEACells識(shí)別的元細(xì)胞華東五市旅游攻略必玩的景點(diǎn)具有較低的緊致度,因?yàn)樵?xì)胞識(shí)別和緊致度評(píng)估基于來(lái)自單個(gè)模態(tài)的擴(kuò)散成分但這些元細(xì)胞可能不能很好地分離和壓實(shí),因?yàn)樗鼈兊臄U(kuò)散成分來(lái)自于其他模態(tài)因此,使用僅從一種模態(tài)推斷的元細(xì)胞來(lái)分析基因表達(dá)和峰值可及性之間的關(guān)聯(lián)可能會(huì)有偏差。
此外,基于低維嵌入z,譜聚類(lèi)在識(shí)別高細(xì)胞類(lèi)型純度和分離度的元細(xì)胞方面優(yōu)于原型分析我們還測(cè)量了原型分析和譜聚類(lèi)使用相同的低維嵌入z的運(yùn)行時(shí)間,如表1所示我們可以看到,譜聚類(lèi)在四個(gè)數(shù)據(jù)集中的運(yùn)行時(shí)間通常要短一個(gè)數(shù)量級(jí)。
通過(guò)分析染色質(zhì)可及性和基因表達(dá),我們可以推斷開(kāi)染色質(zhì)峰和轉(zhuǎn)錄活性之間的關(guān)系,這有助于COEM在CRE的發(fā)現(xiàn)元細(xì)胞可以作為一種明智的策略,具有高分辨率和足夠的測(cè)序覆華東五市旅游攻略必玩的景點(diǎn)蓋范圍,用于從單細(xì)胞數(shù)據(jù)進(jìn)行基因調(diào)控推斷。
我們通過(guò)計(jì)算每個(gè)峰值在基因+/- 100kb范圍內(nèi)的Pearson相關(guān)性來(lái)評(píng)估跨元細(xì)胞染色質(zhì)可及性和基因表達(dá)的共變異我們觀察到SeaC-ATATC metaccells (CD34+骨髓:25.1%;t細(xì)胞耗盡骨髓:23.0%)(圖1),而在骨髓中發(fā)現(xiàn)一小部分負(fù)性峰值與基因關(guān)聯(lián)(CD34+骨髓:1.3%;t細(xì)胞耗盡骨髓:3.0%),這與單細(xì)胞水平上報(bào)道的負(fù)峰與基因關(guān)聯(lián)比率(1.2 ~ 11%)一致。
這表明分化過(guò)程中“時(shí)間滯后”現(xiàn)象的偏差在SEACells metacells中被夸大,而在COEM中沒(méi)有此外,基于COEM元細(xì)胞,我們可以觀察到更強(qiáng)的核心基華東五市旅游攻略必玩的景點(diǎn)因峰-基因相關(guān)性例如,GATA2基因是造血干細(xì)胞和祖細(xì)胞增殖和維持的主要調(diào)控因子。
來(lái)自CD34+骨髓數(shù)據(jù)集的COEM元細(xì)胞中,GATA2的峰值與基因的相關(guān)性為0.73,而在SeaC-ATAC元細(xì)胞中,其相關(guān)性為0.62(在單細(xì)胞水平上,GATA2峰峰與基因的相關(guān)性為0.1)注:數(shù)據(jù)分析這里不是很明白
個(gè)人觀點(diǎn):這篇文章篇幅很短,用的模型和方法原創(chuàng)性不高,主要是結(jié)合了VAE和譜聚類(lèi),所做的metacells identification,因?yàn)槲覍?duì)metacell的定義和意義暫時(shí)不是很清楚,所以有點(diǎn)迷糊,不知道這樣做的意義和優(yōu)勢(shì)?我之前主要看的是單細(xì)胞數(shù)據(jù)整合的內(nèi)容,最多做到聚類(lèi)這樣的下游任務(wù),來(lái)判華東五市旅游攻略必玩的景點(diǎn)斷方法的性能,還沒(méi)有看到針對(duì)元細(xì)胞聚類(lèi)的文章,感覺(jué)是個(gè)不錯(cuò)的可以結(jié)合的下游任務(wù)(可以用來(lái)豐富文章內(nèi)容)。