追风少年i
知识扩展--华大stereo-seq如何得到合理的分析精度bin
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
追风少年i
社区首页
>
专栏
>
知识扩展--华大stereo-seq如何得到合理的分析精度bin
知识扩展--华大stereo-seq如何得到合理的分析精度bin
原创
追风少年i
关注
发布于 2025-12-09 11:18:42
发布于 2025-12-09 11:18:42
99
0
举报
作者,Evil Genius
明天和意外,真的不知道哪个会先到来。
有时候也会陷入自我怀疑,既然过的如此辛苦,还遭受各种折磨,那么来这个世界上走一遭的意义是什么?是降薪裁员,还是劳动仲裁?
今天我们来更新一个内容,那就是华大stereo-seq分析如何获取合理的分析精度bin。
华大是一个非常好的单位,大家有机会一定要加入,要珍惜。虽然它不完美,但是国产品牌真的不容易,如果能出一份力,也是非常棒的决定。
空间平台能与Xenium、Visium、HD等一较高下的,国产只有Stereo-seq,且目前还处于劣势。
当然了,华大目前有细胞分割的做法,但是也存在缺陷,主要如下。
亚细胞分辨率:Stereo-seq像素尺寸为500nm,远小于细胞大小(~10-20μm),但RNA扩散会导致信号跨细胞边界。
无直接细胞边界信息:标准Stereo-seq只有基因表达和DAPI核染色,缺乏细胞膜标记。
组织异质性:不同组织类型的细胞大小、密度、形态差异大。
分割策略分类
基于核染色分割(最常用)
基于基因表达分割
结合核染与表达的混合方法(这是目前最前沿的做法,针对华大数据)
深度学习/计算机视觉方法
华大空间数据细胞分割的文章并不多,而且没有单独用细胞分割的,所以大多数情况,还是需要寻找合理的bin值。
理解Bin Size的含义
Bin(像素合并):将原始高分辨率的像素(如500nm)合并成更大的分析单元,以增加每个空间单元内的分子数(UMI/基因数),提高信噪比,便于下游分析。
权衡:
小bin size(如1x1、2x2像素):分辨率高,能捕获细胞亚结构,但分子数少、数据稀疏、噪声大。
大bin size(如16x16、32x32像素):分子数多、信噪比高,但空间细节模糊,可能掩盖细胞异质性。
选择Bin Size的参考标准
a. 根据生物学问题
亚细胞结构/细胞边界研究:
使用小bin(如1x1或2x2像素,即0.5-1 μm)。适合研究细胞内基因分布(如极性基因)。
细胞类型聚类/空间域识别:
使用中等bin(如8x8至16x16像素,即4-8 μm),确保每个bin内约有5-20个细胞,以获得足够的转录本进行聚类。
组织区域划分(如脑区、肿瘤区域):
使用较大bin(如32x32至64x64像素,即16-32 μm),关注宏观区域差异。
b. 根据数据质量
高RNA捕获率/高密度组织:
可使用更小的bin,因为分子数足够。
低RNA捕获率/稀疏数据:
需增大bin以提高信噪比(如从8x8调整为16x16)。
c. 验证标准:每个Bin的分子数
关键指标:
每个bin的平均UMI数应 > 100(理想情况 > 500),基因数 > 50(可通过试调整bin size后计算 summary(bin_matrix) 检查)。
我们来看看文献的做法
第一篇
看看bin和指标,bin100,基因数大于500。
第二篇
看看bin和指标,bin50,基因数未知。
第三篇
看看bin和指标,bin50,基因数大于500。
第四篇
看看bin和指标,bin50,基因数大于500。
第五篇
看看bin和指标,bin50,基因数未知。
第六篇
看看bin和指标,bin50,基因数大于20。
第七篇
看看bin和指标,bin100,基因数大于200。
第八篇
看看bin和指标,bin80,基因数大于500。
第九篇
看看bin和指标,bin50,RCTD保留有效细胞。
第十篇
看看bin和指标,bin80,RCTD保留有效细胞。
那么选择该怎么进行呢?
其实看文章,主要两个策略,1、基因数足够;2、有效spot足够多,大致就是bin50、bin80,基因数一般大于500(UMI),或者RCTD的联合保留有效spot。
生活很好,有你更好
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
数据分析
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
数据分析
#单细胞
#空间
#华大
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
作者,Evil Genius
明天和意外,真的不知道哪个会先到来。
有时候也会陷入自我怀疑,既然过的如此辛苦,还遭受各种折磨,那么来这个世界上走一遭的意义是什么?是降薪裁员,还是劳动仲裁?
今天我们来更新一个内容,那就是华大stereo-seq分析如何获取合理的分析精度bin。
华大是一个非常好的单位,大家有机会一定要加入,要珍惜。虽然它不完美,但是国产品牌真的不容易,如果能出一份力,也是非常棒的决定。
空间平台能与Xenium、Visium、HD等一较高下的,国产只有Stereo-seq,且目前还处于劣势。
当然了,华大目前有细胞分割的做法,但是也存在缺陷,主要如下。
亚细胞分辨率:Stereo-seq像素尺寸为500nm,远小于细胞大小(~10-20μm),但RNA扩散会导致信号跨细胞边界。
无直接细胞边界信息:标准Stereo-seq只有基因表达和DAPI核染色,缺乏细胞膜标记。
组织异质性:不同组织类型的细胞大小、密度、形态差异大。
分割策略分类
基于核染色分割(最常用)
基于基因表达分割
结合核染与表达的混合方法(这是目前最前沿的做法,针对华大数据)
深度学习/计算机视觉方法
华大空间数据细胞分割的文章并不多,而且没有单独用细胞分割的,所以大多数情况,还是需要寻找合理的bin值。
理解Bin Size的含义
Bin(像素合并):将原始高分辨率的像素(如500nm)合并成更大的分析单元,以增加每个空间单元内的分子数(UMI/基因数),提高信噪比,便于下游分析。
权衡:
小bin size(如1x1、2x2像素):分辨率高,能捕获细胞亚结构,但分子数少、数据稀疏、噪声大。
大bin size(如16x16、32x32像素):分子数多、信噪比高,但空间细节模糊,可能掩盖细胞异质性。
选择Bin Size的参考标准
a. 根据生物学问题
亚细胞结构/细胞边界研究:
使用小bin(如1x1或2x2像素,即0.5-1 μm)。适合研究细胞内基因分布(如极性基因)。
细胞类型聚类/空间域识别:
使用中等bin(如8x8至16x16像素,即4-8 μm),确保每个bin内约有5-20个细胞,以获得足够的转录本进行聚类。
组织区域划分(如脑区、肿瘤区域):
使用较大bin(如32x32至64x64像素,即16-32 μm),关注宏观区域差异。
b. 根据数据质量
高RNA捕获率/高密度组织:
可使用更小的bin,因为分子数足够。
低RNA捕获率/稀疏数据:
需增大bin以提高信噪比(如从8x8调整为16x16)。
c. 验证标准:每个Bin的分子数
关键指标:
每个bin的平均UMI数应 > 100(理想情况 > 500),基因数 > 50(可通过试调整bin size后计算 summary(bin_matrix) 检查)。
我们来看看文献的做法
第一篇
看看bin和指标,bin100,基因数大于500。
第二篇
看看bin和指标,bin50,基因数未知。
第三篇
看看bin和指标,bin50,基因数大于500。
第四篇
看看bin和指标,bin50,基因数大于500。
第五篇
看看bin和指标,bin50,基因数未知。
第六篇
看看bin和指标,bin50,基因数大于20。
第七篇
看看bin和指标,bin100,基因数大于200。
第八篇
看看bin和指标,bin80,基因数大于500。
第九篇
看看bin和指标,bin50,RCTD保留有效细胞。
第十篇
看看bin和指标,bin80,RCTD保留有效细胞。
那么选择该怎么进行呢?
其实看文章,主要两个策略,1、基因数足够;2、有效spot足够多,大致就是bin50、bin80,基因数一般大于500(UMI),或者RCTD的联合保留有效spot。
生活很好,有你更好
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐