首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >知识扩展--华大stereo-seq如何得到合理的分析精度bin

知识扩展--华大stereo-seq如何得到合理的分析精度bin

原创
作者头像
追风少年i
发布2025-12-09 11:18:42
发布2025-12-09 11:18:42
990
举报

作者,Evil Genius

明天和意外,真的不知道哪个会先到来。

有时候也会陷入自我怀疑,既然过的如此辛苦,还遭受各种折磨,那么来这个世界上走一遭的意义是什么?是降薪裁员,还是劳动仲裁?

今天我们来更新一个内容,那就是华大stereo-seq分析如何获取合理的分析精度bin。

华大是一个非常好的单位,大家有机会一定要加入,要珍惜。虽然它不完美,但是国产品牌真的不容易,如果能出一份力,也是非常棒的决定。

空间平台能与Xenium、Visium、HD等一较高下的,国产只有Stereo-seq,且目前还处于劣势。

当然了,华大目前有细胞分割的做法,但是也存在缺陷,主要如下。

亚细胞分辨率:Stereo-seq像素尺寸为500nm,远小于细胞大小(~10-20μm),但RNA扩散会导致信号跨细胞边界。

无直接细胞边界信息:标准Stereo-seq只有基因表达和DAPI核染色,缺乏细胞膜标记。

组织异质性:不同组织类型的细胞大小、密度、形态差异大。

分割策略分类

基于核染色分割(最常用)

基于基因表达分割

结合核染与表达的混合方法(这是目前最前沿的做法,针对华大数据)

深度学习/计算机视觉方法

华大空间数据细胞分割的文章并不多,而且没有单独用细胞分割的,所以大多数情况,还是需要寻找合理的bin值。

理解Bin Size的含义

Bin(像素合并):将原始高分辨率的像素(如500nm)合并成更大的分析单元,以增加每个空间单元内的分子数(UMI/基因数),提高信噪比,便于下游分析。

权衡:

小bin size(如1x1、2x2像素):分辨率高,能捕获细胞亚结构,但分子数少、数据稀疏、噪声大。

大bin size(如16x16、32x32像素):分子数多、信噪比高,但空间细节模糊,可能掩盖细胞异质性。

选择Bin Size的参考标准

a. 根据生物学问题

亚细胞结构/细胞边界研究:

使用小bin(如1x1或2x2像素,即0.5-1 μm)。适合研究细胞内基因分布(如极性基因)。

细胞类型聚类/空间域识别:

使用中等bin(如8x8至16x16像素,即4-8 μm),确保每个bin内约有5-20个细胞,以获得足够的转录本进行聚类。

组织区域划分(如脑区、肿瘤区域):

使用较大bin(如32x32至64x64像素,即16-32 μm),关注宏观区域差异。

b. 根据数据质量

高RNA捕获率/高密度组织:

可使用更小的bin,因为分子数足够。

低RNA捕获率/稀疏数据:

需增大bin以提高信噪比(如从8x8调整为16x16)。

c. 验证标准:每个Bin的分子数

关键指标:

每个bin的平均UMI数应 > 100(理想情况 > 500),基因数 > 50(可通过试调整bin size后计算 summary(bin_matrix) 检查)。

我们来看看文献的做法

第一篇

看看bin和指标,bin100,基因数大于500。

第二篇

看看bin和指标,bin50,基因数未知。

第三篇

看看bin和指标,bin50,基因数大于500。

第四篇

看看bin和指标,bin50,基因数大于500。

第五篇

看看bin和指标,bin50,基因数未知。

第六篇

看看bin和指标,bin50,基因数大于20。

第七篇

看看bin和指标,bin100,基因数大于200。

第八篇

看看bin和指标,bin80,基因数大于500。

第九篇

看看bin和指标,bin50,RCTD保留有效细胞。

第十篇

看看bin和指标,bin80,RCTD保留有效细胞。

那么选择该怎么进行呢?

其实看文章,主要两个策略,1、基因数足够;2、有效spot足够多,大致就是bin50、bin80,基因数一般大于500(UMI),或者RCTD的联合保留有效spot。

生活很好,有你更好

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 作者,Evil Genius
  • 明天和意外,真的不知道哪个会先到来。
  • 有时候也会陷入自我怀疑,既然过的如此辛苦,还遭受各种折磨,那么来这个世界上走一遭的意义是什么?是降薪裁员,还是劳动仲裁?
  • 今天我们来更新一个内容,那就是华大stereo-seq分析如何获取合理的分析精度bin。
  • 华大是一个非常好的单位,大家有机会一定要加入,要珍惜。虽然它不完美,但是国产品牌真的不容易,如果能出一份力,也是非常棒的决定。
  • 空间平台能与Xenium、Visium、HD等一较高下的,国产只有Stereo-seq,且目前还处于劣势。
  • 当然了,华大目前有细胞分割的做法,但是也存在缺陷,主要如下。
  • 亚细胞分辨率:Stereo-seq像素尺寸为500nm,远小于细胞大小(~10-20μm),但RNA扩散会导致信号跨细胞边界。
  • 无直接细胞边界信息:标准Stereo-seq只有基因表达和DAPI核染色,缺乏细胞膜标记。
  • 组织异质性:不同组织类型的细胞大小、密度、形态差异大。
  • 分割策略分类
  • 基于核染色分割(最常用)
  • 基于基因表达分割
  • 结合核染与表达的混合方法(这是目前最前沿的做法,针对华大数据)
  • 深度学习/计算机视觉方法
  • 华大空间数据细胞分割的文章并不多,而且没有单独用细胞分割的,所以大多数情况,还是需要寻找合理的bin值。
  • 理解Bin Size的含义
  • Bin(像素合并):将原始高分辨率的像素(如500nm)合并成更大的分析单元,以增加每个空间单元内的分子数(UMI/基因数),提高信噪比,便于下游分析。
  • 权衡:
  • 小bin size(如1x1、2x2像素):分辨率高,能捕获细胞亚结构,但分子数少、数据稀疏、噪声大。
  • 大bin size(如16x16、32x32像素):分子数多、信噪比高,但空间细节模糊,可能掩盖细胞异质性。
  • 选择Bin Size的参考标准
  • a. 根据生物学问题
  • 亚细胞结构/细胞边界研究:
  • 使用小bin(如1x1或2x2像素,即0.5-1 μm)。适合研究细胞内基因分布(如极性基因)。
  • 细胞类型聚类/空间域识别:
  • 使用中等bin(如8x8至16x16像素,即4-8 μm),确保每个bin内约有5-20个细胞,以获得足够的转录本进行聚类。
  • 组织区域划分(如脑区、肿瘤区域):
  • 使用较大bin(如32x32至64x64像素,即16-32 μm),关注宏观区域差异。
  • b. 根据数据质量
  • 高RNA捕获率/高密度组织:
  • 可使用更小的bin,因为分子数足够。
  • 低RNA捕获率/稀疏数据:
  • 需增大bin以提高信噪比(如从8x8调整为16x16)。
  • c. 验证标准:每个Bin的分子数
  • 关键指标:
  • 每个bin的平均UMI数应 > 100(理想情况 > 500),基因数 > 50(可通过试调整bin size后计算 summary(bin_matrix) 检查)。
  • 我们来看看文献的做法
  • 第一篇
  • 看看bin和指标,bin100,基因数大于500。
  • 第二篇
  • 看看bin和指标,bin50,基因数未知。
  • 第三篇
  • 看看bin和指标,bin50,基因数大于500。
  • 第四篇
  • 看看bin和指标,bin50,基因数大于500。
  • 第五篇
  • 看看bin和指标,bin50,基因数未知。
  • 第六篇
  • 看看bin和指标,bin50,基因数大于20。
  • 第七篇
  • 看看bin和指标,bin100,基因数大于200。
  • 第八篇
  • 看看bin和指标,bin80,基因数大于500。
  • 第九篇
  • 看看bin和指标,bin50,RCTD保留有效细胞。
  • 第十篇
  • 看看bin和指标,bin80,RCTD保留有效细胞。
  • 那么选择该怎么进行呢?
  • 其实看文章,主要两个策略,1、基因数足够;2、有效spot足够多,大致就是bin50、bin80,基因数一般大于500(UMI),或者RCTD的联合保留有效spot。
  • 生活很好,有你更好
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档