Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据源集市建设的初步思路和规划

数据源集市建设的初步思路和规划

作者头像
jeanron100
发布于 2021-01-28 02:55:49
发布于 2021-01-28 02:55:49
3740
举报

最近在对接数据流转的一些问题,发现越是了解,越是担心,因为有不少潜在的问题,所以我就在想规划和统一所谓的数据源集市,能够实现数据流转方向的一个基线标准。

目前发现的问题: 1.数据出口通道繁杂,管理混乱 2.MySQL流转服务单点难以扩展 3.任务状态不清晰,缺乏统一管理 4.数据交付质量难以保证,反馈不及时 5.近实时数据同步需求难以满足

对此提出的改进方案有: 1.数据出口通道统一交付 2.构建数据源集市服务组,水平扩展压力 3.任务配置平台化,任务日志指标可视化 4.数据交付提供交付标准和数据质量日志 5.提供近实时方案作为备选,预知问题

整个数据源集市在数据流转体系中的角色和位置如下:

当日这里是刻意把数据源集市的一些组件和服务列举出来,能够尽可能在这个层面实现数据质量的标准和度量,简而言之,数据如果不合理,我应该及时预警,不能将错就错的提供给中下游,数据源集市需要做好这一层的保障。

在数据流转方向上,我把数据表分为状态表,流水表和配置表,他们在流转体系中的定位和标准也大有不同。

当然这仅仅是数据流转体系内的冰山一角,而如果要把数据的认知和数据源要整合起来,形成统一的认知,这个工作量是极为巨大的。

我感觉对于数据的认知,一旦抛出这个话题,就好像打开了一扇窗,经过了更大范围的讨论,我感觉我本来想要的是一口井,没想到现在需要引一条河流,而且还要再河流上再搭一座桥,真让人头大。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记
  • Github:@jeanron100
  • CSDN:@jeanron100
  • 知乎:@jeanron100
  • 头条号:@杨建荣的学习笔记
  • 网易号:@杨建荣的数据库笔记
  • 大鱼号:@杨建荣的数据库笔记
  • 腾讯云+社区:@杨建荣的学习笔记
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 杨建荣的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
告别逐一标注,一个提示实现批量图片分割,高效又准确
Segment Anything Model (SAM) 的提出在图像分割领域引起了巨大的关注,其卓越的泛化性能引发了广泛的兴趣。然而,尽管如此,SAM 仍然面临一个无法回避的问题:为了使 SAM 能够准确地分割出目标物体的位置,每张图片都需要手动提供一个独特的视觉提示。如下图所示,即使点击的是同一物体(图 (b)-(d)),微小位置变化都会导致分割结果的显著差异。这是因为视觉提示缺乏语义信息,即使提示在想要分割的目标物体上,仍然可能引发歧义。框提示和涂鸦提示(图 (e)(f))虽然提供了更具体的位置信息,但由于机器和人类对目标分割物的理解存在偏差,效果常常与期望有所出入。
机器之心
2024/01/11
5790
告别逐一标注,一个提示实现批量图片分割,高效又准确
FS-MedSAM2 探索 SAM2 在少样本图像分割中的潜力,无需微调 !
段 anything 模型2(SAM2) [13] 在自然图像和视频中展示了令人印象深刻的零样本提示分割能力。使用一个简单的点或矩形作为提示,SAM2可以准确地分割图像中的前景目标,并在视频中跟踪目标。然而,与它的前驱者一样,SAM2在医学图像方面存在局限性,尤其是在计算机断层扫描(CT)和磁共振成像(MRI)扫描中。这一限制源于其训练数据中缺乏医学图像,导致模型无法精确界定医学图像中器官、肿瘤和其他结构的边界,通常导致过度分割。
未来先知
2024/10/14
7170
FS-MedSAM2 探索 SAM2 在少样本图像分割中的潜力,无需微调 !
AI分割一切!智源提出通用分割模型SegGPT,「一通百通」的那种
允中 发自 凹非寺 量子位 | 公众号 QbitAI 视觉领域的GPT-3时刻,真的要来了? Meta分割一切的SAM(SegmentAnything Model)刚炸完场,几乎同时,国内的智源研究院视觉团队也提出了通用分割模型SegGPT—— Segment Everything in Context,首个利用视觉上下文完成各种分割任务的通用视觉模型。 就像这样,在一张画面中标注出彩虹,就能批量分割其他画面中的彩虹。 和 SAM 相比,视觉模型的 In-context 能力是最大差异点 : SegGPT
量子位
2023/04/10
4790
AI分割一切!智源提出通用分割模型SegGPT,「一通百通」的那种
视频到图像 ,SAM 2 优化 3D 图像标注流程 !
医学影像分割是医学影像的重要组成部分,涉及使用各种影像模式(如计算机断层扫描(CT)、磁共振成像(MRI)、正电子发射计算机断层扫描(PET)、超声[5]和X射线)准确界定解剖结构和病理区域。精确分割对提高诊断准确性、优化治疗计划,以及最终改善患者预后至关重要[9, 10]。当前的深度学习方法在自动化分割过程中表现出色[7, 12, 18]。然而,训练这些自动模型仍然严重依赖手动专家标注,这既昂贵又耗时。为了加快标注过程,一种策略是利用已训练好的模型辅助标注[16, 22]。
未来先知
2024/09/11
2750
视频到图像 ,SAM 2 优化 3D 图像标注流程 !
通用视觉GPT时刻来临?智源推出通用分割模型SegGPT
机器之心专栏 机器之心编辑部 ChatGPT 引发了语言大模型狂潮,AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来? 前两天,机器之心介绍了 Meta 最新研究成果 Segment Anything Model (SAM)。该研究引起了AI社区广泛讨论。 而据我们所知,几乎同一时间,智源研究院视觉团队也推出通用分割模型 SegGPT(Segment Everything In Context)—— 利用视觉提示(prompt)完成任意分割任务的通用视觉模型。 论文地址:https://a
机器之心
2023/04/11
7840
通用视觉GPT时刻来临?智源推出通用分割模型SegGPT
分割一切模型SAM首篇全面综述:28页、200+篇参考文献
机器之心报道 机器之心编辑部 作为首个全面介绍基于 SAM 基础模型进展的研究,本文聚焦于 SAM 在各种任务和数据类型上的应用,并讨论了其历史发展、近期进展,以及对广泛应用的深远影响。 人工智能(AI)正在向 AGI 方向发展,这是指人工智能系统能够执行广泛的任务,并可以表现出类似于人类的智能水平,狭义上的 AI 就与之形成了对比,因为专业化的 AI 旨在高效执行特定任务。可见,设计通用的基础模型迫在眉睫。基础模型在广泛的数据上训练,因而能够适应各种下游任务。最近 Meta 提出的分割一切模型(Segm
机器之心
2023/05/22
5710
分割一切模型SAM首篇全面综述:28页、200+篇参考文献
AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向
AAAI 2024 (AAAI Conference on Artificial Intelligence) 人工智能国际会议于近日公布论文录用结果,本届会议共收到9862篇份论文投稿,最终录用2342篇论文,录用率23.75%。
小腾资讯君
2024/01/17
1.8K0
计算视觉 | Nat.Methods | 一个用于跨九种模态的生物医学对象联合分割、检测和识别的基础模型
错误!!! - 待补充 [ul]- In each iteration i, we aggregate a batch from K mini-batches ({b}{1}^{i},\cdots ,,{b}{K}^{i}). For each mini-batch ({b}{k}^{i}), we randomly select dataset ({{\mathcal{D}}}{m}) for m = 1, ⋯, M with probability pm and sample the mini-batch without replacement. - Concatenate all mini-batches ({B}^{i}=[{b}{1}^{i},\cdots ,,{b}{K}^{i}]). - Perform training step with batch Bi.
生信菜鸟团
2025/02/06
1170
计算视觉 | Nat.Methods | 一个用于跨九种模态的生物医学对象联合分割、检测和识别的基础模型
超越UNet:TP-UNet引入时间Prompt实现高级医学图像分割 !
医学图像分割在现代医学领域占有重要地位,在疾病诊断、手术计划和治疗监测等方面发挥基础作用 [1]。该任务的主要目标是准确地分离和 Token 医学图像中呈现的特定结构或组织,以便医疗专业行人能够进行细致分析并实现精确诊断。值得注意的是,随着深度学习技术的进步,一些基于UNet及其变体的网络已经展示了通过提取医学图像中的语义信息来实现令人称赞的分割准确性 [2]。
未来先知
2024/12/19
3150
超越UNet:TP-UNet引入时间Prompt实现高级医学图像分割 !
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
---- 新智元报道   编辑:编辑部 【新智元导读】今天,Meta发布史上首个图像分割基础模型SAM,将NLP领域的prompt范式引进CV,让模型可以通过prompt一键抠图。网友直呼:CV不存在了! 就在刚刚,Meta AI发布了Segment Anything Model(SAM)——第一个图像分割基础模型。 SAM能从照片或视频中对任意对象实现一键分割,并且能够零样本迁移到其他任务。 整体而言,SAM遵循了基础模型的思路: 1. 一种非常简单但可扩展的架构,可以处理多模态提示:文本、关键点
新智元
2023/04/06
9180
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
2020入坑图像分割,我该从哪儿入手?
顾名思义,图像分割就是指将图像分割成多个部分。在这个过程中,图像的每个像素点都和目标的种类相关联。图像分割方法主要可分为两种类型:语义分割和实例分割。语义分割会使用相同的类标签标注同一类目标(下图左),而在实例分割中,相似的目标也会使用不同标签进行标注(下图右)。
机器之心
2020/06/02
6040
比Meta「分割一切AI」更全能!港科大版图像分割AI来了:实现更强粒度和语义功能
模型名为Semantic-SAM,顾名思义,在完全复现SAM分割效果的基础上,这个AI还具有两大特点:
量子位
2023/08/05
3900
比Meta「分割一切AI」更全能!港科大版图像分割AI来了:实现更强粒度和语义功能
计算机视觉领域的基础模型
在计算摄影学的研究和应用中,计算机视觉(Computer Vision)技术扮演了至关重要的角色。计算机视觉不仅帮助我们理解和处理图像和视频数据,还为我们提供了丰富的工具和方法,以提升摄影和图像处理的效果。为了帮助大家更好地理解和应用这些技术,我准备也在星球中介绍更多关于计算机视觉的内容,首先我会引用一些文章,来介绍“计算机视觉领域的基础模型”。
HawkWang
2024/06/26
7890
计算机视觉领域的基础模型
每周AI论文速递(240805-240809)
Medical SAM 2: 利用 Segment Anything Model 2 实现医学图像的视频化分割
叶子的技术碎碎念
2025/04/08
840
每周AI论文速递(240805-240809)
LLM入门4 | Segment Anything | MetaAI
我们在 Meta AI Research 和 FAIR 的团队开发了一个称为 SAM 的分割基础模型,其中包括一个可提示的分割任务、一个分割模型和一个数据引擎。 我们的数据集拥有超过 10 亿个masks和 1100 万张图像。
机器学习炼丹术
2023/09/02
6670
LLM入门4 | Segment Anything | MetaAI
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
医学图像分割的目标是从医学图像(如器官和病变)中识别特定的解剖结构,这是为提供可靠的体积和形状信息并协助许多临床应用(如疾病诊断和定量分析)提供基础和重要的一步。尽管基于深度学习的方法在医学图像分割任务上表现出色,但大多数这些方法都需要相对大量的优质标注数据进行训练,而获取大规模的仔细 Token 数据集是不切实际的,尤其是在医学成像领域,只有专家能够提供可靠和准确的分割标注。此外,常用的医学成像模式如CT和MRI是3D体积图像,这进一步增加了手动标注的工作量,与2D图像相比,专家需要逐层从体积切片进行分割。
集智书童公众号
2024/01/03
1.9K0
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
机器之心报道 机器之心编辑部 CV 研究者接下来的路要怎么走? 「这下 CV 是真不存在了。< 快跑 >」这是知乎网友对于一篇 Meta 新论文的评价。 如标题所述,这篇论文只做了一件事情:(零样本)分割一切。类似 GPT-4 已经做到的「回答一切」。 Meta 表示,这是第一个致力于图像分割的基础模型。自此,CV 也走上了「做一个统一某个(某些?全部?)任务的全能模型」的道路。 在此之前,分割作为计算机视觉的核心任务,已经得到广泛应用。但是,为特定任务创建准确的分割模型通常需要技术专家进行高度专业化
机器之心
2023/04/06
3420
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
视频分割是自动驾驶、机器人技术、视频编辑等应用场景的基础技术,但目前的方法在零样本学习设置下,或是预测未见过的样本时,会出现性能不一致等问题。
新智元
2023/08/07
5260
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
SAM-Med3D:三维医学图像上的通用分割模型,医疗版三维 SAM 开源了!
医学图像和自然图像之间存在显著的差异,而且医学图像领域缺乏大规模的基准数据集,这是导致AI在医学领域进展缓慢的重要原因之一。通过构建大规模的基准数据集和可靠的基线模型,我们可以推动AI在医疗领域的快速发展,并加速医疗向更通用方向转变的进程。如果您对此话题感兴趣,欢迎加入群聊与我们一起探讨!(二维码见文末) 论文:https://arxiv.org/abs/2310.15161 开源代码:https://github.com/uni-medical/sam-med3d
医学处理分析专家
2023/12/19
1.5K0
SAM-Med3D:三维医学图像上的通用分割模型,医疗版三维 SAM 开源了!
超越SOTA:PP-SAM 在有限数据集上的图像分割突破,简化采样 SA M 过程,仅需最小的标注!
基于深度学习算法在结肠镜检查过程中检测癌前病变已显示出巨大潜力。近期,一种基础模型,即Segment Anything Model(SAM),被引入用于通用语义分割。一些研究探索了其在息肉分割中的零样本推理或微调[17, 9]潜力。
AIGC 先锋科技
2024/07/08
2810
超越SOTA:PP-SAM 在有限数据集上的图像分割突破,简化采样 SA M 过程,仅需最小的标注!
推荐阅读
告别逐一标注,一个提示实现批量图片分割,高效又准确
5790
FS-MedSAM2 探索 SAM2 在少样本图像分割中的潜力,无需微调 !
7170
AI分割一切!智源提出通用分割模型SegGPT,「一通百通」的那种
4790
视频到图像 ,SAM 2 优化 3D 图像标注流程 !
2750
通用视觉GPT时刻来临?智源推出通用分割模型SegGPT
7840
分割一切模型SAM首篇全面综述:28页、200+篇参考文献
5710
AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向
1.8K0
计算视觉 | Nat.Methods | 一个用于跨九种模态的生物医学对象联合分割、检测和识别的基础模型
1170
超越UNet:TP-UNet引入时间Prompt实现高级医学图像分割 !
3150
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
9180
2020入坑图像分割,我该从哪儿入手?
6040
比Meta「分割一切AI」更全能!港科大版图像分割AI来了:实现更强粒度和语义功能
3900
计算机视觉领域的基础模型
7890
每周AI论文速递(240805-240809)
840
LLM入门4 | Segment Anything | MetaAI
6670
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
1.9K0
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
3420
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
5260
SAM-Med3D:三维医学图像上的通用分割模型,医疗版三维 SAM 开源了!
1.5K0
超越SOTA:PP-SAM 在有限数据集上的图像分割突破,简化采样 SA M 过程,仅需最小的标注!
2810
相关推荐
告别逐一标注,一个提示实现批量图片分割,高效又准确
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档