腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
结构化
和非
结构化
数据与大规模
数据处理
引擎的集成
、
、
、
、
像Spark、apache这样的
数据处理
引擎是如何将
结构化
、半
结构化
和非
结构化
数据集成在一起并影响计算的?
浏览 2
提问于2015-04-12
得票数 0
回答已采纳
1
回答
结构化
流可以控制数据到达的速度吗?
例如,我有一个100MB的文件,我使用
结构化
流来处理它。我希望每次读取10MB,然后输出结果,再次读取10MB,然后处理它。但
结构化
流似乎直接读取100MB到处理中,并等待新
数据处理
。
浏览 11
提问于2019-11-30
得票数 0
回答已采纳
1
回答
Spark与Hive的区别
、
、
你能帮我理解星火SQl和蜂巢的区别吗?
浏览 2
提问于2017-06-04
得票数 1
1
回答
为什么星火中的RDD、Dataframe和Dataset被称为Api?
、
、
我开始阅读书名为“火花权威指南-大
数据处理
变得简单”来学习火花。在我阅读的时候,我看到一句话:"A DataFrame是最常见的
结构化
API,它只是表示带有行和列的数据表。
浏览 5
提问于2021-09-08
得票数 1
2
回答
处理数据仓库中的大数据
、
、
、
基于我的理解,大数据是处理非
结构化
数据和高volume.When的关键,我们研究了数据仓库( datawarehouse,DW )的大数据体系结构,从源数据通过Hadoop (HDFS和Mapreduce)提取数据,并将相关的非
结构化
信息转换为有效的业务信息,最后通过ETL处理(以及现有的
结构化
数据处理
)将数据注入DW或DataMart。
浏览 3
提问于2015-04-28
得票数 5
回答已采纳
1
回答
在AWS S3上进行
数据处理
,然后对SageMaker进行建模。
、
、
、
、
它是
结构化
的常规数据(不是图像、视频或音频)。prototype的历史还没有确定,但是如果是3个月,那么prototype将是90天x50gb=4500 gb,或者是(9000 gb,6个月)。我想做
数据处理
,推导出一些新的变量,EDA接着建模(特征工程&实现无监督的深度学习算法)。有人能给我推荐最好的方法吗?例如,使用save笔记本,在那里编写
数据处理
python脚本,将处理过的数据保存到S3文件夹,然后应用算法?或者使用EMR进行
数据处理
,然后使用SageMaker进行EDA+Modeling。
浏览 9
提问于2022-02-09
得票数 0
1
回答
使用hadoop和相关技术对大量不同格式的文档进行索引和搜索
、
、
在我们的组织中,我们试图围绕大数据、、Hadoop、和相关的生态系统开发一些能力。如果是,那么它是hadoop用例吗?如果是这样的话,我们应该追求什么技术呢?但我们不确定我们是否做对了,如何使它成为适当的大数据Hadoop用例,以及如何在技术堆栈上做出决定,无论是Hadoop还是no SQL db,还是SOLR等等。 我们的目标
浏览 1
提问于2014-08-07
得票数 0
1
回答
为我们自己的API优化数据结构
、
我正处于编写栈交换网络的Emacs主要模式的早期阶段;如果您经常使用Emacs,这将最终使您受益。显然,这将是一份清单。然而,与任何数据结构一样,选择必须取决于存储了什么数据以及如何访问数据。什么,我希望能够将所有这些信息存储在一个单一的符号中,比如stack-api/cache。因此,stack-api/cache是一个由上一次更新确定的目录: `(<
浏览 0
提问于2013-03-05
得票数 10
1
回答
Google搜索控制台报告:“在您的站点上没有发现
结构化
数据”,即使
结构化
数据测试工具找到了它。
、
根据我的知识,我已经把所有必需的
结构化
数据都放进去了,并且还用Google网站管理员的
结构化
数据测试工具测试了它,它可以很好地检测所有的东西,并且所有的要求都满足了。但当我回到网站管理员工具中:搜索外观>
结构化
数据时,它说 我们不会在您的网站上检测到任何
结构化
数据。
结构化
数据帮助Google理解站点上的内容,这些内容可以用来显示搜索结果中丰富的片段。我用
结构化
数据测试工具检查了我的站点,没有错误。
浏览 0
提问于2017-03-03
得票数 3
1
回答
能实现什么?
、
、
Mapreduce是一种聚合数据的方法 使用Java、Python等。
浏览 3
提问于2015-11-12
得票数 0
回答已采纳
1
回答
大容量交易数据信息模式生成
、
、
我试图获得更多关于使用Hadoop等分布式
数据处理
的信息。我刚刚开始阅读Hadoop,据我最初的理解,Hadoop非常适合非
结构化
数据处理
,对于关系
数据处理
可能用处不大。
浏览 1
提问于2012-10-25
得票数 1
回答已采纳
1
回答
Python解析
结构化
文本文件
、
我想在python中解析格式的
结构化
文本文件:field1 = xxx, xxx文本文件可能包含具有不同字段数的其他标头。不幸的是,我不知道这属于哪个编程/
数据处理
分支,也不知道如何使用正确的关键字来为自己确定解决方案。我沮丧地在这里张贴了一个问题。或者,如果有另一个模块可以解释这种类型的
结构化
文本文件,请声明它并提供一个示例。 这类问题属于程序设计或
数据处理
的哪个分支?如果您有一些数据,则定义模板或自动定义模板,然后将其
浏览 3
提问于2014-07-19
得票数 1
回答已采纳
1
回答
如何克服Snowflake (16,777,216)加载图像数据的限制
、
、
、
、
我们有一个从SQL Server加载Image列的场景,这是我们的源,并加载到Snowflake中,但由于"String Long Issue“而失败,因为Snowflake具有Varchar限制。 到目前为止,我们已经尝试了Varchar和Variant数据类型来加载这个Image数据类型,但由于它的巨大尺寸,它也无法加载Variant数据类型(Snowflake试图将其读取为JSON,这就是为什么我们也尝试了variant )。 在snowflake中,有什么方法可以克服这种数据类型长度的限制?
浏览 14
提问于2021-10-28
得票数 0
回答已采纳
1
回答
从Spark (
结构化
)流应用程序中计算
数据处理
速率
、
、
、
、
我编写了两个用于流数据的Apache管道(一个使用
结构化
流,另一个使用流)。管道从套接字连接接收流数据。这两种流方法(一种是快速的,另一种是稍慢的)对于流和
结构化
的流管道都有非常不同的结果。延迟的逐行流(1)允许管道完全处理所有信息,而转储(2)只导致处理一小部分数据点(大部分数据完全丢失)。我的问题是:如何找到Apache
结构化
流/Apache流管道设置的最大
数据处理
速率?
浏览 0
提问于2018-04-27
得票数 3
2
回答
设置Hadoop集群大概需要多少半
结构化
数据?
、
我知道,Hadoop不仅仅是半
结构化
数据处理
的替代方案--我可以用普通的制表符分隔的数据和一堆unix工具(cut、grep、sed等)做很多事情。和手写的python脚本。
浏览 1
提问于2011-01-11
得票数 1
3
回答
从json子字段获取URL字段的regex
、
、
、
、
我有以下文件: {"domain": "netflix.com", "approved_at_utc": null, "banned_by": null, "media_embed": {}, "subreddit": "NetflixBestOf", "selftext_html": null, "selftext": "", "likes": null, "suggested_sort": null,
浏览 2
提问于2017-10-23
得票数 1
回答已采纳
2
回答
Hadoop/MapReduce中的日志文件分析
、
、
、
嗨,我有以下形式的查询日志文件:0 red ballons 1790 2012-10-02 00:00:002 current 280 2012-10-02 00:00:004 red table 201 2012-10-02 00:00:00 我每天都有一份档
浏览 0
提问于2013-09-21
得票数 0
回答已采纳
1
回答
显示Spark
结构化
流作业使用的事件数
、
我有2个线性火花
结构化
流式作业,从一个卡夫卡主题复制数据到另一个。 是否可以在Spark UI中发布/查看消费/产生的事件数量?
浏览 13
提问于2020-04-15
得票数 1
回答已采纳
1
回答
数据池中的事务性数据
、
然后,我们必须将原始
数据处理
为
结构化
格式。现在,用户可以通过前端应用程序更新这些数据。
浏览 1
提问于2018-06-27
得票数 0
回答已采纳
1
回答
Postgres适配器添加了什么值?
、
、
、
我不是一个HDFS书呆子,但来自传统的RDMS背景,我是划痕的新技术,如Hadoop和火花。现在,我正在考虑我的选项,当涉及到SQL查询星火数据时。还是我误解了它的实际作用?
浏览 0
提问于2018-09-13
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
结构化、半结构化和非结构化数据
带你解密结构化和非结构化
什么是结构化数据?哪些OCR软件可将图片文字转为结构化数据?
视频结构化有什么作用?
思影数据处理业务三:ASL数据处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券