腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(303)
视频
沙龙
1
回答
如何将
负载
均衡
器日志实时导出到
BigQuery
?
google-bigquery
、
load-balancing
、
google-cloud-dataflow
、
google-cloud-pubsub
我们正在尝试将
所有
的http
请求
导出到我们
的
google
负载
均衡
器到大
查询
中。不幸
的
是,我们注意到
数据
在3分钟后到达
BigQuery
。从本教程开始: 用流插入pub/sub表创建带有所提供模板
浏览 0
提问于2019-07-17
得票数 0
1
回答
如
何在
不
加载
所有
数据
的
情况下
,按
时间
戳
分区
查询
BigQuery
堆栈
驱动器
接收
的
Google
负载
均衡
请求
?
google-bigquery
、
google-cloud-stackdriver
、
google-cloud-load-balancer
我正在尝试按
时间
戳
查询
我
的
数据
集,但我为完整
的
数据
集扫描收费。是否可以只
查询
特定
的
时间
戳
,并减少分析
的
数据
大小? 请注意,我使用
的
是Stackdrive Sink,它在我
的
数据
集上实时传输
数据
。
浏览 19
提问于2019-03-06
得票数 0
回答已采纳
3
回答
类似SOCRATA SODA
的
查询
socrata
、
soda
如
何在
苏格拉塔苏打API中
请求
类似的
查询
? 一旦进入
BigQuery
或任何sql
数据
浏览 3
提问于2014-08-10
得票数 1
回答已采纳
1
回答
谷歌BigTable
的
模式设计
google-cloud-platform
、
google-bigquery
、
bigtable
在我
的
项目中,我使用
的
是谷歌
BigQuery
,它保存了大量
的
数据
。
BigQuery
列是: account_id,session_id,transaction_id,用户名,事件,
时间
戳
。在我
的
仪表板中,我根据
时间
戳
(最后30天)获取整个
数据
。因为我有非常大
的
数据
,所以性能非常慢(获取最后30天
的
数据
需要13秒)
浏览 3
提问于2022-05-25
得票数 0
1
回答
Cassandra读取
查询
,使用queries框架
数据
返回空结果
spring-boot
、
cassandra
、
cqlsh
、
tombstone
当我执行Cassandra
查询
时,它总是返回空
的
结果,但是cassandra表中有记录。 当删除操作发生在同一个
分区
上时,我将面临这个问题。例如:
分区
A包含1条M记录,更早
的
时候,我在同一个
分区
A上删除了900 K记录。后来,我无法在相同
分区
上获得剩余
的
100 K记录。有时抛出ReadTimeoutException或返回空
的
结果.这是在使用querying框架
数据
cassandra
查询
时发生<em
浏览 7
提问于2020-10-16
得票数 3
2
回答
<-> ->
BigQuery
python
、
google-app-engine
、
google-bigquery
、
google-cloud-storage
我们正在开发处理日志
数据
的
项目。我
的
想法是 问题是 这是实际
的
解决办法吗?日志
数据<
浏览 5
提问于2014-09-05
得票数 2
回答已采纳
1
回答
在
BigQuery
中对大型
时间
序列
数据
集进行排序以便导出
d3.js
、
google-cloud-platform
、
google-bigquery
我这样做
的
原因是,我可以在许多不同
的
细节级别查看
时间
序列
数据
。 目前,我使用Python SDK通过csv上传到
BigQuery
来
加载
数据
。csv文件是测量系统输出
的
文件,我对此没有控制权。在99%
的
情况下
,
时间
戳
GroupId用于将
数据
分组到“bin”中,然后我们可以使用这些bin通过获取每个bin
的
最大值和最小值来进行下采样。因此,当我需要对
浏览 42
提问于2020-01-04
得票数 0
2
回答
cassandra 1.x中
按
日期范围
查询
的
最简单示例
nosql
、
cassandra
我想存储一个ID和一个日期,我想从dateA到dateB检索
所有
条目,我到底需要什么才能执行select from my_column_family where date >= dateA and date
浏览 7
提问于2011-12-26
得票数 3
4
回答
是否可以
查询
存储
的
云存储日志
数据
而不使用
BigQuery
对其进行清理?
google-cloud-platform
、
google-bigquery
、
stackdriver
我有大量日志
数据
从StackDriver导出到。我正在尝试使用
BigQuery
运行
查询
。但是,在
BigQuery
Dataset中创建表时,我将得到大量日志
数据
是从包含大量唯一列名
的
StackDriver
接收
器中导出
的
。其中一些名称不符合
BigQuery
表
的
要求。 解决这个问题
的
办法是什么
浏览 0
提问于2019-09-04
得票数 0
回答已采纳
2
回答
在Hive中使用
的
分区
表是什么?
hadoop
、
hive
我知道
分区
表用于水平分配
负载
,但它们的确切用途是什么?有人能用一个简单
的
例子向我解释吗?
浏览 4
提问于2013-10-24
得票数 0
回答已采纳
4
回答
动力BI雅典娜增量刷新
powerbi
、
etl
、
presto
、
amazon-athena
、
incremental-load
我已经成功地使用了Power
的
增量刷新和MySQL
数据
源。但是,我无法用AWS雅典娜进行配置,因为后者似乎将所需参数RangeStart和RangeEnd中
的
值解释为字符串。由于
数据
源大约有5000万行,所以我宁愿每天都避免从头开始
查询
。在Cube中
的
Guy 中,可以清楚地看到Power向Azure发送
的
查询
有一个转换为datetime2函数--对于雅典娜/普雷斯托来说可能缺少类似的功能,它需要类型构造器
时间
戳</e
浏览 1
提问于2019-07-26
得票数 1
回答已采纳
3
回答
如何重新启动标准服务
python-3.x
、
google-app-engine
、
google-api
、
gcloud
上下文:我有一个应用程序,用于交互图形和
数据
分析。为了计算图表和
数据
摘要,它使用了一个在应用程序初始化时通过
查询
google
BigQuery
加载
的
数据
集。然后,
数据
作为全局变量(在内存中)保存,并用于可能由不同用户运行
的
所有
数据
计算和绘图中(每个用户在会话中保存自己
的
过滤器/掩码)。此
数据
集在夜间每天在
BigQuery</em
浏览 0
提问于2019-03-17
得票数 1
回答已采纳
3
回答
如
何在
内存、磁盘使用和其他属性方面
负载
平衡
linux
、
networking
、
performance
、
memory
我已经发现像NGINX这样
的
负载
平衡器,但是这些工具似乎只需要记住CPU
的
使用和网络流量才能工作。对于其他变量,例如每个节点上可用
的
磁盘数量,或者可用
的
内存量,我将如何
加载
平衡?我是否需要编写自己
的
请求
处理服务,以便在决定将
请求
发送到哪个节点时利用这些变量?这是我
的
用例,我正在构建一个用于擦除代码
的
分布式文件系统,并希望
负载
均衡
器向节点发送一个文件
的</e
浏览 0
提问于2016-04-21
得票数 8
7
回答
如何使HTTP调用到达amazon
负载
均衡
器后面的
所有
实例?
amazon-web-services
、
amazon-ec2
、
elastic-load-balancer
我有一个web应用程序,运行在Amazon弹性
负载
均衡
器后面,附带了3个实例。该应用程序有一个/refresh端点来重新
加载
参考
数据
。只要有新
的
数据
可用,就需要运行它,这每周发生几次。我一直在为
所有
实例分配公共地址,并独立地进行刷新(使用ec2-url/refresh)。我同意
的
观点,ELB背后
的
EC2实例不应该允许直接
的
公共访问。现在,我
的
问题是如何让elb-url/
浏览 0
提问于2016-09-14
得票数 19
回答已采纳
4
回答
如何安排数十万项任务?
python
我们有成千上万
的
任务需要以各种任意
的
间隔运行,有些是每小时,有些是每天,等等。这些任务是资源密集型
的
,需要在许多机器上进行分配。据我所知,我
浏览 3
提问于2010-03-16
得票数 17
回答已采纳
2
回答
查询
优先
的
MongoDB方法?
mongodb
、
database-design
、
nosql
我开始为一个肯定会有大量并发访问
的
项目设计一个全新
的
MongoDB
数据
库。我之所以选择MongoDB,是因为我知道它
的
可扩展性和
查询
速度。然而,我知道即使使用MongoDB,出于性能
的
考虑,我也应该尝试尽可能少地访问
数据
库。我知道另一个NoSQL
数据
库Apache Cassandra提倡“
查询
优先”方法,这意味着您应该首先考虑您
的
查询
,然后根据它们组织您
的
数据
结构
浏览 0
提问于2013-04-19
得票数 1
2
回答
当火花从mysql中读取或写入时,创建了多少任务?
mysql
、
apache-spark
据我所知,火花执行者同时处理许多任务,以保证处理
数据
parallelly.Here是一个问题。当连接到外部
数据
存储时,例如mysql,有多少任务可以完成这项工作?换句话说,是同时创建多个任务,每个任务读取
所有
数据
,还是
数据
只从一个任务读取并以其他方式分发到集群?如何将
数据
写入mysql,有多少连接?下面是一些从mysql读取或写入
数据
的
代码: def jdbc(sqlContext: SQLContext, url: String, drive
浏览 8
提问于2022-09-27
得票数 0
2
回答
如何设置多个web和
数据
库服务器?
mysql
、
hosting
、
scalability
、
architecture
、
database-replication
我
的
网站在流量方面一直在增长,而mysql上
的
负载
也在增加。我想要一个解决方案来帮助处理mysql上增加
的
负载
(
所有
的
查询
都已经优化了),因为流量+备份服务器增加了,如果我
的
主服务器出现故障,它可以作为故障转移。我读过关于设置多个web和
数据
库服务器
的
文章,但有几个问题: 1)如
何在
维护相同内容
的
同时设置多个web服务器(每次更新时我都要将文件上传到
所有
服务器,还
浏览 0
提问于2010-09-30
得票数 3
7
回答
是否有办法确保GAE上
的
任务队列具有FIFO (先进先出)行为?
java
、
google-app-engine
、
task-queue
GAE文档说FIFO是影响任务执行顺序
的
因素之一,但同样
的
文档说“系统
的
调度可能会‘跳转’新任务到队列
的
首位”,我已经通过测试证实了这种行为。结果是:我
的
事件被处理得乱七八糟。医生说: 任务在队列中
的
位置。App尝试基于FIFO >(先入先出)顺序处理任务。通常,任务被插入到队列
的
末尾,并从队列
的
头执行。 队列中
的
任务积压。系统试图通过特别优化
的
通知向调度
浏览 7
提问于2012-04-02
得票数 7
回答已采纳
3
回答
寻找一个短期解决方案,以提高网站
的
性能与额外
的
服务器
php
、
mysql
、
performance
、
optimization
、
cluster-analysis
所有
文件和
数据
库都托管在具有以下配置
的
专用Linux计算机上:我们一开始很小,然后
数据
库变得更大,现在网站
的
性能明显下降。我们经常遇到服务器空间溢出,mysql调用过多等问题,我们没有太多处理这些问题
的
经验。我们最近得到了另一台服务器,我们正在考虑使用它来提高性能。由于它有更好
的</e
浏览 2
提问于2012-11-22
得票数 1
点击加载更多
相关
资讯
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
从Lambda到无Lambda,领英吸取到的教训
谷歌推出Bigtable联邦查询,实现零ETL数据分析
开发者手撸类谷歌搜索关键字智能匹配功能系统
旅游电子票务系统:节假日负载均衡的实现方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券