为什么年和月函数会导致Spark中的长时间溢出？

、、、

我正在尝试从spark中名为logtimestamp (类型为TimeStampType)的列中创建year和month列。数据源为cassandra。我正在使用sparkshell来执行这些步骤，以下是我编写的代码- import org.apache.spark.sql.cassandra._ import org.apache.spark.sql.typesjava.util.concurrent.ThreadPoolExecutor$Worke

浏览 34提问于2021-11-02得票数 4

回答已采纳

3回答

为什么Date(2015，11，1)不是12月1日？

、

当我将该日期转换为ISO字符串时，我得到了2015年11月30日。为什么不是12月1日呢？我已经用谷歌搜索过了，我知道这个月是0索引的，溢出会导致下一天/月/年。

浏览 0提问于2017-11-14得票数 0

1回答

为什么sprintf在一个示例中工作而不是在下一个示例中工作？

、、、、

下面是我的代码：struct tm * now=localtimesprintf(cmin, "%d", now->tm_min); printf("cmin is: %s\n",cmin);cyear is: 输出也

浏览 2提问于2014-11-03得票数 2

回答已采纳

2回答

将当前值添加到未来日期SQL

、

我正试着为未来的约会加载数据。我的设想是这样的，我有2016年、2017年和2018年的数据(直到8月)。每年都有当前值和“前一年同一天”值相关联。数据汇总到月份。要求我也为未来的日期加载数据，即2018年9月至2019年8月使用'PYSD‘值。例如，2017年9月

浏览 0提问于2018-09-04得票数 0

回答已采纳

3回答

使用Scala2.12和Spark2.x

、、、

在Spark2.1 上，有人提到虽然Scala 2.11和2.12主要是源代码兼容的，以便于交叉构建，但它们并不是二进制兼容的。这使我们能够不断改进Scala编译器和标准库。

浏览 11提问于2017-03-19得票数 28

3回答

使用regex python提取引号之间的文本

、

XYZ"我尝试过使用regex的代码print(title)['abc']['1 - 2 - 3'] 有些台词空空如也，不知道为什么有没有其他更好的方法来做到这一点？

浏览 2提问于2021-10-12得票数 2

回答已采纳

1回答

在Ajax钻取过程中限制图表扩展时的高x轴

、、

我创建了高级图表，在这里我使用Ajax向下钻取，所以如果我单击xAxis标签，我将通过Ajax传递xAxis标签值，并相应地加载本系列中的新数据，有时我也会像wise一样修改样条->列和瀑布等图表。但现在的问题是，我为仪表板设置了一个日期选择器，默认情况下，我将显示3个月(2014年3月-2014年4月2014年5月-2014年5月)<em

浏览 2提问于2014-09-10得票数 1

回答已采纳

1回答

调优查询，以避免使用带有order的聚合函数

、

如何通过以下方式重写以下查询以避免使用带order的aggegate函数：由于我有一个很大的数据集，所以上面的查询会导致性能问题。以下是一个样本数据：1-2014年7月-2014年7<em

浏览 1提问于2014-07-16得票数 0

1回答

Spark中几个任务中的重新分区数据瓶颈

、

我有一个简单的spark工作，它做以下工作 val dfIn = spark.read.parquet(PATH_IN)dfOut.write.mode(SaveMode.Append).partitionBy(col1, col2, col3).parquet(PATH_OUT) 我注意到这份工作的表现有很大的恶化检查Spark UI显示，写入瓶颈出现在一些任务中，与快速

浏览 31提问于2021-11-04得票数 2

1回答

数据库中的Jar作业超时限制

、

我们的应用程序启动了长时间运行的spark作业，创建了spark会话和"fire“子作业，但在8月份的发布说明中，我发现notebooks会限制作业执行2天。有可能在这样的限制下运行流作业吗？

浏览 0提问于2021-09-04得票数 0

3回答

java.io.IOException: Filesystem关闭时，Spark在大型混洗作业上失败

、、、

我经常发现spark在大型任务中失败了，但有一个相当无用、毫无意义的例外。工作日志看起来很正常，没有错误，但它们的状态是“终止”。这对于大混洗来说是非常常见的，所以像.distinct这样的操作。考虑到这些操作很多都是一元化的，我一直在解决这个问题，方法是将数据分成10个数据块，在每个数据块上运行应用程序，然后在所有结果输出上运行应用程序。换句话说- meta-map-reduce。at org.apache.spark.rdd.RDD.iterato

浏览 2提问于2014-06-04得票数 9

回答已采纳

2回答

用Javascript设置未来日期

、

我试图根据以前设定的日期生成一个未来的日期，但是我得到了奇怪的输出。console.log(theFuture); Tue Jan d) -2147483647 20:33:52 GMT-0500 (EST) 为什么这里的日期不正确

浏览 2提问于2015-07-16得票数 0

回答已采纳

1回答

我的函数总是把日期看错了整整一年。

、

我用字符串存储日期，有时以“11月-2018年”的形式存储，有时以"11/1/2018“的形式存储。我想把它们普遍改为“2018年11月”。只有月份和日期。我编写了以下函数。'11/1/2018‘和’11月-2018年‘，并返回结果’11月2019年‘。我不知道为什么2019年

浏览 0提问于2019-01-22得票数 0

1回答

pyspark是否正常行为？

、、、

我真的需要你的帮助，当我说我不打算调试我的代码时，我希望我的话听起来不会太苛刻。我希望和/或认为这是除了我的代码之外的其他东西，也许我不希望在spark中发生。早在2015年10月，我就使用spark 1.5.1在python上开发了一段使用mllib的代码，它起作用了。使用此包一段时间，直到2016年8月。不管出于什么原因，我的代码不再工作了，即使我使

浏览 0提问于2016-10-26得票数 0

1回答

配置配置文件用于测试需要多长时间？

、

当我在我自己的设备上安装它时，配置文件说它在我上次修改它后的一年到期。但我也听说可能会更短一些。在中提到的时间是2个月和3个月。这是正确的，为什么？我需要一个大约3-4个月的发情器。如果我让我的测试人员安装我的beta应用程序，使用一个用于开发的配置文件，她能够运行这个应用程序多长时间？

浏览 4提问于2012-01-30得票数 2

回答已采纳

1回答

旧的日期被解析为夏季时间，即使在Java中不是这样。

、、

我在显示多个作为长时间存储的日期时遇到问题。我使用接受长参数的构造函数创建日期对象，然后将日期打印到PDF文件中。在Windows上: 25。1976年</em

浏览 3提问于2015-06-10得票数 5

回答已采纳

1回答

解释为什么2012年12月31日是第53周而不是第1周(ISO-8601)

、、

月1日开始测试了30,000天，我和第二个来源有一些不同。We Th Fr Sa Su Mo Tu We Th根据ISO-8601标准一年中的第一周是当年第一个星期四的一周1月3日是2013年的第一个星期四，因此1月3日是第一周(2013年)的一天。第一周(20

浏览 1提问于2013-12-21得票数 6

回答已采纳

1回答

Pyspark月度频率低性能

我们需要提取2016年1月1日到2016年12月31日的数据。我刚才提到了样本，但这些记录在一年内以百万计。但是花费了很长时间，因为列数大约是60(刚刚使用了示例3)。() Tab2=spark.sql("sel

浏览 14提问于2019-05-25得票数 2

回答已采纳

1回答

在SQL Server中将文本转换为日期时出现意外错误

、

我在将年、月、日的int值转换为日期值时遇到问题。SELECT datefromparts(b.Install_year, b.shipm_month, b.shipm_day)SELECT datefromparts(2005, 4, b.shipm_day) 出于测试目的，我将年和月的值设置为固定<

浏览 11提问于2019-11-08得票数 1

1回答

PySpark -在读取拼花后优化分区数

、、、

在一个由year和month分隔的拼花数据湖中，spark.default.parallelism设置为4，假设我想创建一个DataFrame，由2017年以来的11~12个月，以及2018年的1~3个月( A和B )组成。，Spark使用spark.default.parallelism作为缺省值：Out[4

浏览 1提问于2018-06-05得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么Date(2015，11，1)不是12月1日？

为什么sprintf在一个示例中工作而不是在下一个示例中工作？

将当前值添加到未来日期SQL

使用Scala2.12和Spark2.x

使用regex python提取引号之间的文本

在Ajax钻取过程中限制图表扩展时的高x轴

调优查询，以避免使用带有order的聚合函数

Spark中几个任务中的重新分区数据瓶颈

数据库中的Jar作业超时限制

java.io.IOException: Filesystem关闭时，Spark在大型混洗作业上失败

用Javascript设置未来日期

我的函数总是把日期看错了整整一年。

pyspark是否正常行为？

配置配置文件用于测试需要多长时间？

旧的日期被解析为夏季时间，即使在Java中不是这样。

解释为什么2012年12月31日是第53周而不是第1周(ISO-8601)

Pyspark月度频率低性能

在SQL Server中将文本转换为日期时出现意外错误

PySpark -在读取拼花后优化分区数

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐