我一直试图从solve查询练习中解决Q9问题(找出1980年以前发布的电影的平均评分和1980年以后发布的电影的平均评分之间的差异。)。由于几乎每部电影都有一个以上的评级(明星),我需要计算每个电影的第一个平均评分。我是用这个代码做的: AVG(rating.stars) INNER JOIN movie ON
我正在尝试将异常注入到数据集中,本质上是基于某个条件更改某些值。我有一个数据集,有10个子集。条件是异常将是每个分段的标准偏差的2.8-3倍,远离该子集的平均值。为此,我将数据集划分为10个相等的部分,然后计算每个子集的平均值和标准差,并通过将该子集的3个标准差远离该子集的平均值来更改某些值。(x) #cumulative sum of datasetfor(i in c