我有一个场景,通过where条件从同一个DataFrame中使用另一个列从DataFrame读取一列,这个值作为IN条件通过,从另一个DataFrame中选择相同的值,我如何在spark DataFrame中实现。在SQL中,它将类似于:
select distinct(A.date) from table A where A.key in (s
select count(emp.EmployeeId) as con from employee as emp where emp.EmployeeId < emp1.EmployeeId);
这里是表名employee,在这里我不受限制地得到数字5行,对于编写这个查询,我在网上获得了一些帮助,但我的问题是select状态是如何工作的?
game_addons.game_id) as p on B.game_id = p.game_idgo
由于没有找到一种有意义的方法来绕过数据列表的Cast问题,我决定使用Linq to SQL语句,然而,在创建与Sproc相同工作方式的Ling语句方面,我没有取得任何进展。需要发生的是,在game_addons中可以有许多包含game_id的插件。此列是FK,并连接到游戏表game_id。我正在尝试返回一个按game_addons最多的游戏排序的
我从SQL任务的结果集生成变量作为对象。SQL任务基本上是从myID查询中选择的myTable。
我需要做的是使用在另一个表中返回的in筛选其他表。我在任务流中使用了条件拆分,但是如何才能使它像tsql上的"Select in query“一样。我的意思是从table2中选择myOtherID在(x,y,z)中