我有两个大文件,一个Excel电子表格和一个csv文件,这些文件是混乱的,但仍然需要上传到一个表。我正在学习如何使用SSIS。假设列和行看起来如下..
第一Excel电子表格(文件扩展名.xlxs)
ID Name GroupName City Time Price Date
A1 South Group1 London 10/06/2018 $4.50 13.30
A2 North Group2 New York $60 10/07/2018 09:00 AM
图1
第二Excel电子表格(文件扩展名.csv)
ID Name GroupName City Date Time Price
A3 East Group3 Paris 09/09/2017 $5.00 03:00 AM
A4 West Group4 Berlin 01/05/2018 $12.50 18:00
图2
如果您查看图1中的ID A2,您将看到日期为9.00,然后是AM在不同的列。你怎么解决这样的问题?这是一个例子,所以时间数据在每一列中都是随机不同的。也请注意图2中的A4
我对Script Task
和Foreach Loop Container
的学位很熟悉。
我在网上搜索并找到了这网站.
这就是我要找的东西。
现在,已经创建了一个具有这些列名的表。
ID, Name, GroupName, City, Date, Time and Price.
因此,理想情况下,当数据被加载到表中时,它应该如下所示.
ID Name GroupName City Date Time Price
A1 South Group1 London 10/06/2018 13.30 $4.50
A2 North Group2 New York 10/07/2018 09:00AM $60
A3 East Group3 Paris 09/09/2017 03:00AM $5.00
A4 West Group4 Berlin 01/05/2018 18:00 $12.50
我不知道如何处理这个问题。
请注意:我只想知道我需要使用的SSIS工具箱组件。一旦我知道了,我就会尝试解决这个问题。这就是为什么没有代码示例的原因。
提前谢谢。
更新
谢谢哈迪。如果没有人介意的话,当SSIS在VS 2019年完全可用时,我将保持这个线程的打开和更新,并有机会找到解决方案。
发布于 2019-06-18 11:08:04
我不认为有一个简单的解决办法。不过,我会尝试提出一些建议:
您可以参考以下答案来了解更多信息,因为它包含了在数据结构不太好时如何从平面文件中读取数据的有用信息(即使不是相同的情况)。
https://stackoverflow.com/questions/56651651
复制相似问题