我希望使用带有日期的MultiIndex作为分层索引类型之一。我还想将DataFrame保存为一个frame_table,这样我就可以从磁盘中选择子集,而无需加载整个程序。目前我遇到了一个错误:TypeError: [date] is not implemented as a table column和我想知道我是否使用了多个索引,或者这确实是Pandas的一个限制。import pandas as pd, numpy, datetime
print pd.__version__ #-
我正在尝试找出一种好方法,在Pandas中创建从excel文件中获得的以下数据帧的抽象:
Date | ID | Company | ProjectID | ProjectName | ProcessLevel1级别是分层的,我想创建一个不同级别的项目流的链接,显示它的前一个级别以及它之前的级别。如上所示,流程有多个级别,如名称和级别,其中L1是最高级别(第一步)。我不认为在这里做Pandas操作是有用的,我正在努力使这些数据的预处理变得高效,以便基于Company或ProjectID进行分组操作,以便显示层次结构并突出显示不