我在CSV文件中有基于列的数据,我想用几种方法来操作它。人们向我推荐了R,因为它让您可以轻松地访问行和列,但我已经熟悉了python,并且更愿意使用它。例如,我希望能够删除其中一列中具有特定值的所有行。或者我想要更改某一列的所有值(例如,修剪字符串)。我还希望能够基于公共值聚合行(比如SQL GROUP BY)。有没有一种方法可以在python中做到这一点,而不必每次都编写循环来迭代所有行?
我有一个带有头的csv文件,有时在某一行中有额外的字段。这是因为文本字段中有一个逗号没有转义。757626003,7383233,SCOTT R SMITH,GND,20180306,1,1Z1370750982624042,2018168329,119349,39.33
如您所见,第3行有一个额外的字段当行的字段比有标题的字