我所说的数据清理是指
据我所知,像标点符号、大写字母、停止词如“但是”和表情符号之类的东西往往会强化维德的情感价值,或者换句话说,它会影响情感。
所以,我应该清理我的数据,还是留下标点符号、大写字母和停止词,因为维德也在使用它们?
发布于 2022-02-11 23:20:35
不要干净,所有的帽子和标点符号都意味着什么!让模型决定什么是不相关的符号和表情符号,否则可能会去掉有用的情感信号¯_(ツ)_/¯。
https://datascience.stackexchange.com/questions/108094
复制