我有一个语料库文本文件,它被输入到twitter应用程序中,该应用程序一次周期性地发布一行tweet。但是,在发完一行后,我想让它从文本文件中删除它。下面是用tweet发出的当前代码(这段代码不是我最初写的,但我稍微修改了一下):# -*- coding: utf-8 -*-
# Tweets a .txt fileline by li
PrinterBolt", new LocalFile(), 6).setNumTasks(4)我从KafkaSpout获取tweet并将其发送给bolt进行预处理,我的问题是在avgScoring中调用S3,因为我为每个用户设置csv,并为每个用户计算每个tweet的得分。我有100个用户,这意味着我的
希望有人有耐心和乐于助人的灵魂:)我正在做一个情绪分析项目atm,但我被困在了预处理部分。我导入了csv文件,将其转换为数据帧,将变量/列转换为正确的数据类型。= [tknzr.tokenize(str(i)) for i in df_tweet1['Tweet Content']] print(i) 输出是一个包含单词(标记)的列表。然后,我执行停用词删除: # Stop word removal