更新-非常新的python,如何清理文本从所有的东西,除了阿拉伯字母。我使用了regex函数,但没有成功。= '/content/drive/MyDrive/Colab Notebooks/ArabicKidsStories.txt'text = file.readimport re
text = re.sub('([@A-Za-z0-9_]+)|[^\w\s]|#|http\S+
我正在查看Python-2.7.6的源代码来解决这个问题。在Objects/fileobject.c的第1052行中,有一个名为file_read的函数,我猜想它对应于Python文件对象上的函数read。 if (!但是,我无法在整个Python源代码树(递归grep)中找到实际调用file_read的位置,因此无法继续跟踪以了解by