这里我有一个场景,我有一个句子,既有英语单词,也有泰语单词,比如'Hello World สวัสดีชาวโลก'。现在我想通过使用正则表达式来获取英语单词,比如/[a-zA-Z ]*/。但是当我有像'Hello World Hola Mundo'这样有西班牙语的英文单词时。如何识别具有其他语言(如西班牙语)的句子?
我们有使用正则表达式/ ColdFusion的选项吗?请分享任何关于这方面的建议和想法。
谢谢!
我正在努力寻找象格英语单词,我试着改变阿尔皮诺,它下载荷兰单词到en或英语,但它没有工作的任何想法?
from nltk.util import ngrams
from nltk.corpus import alpino
print(alpino.words())
quadgrams=ngrams(alpino.words(),4)
for i in quadgrams:
print(i)
我有一个大约有30,000行的表,需要从dummy_df数据帧中名为dummy_df的列中提取非英语单词。我需要将非英语单词放在相邻的列non_english中。虚拟数据是这样的: dummy_df = pandas.DataFrame({'outcome': ["I want to go to church", "I love Matauranga", "Take me to Oranga Tamariki"]}) 我的想法是从句子中提取非英语单词,然后在数据帧上迭代该过程。我能够用这个代码从一个句子中准确地提取出非
我只想在安卓系统中设置only default English language of application。
在之后,我还使用values/strings.xml在该文件中存储字符。
如果in English language mode of System Settings,我可以显示正确的单词。
如果in Chinese language mode of System Settings,英语单词被翻译成中文。
我不想它自动翻译。
懂得如何set only default English language的人,
请帮帮我。
谢谢,