我有一个句子列表,我需要找到句子中的开始短语和结束短语,如果存在,并获得中间元素。如果中间的元素有一个以上的单词,它应该跳过并移动到下一个出现的位置。句子列表
para_list = [["hello sir good afternoon calling to you from news18 curious"],["a pleasan
对于没有标点符号和/或所有小写字母的段落,是否有可能从段落/句子标记中提取句子?我们有一个特殊的需要,能够将段落分割成句子,同时预计最坏的情况下,输入的段落是不适当的。"this is a sentence", "this is a sentence", "this is a sentence", "this is a sentence"]
到目前为止,我们尝试过的句子标记器似乎依赖于标点符号和</
我正在使用Google Natural Language API进行情绪分析。我有一系列的字符串文本,我将它们连接起来并发送给谷歌,以获得每种情绪的情感值,但谷歌对句子的开始和结束有自己的想法,所以得到混乱的情绪结果和不同的情绪分数计数,然后发送句子。如果你只能为你想要作为一个单独的句子处理的每个短语设置一个像<sentence> </sentence>这样的标志-那就太好了,但是文档中</e