是否可以在gsub替换短语中应用函数?比方说在str_to_title之后我想忽略str_to_title函数作用下的某些单词,这样我就可以我知道str_to_title有它自己的异常列表,但是我想通过将一些短语恢复为小写来自定义该列表。我现在的方法是
gsub("( Is | One | BlahBlah )", tolo
假设我有一个字符串,如
'I hate *some* kinds of duplicate.我希望删除duplicate phrase的第二次出现,而不删除其组成部分的其他出现,例如duplicate的其他用法。此外,我需要删除所有的潜在重复短语,而不仅仅是一些我预先知道的特定短语的重复。我找到了几篇关于类似问题的帖子,但没有一篇文章帮助我解决了我的问题
我有一个行数据集,由于代码错误,字符串重复了一次或多次。数据以大写开头,通常有多个单词,然后字符串重复。有些行没有问题,没有重复测试。找到静态长度的重复短语(例如两个重复的单词,如在i am i am a potato中),其中有一个内置的边界条件,如\w,也相对容易。我已经找到了一些例子,比如\b(\w+(?如果有三个重复(如在i am i am i am a