假设我有这个字符串,是42个字符
**
0 1 2 *2* 3 4
0123456789012345678901234567*8*90123456789012
The quick brown fox jumps ov*e*r the lazy dog
**
我想使用它作为一个搜索查询,搜索查询不能超过28个字符,这是我要做的
searchQuery = myString[:28]还>>快棕狐跳爱
然而,我希望它返回快速的褐狐跳跃,因为这是返回字符串中的全部单词。
我想使用regex在引号中选择文本,如下所示-
Regex应该在引号之间选择文本。如果有嵌套引号,则应该选择所有内部嵌套引号,而不是外部引号。
Ex 1- Sample.text.value "The quick brown fox"
结果应该是-快褐狐
Ex 2- Sample.text.value "The quick brown fox" random text here one "jumps over the lazy dog" random text here two
结果应该是-,快褐狐,和跳过了懒狗
Ex 3- "Sampl
我有一系列的短语发生在一个更大的文本。我想强调这些短语,但我想先把这些短语压缩一下。我在大部分处理过程中使用Python3.5和NLTK。
例如,如果我有这样的句子:
那只敏捷的棕色狐狸跳过那只懒惰的狗。
还有那些短语
褐狐
快褐狐
我希望得到的HTML看起来像
The <b>quick brown fox</b> jumped over the lazy dog
不
The <b>quick <b>brown fox</b></b> jumped over the lazy dog
似乎我应该能够完成某种