问候所有人;
我是使用正则表达式的初学者。我想做的是在某个模式之后提取2到3个阿拉伯语单词。
例如:
如果我有一个阿拉伯字符串
inputtext = "تكريم الدكتور احمد زويل والدكتورة سميرة موسي عن ابحاثهم العلمية "
我需要提取下面的名字
الدكتور
和
والدكتورة
因此,输出应为:
احمد زويل
سميرة موسى
到目前为止,我所做的工作如下:
inputtext = "تكريم الدكتور احمد زويل والدكتورة سميرة موسي عن ابحاثهم
python中的正则表达式,用于检查字符串中的单词是否未由_AND_,_OR_之类的单词分隔,而仅由空格分隔。
下划线在这里的意思是单词AND/OR前后的空格。
例如:
1.) foo AND bar -应该失败
2.) foo AND bar cafe -应该失败,因为它有_AND_
3.) foo AND bar OR cafe foobar baz -失败,因为其中包含_AND_/_OR_
4.) foo bar baz foobar - pass,因为它只用空格分隔,没有_AND_/_OR_
5.) fooANDbarOR bar - pass,因为它没有被_AND_/_OR_分隔。
我有一个字符串,如下所示:
Here is a test
我想返回第一个单词和第二个单词之间的空格数(4),但我不太确定如何做到这一点。对于我当前的尝试,它计算整个字符串的空格数,但我只需要在第一个和第二个单词之间,然后停止:
int spaceCount = 0;
for (char c : line.toCharArray()) {
if (c == ' ') {
spaceCount++;
}
}
我有一个问题,当引擎在regex模式中找到第一个替代时,它会停止分析右侧的进一步字符串位置。例如,我有以下示例:
在字符串ABC SCHOOL FOUNDATION COOPERATIVE PARTNERSHIP中,我希望将['foundation cooperative partnership']作为匹配项。然而,我得到了['foundation', 'cooperative'],因为引擎找到了foundation,然后继续输入下面的单词cooperative,它也是匹配的。我使用了以下代码:
import re
name='ABC
我有这样的文本:
Here is some text.
#note Remember to look into specs #
And here is some more text.
我可以使用以下命令获取文本中所有单词(字符串是所有文本):
str.match(/\w+/g)
这提供了一个包含所有单词的数组,但已从单词note中删除了标签:
Here,is,some,text,note,Remember,to,look,into,specs,And,here,is,some,more,text
我如何才能得到这样的结果,使得它在它所附加的单词上包含标签?
期望的结果:Here,is,so
我对学习regex非常陌生。我一直在试图理解如何控制量词来匹配字符串中的单个单词。我知道那里有大量的资源,但是很难找到我想要的具体术语。
我想知道的是如何从下面的字符串中匹配单词He?如果我也知道如何匹配it (我的意思是匹配任何位置词),情况会更好:
He found it difficult.
[a-zA-Z].*? --it's a silly try to match "He"
给定一个单词在字符串中的索引从零开始(" index“在这个句子中是位置2),并且一个单词被定义为用空格分隔的单词,我需要找到该单词的第一个字符的索引。 我的空白正则表达式模式是"( +|\t+)+",只是为了覆盖我的所有基础(除了新行字符,它被排除在外)。我使用split()将字符串分割成单词,然后将每个单词的长度相加。然而,我需要考虑到在单词之间使用不止一次空格字符的可能性,所以我不能简单地将单词数减1,每次都仍然是准确的。 示例: >>> example = "This is an example sentence"
>&
我有一个包含blob文本字段的表。这个blob中有很多html。html的一部分是h2。我希望在h2标记中找到一个单词的所有实例,并将其替换为另一个单词(同时保持其他单词不变)。
例如,我想将以下代码中的h2 "wiggles“替换为"bumbles”:
之前:
<h2>This is some wiggles html!</h2>
<p>And here is some more wiggles html that could be ignored</p>
<h2>And this is a decoy h2<
我已经使用下面的regex允许我输入字母表,数字,特殊字符,不应该允许整个单词的尾随和前导空间。
不允许的模式:
(space)text(space),
(space)this text is having trailing and leading space(space)
对于上面的内容,我使用了这个regex模式/^(?! )[A-Za-z0-9 ]*(?<! )$/,这个条目- v1.3失败了。
rules: [
{
required: true,
pattern: /^(?! )[A-Za-z0-9 ]*(?&
我正试图在我的应用程序中创建一个正则表达式,并且很难理解它。我已经创建了一个正则表达式,但我仍然希望修改它,使其不匹配特定的内容。我需要为iOS和Android创建regex。
这是我的领地
(?:rahul[\s"'?.!:s()\{\}])
这是我的测试字符串
rahul hello rahul! vyas and rahul? and rahul. and rahul: and rahul and rahul( and rahul) and rahul{ rahul.shiv rahuls vyas rips rahul!!
这是我用来创建regex 的站点
我真正想要
我有一个单词列表,我想匹配这些单词的任何组合。假设我有单词apple、orange和mango,并且我正在使用以下字符串:
This place has the best apple pie. They also have orange, apple and mango-apple smoothie ...
到目前为止,我拥有的正则表达式是\b((apple|orange|mango)[\s-(,\s)]*)+
它匹配正确的单词组合,但另外它还匹配序列末尾的额外空格。我得到的匹配结果如下:
"apple "
"orange, apple "
"mang
比方说,我想要找到数据帧每行中的字数。因此,在下面的示例中,我想找出第一列中的第一个值有3个单词,第二个值有4个单词,依此类推。我假设这是一个应用函数的任务,但是我没什么运气能弄清楚这个问题。
dat = data.frame(one=c("That is Cool",
"I like my bank", "He likes pizza", "What"))
我是否需要使用strsplit(),还是在创建函数时使用apply()函数更好:apply(dat, 1, function(x)...
我有这个数据框 df <- structure(list(ID = 1:3, Text = c("there was not clostridium", "clostridium difficile positive", "test was OK but there was clostridium")), class = "data.frame", row.names = c(NA, -3L))
ID Text
1 1 ther
我正在尝试为输入创建一个验证,在字符串的开头有3个字母,然后是逗号,然后是空格,然后是一些单词。 例如: Coz,你是个天才 为此,我使用了这个模式,pattern="^[a-zA-Z]{3}[,]{1}[a-zA-Z]{30}"也尝试了这个模式^[a-zA-Z]{3}[, ][a-zA-Z\s] 下面是我的自定义验证的javascript。 var data = document.getElementById('sentence');
data.addEventListener('invalid', function
我在C#中使用WinForms NET 2.0。
我有文本文件,大约1000-1500行。它们中的某些行以4个或更多字母单词开头,我必须在这些单词中添加冒号。在这些行的开头留有空格是可选的,除了这些单词之外,该行还可以包含更多的文本。下面是一个例子:
lda $00,x
mov $20
rep #$20
tax
lda #$0000,y
word
... ; comment
anotherword ; this word has whitespace before it.
此外,如果已经有冒号,它会直接忽略
我试图从一个字符串中提取几个单词,其中包含正则匹配和模式。我确实花了一些时间来做我正在使用的正则表达式,但是这并不像预期的那样工作,任何帮助都会非常感谢。
我做了我正在使用的正则表达式,但这不像预期的那样工作,一些帮助会很好。我能从我想要的单词中提取字符,但不能从整个单词中提取字符。
import java.util.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main (String[] args){
Stri
我已经尝试了不同的正则表达式,但我似乎找不到正确的。
我需要一个正则表达式,允许用户键入字母,数字,空格,-和‘在文本中。
所以像这样的字符串:"'s Ochtends“"tomorrow-night”"ISBN1234ABC“
应该是真的。
我用下面的代码尝试了下面的正则表达式:
/([A-Za-z0-9'-\s])/g
[^#$@_&!*()]
and more of these variations
var regex = new RegExp("([a-zA-Z0-9\s'-])+");
consol
假设我有一个文本字符串:
The quick brown fox jumped over 8 or 9 lazy dogs
如何将其转换为像这样的小写连字符连接的单词?
the-quick-brown-fox-jumped-over-8-or-9-lazy-dogs
我假设它需要某种正则表达式才能正确转换?