我发现了一个正则表达式模式来删除所有非字母表字母:\p{L}
因此,我做了一个正则表达式来删除所有非字母、非数字和非下划线模式:/[^\p{L}\d_]/gimu
不幸的是,它不适用于像#फ्रांस这样的印地语字符,因为它给出了फरस
您可以在此处查看https://regex101.com/r/dnXDK0/1
请帮助我:-)
发布于 2021-09-15 12:29:48
你忘了发音符号。您需要将\p{M}或\p{Mn}添加到被否定的字符类中:
/[^\p{L}\p{M}\d_]/gu请参阅regex demo。
注意:这里不需要i和m标志。m重新定义了锚点行为,但是您的正则表达式既不包含^也不包含$。i以不区分大小写的方式匹配大小写字母,但\p{L}匹配所有字母,包括大小写字母。
https://stackoverflow.com/questions/69193138
复制相似问题