首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >正则表达式保留所有字母、数字和下划线(印地语字母的问题)

正则表达式保留所有字母、数字和下划线(印地语字母的问题)
EN

Stack Overflow用户
提问于 2021-09-15 12:27:24
回答 1查看 42关注 0票数 2

我发现了一个正则表达式模式来删除所有非字母表字母:\p{L}

因此,我做了一个正则表达式来删除所有非字母、非数字和非下划线模式:/[^\p{L}\d_]/gimu

不幸的是,它不适用于像#फ्रांस这样的印地语字符,因为它给出了फरस

您可以在此处查看https://regex101.com/r/dnXDK0/1

请帮助我:-)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-09-15 12:29:48

你忘了发音符号。您需要将\p{M}\p{Mn}添加到被否定的字符类中:

代码语言:javascript
复制
/[^\p{L}\p{M}\d_]/gu

请参阅regex demo

注意:这里不需要im标志。m重新定义了锚点行为,但是您的正则表达式既不包含^也不包含$i以不区分大小写的方式匹配大小写字母,但\p{L}匹配所有字母,包括大小写字母。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69193138

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档