将Unicode文本标准化,在正则式中使用Unicode
合并拼接字符串,字符串中插入变量,删除字符串中不需要的字符
以指定列宽格式化字符串,在字符串中处理html和xml
字节字符串上的字符串操作...--------王小波」
----
字符串和文本处理
针对任意多的分隔符拆分字符串
「你需要将一个字符串分割为多个字段,但是分隔符 (还有周围的空格) 并不是固定的」
string 对象的 split(...:,|;|\s)\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>>
在字符串的开头或结尾处做文本匹配
「你需要通过指定的文本模式去检查字符串的开头或者结尾...可以强制匹配算 法改成寻找最短的可能匹配。
编写多行模式的正则表达式
「使用正则表达式去匹配一大块的文本,而你需要跨越多行去匹配。」
很典型的出现在当你用点 (.)...Python 并没有对在字符串中简单替换变量值提供直接的支持(类似shell那样)。但是通过使用字符串的format()方法来解决这个问题。