获取字符串的单词可以通过以下步骤实现:
以下是一个示例代码,用于演示如何获取字符串的单词并统计频率:
import re
from collections import defaultdict
def get_words_from_string(input_string):
# 使用正则表达式分割字符串,得到单词数组
words = re.split(r'\W+', input_string)
# 初始化一个字典,用于记录每个单词的出现次数
word_count = defaultdict(int)
for word in words:
# 使用正则表达式去除非字母字符,只保留字母部分
cleaned_word = re.sub(r'[^a-zA-Z]', '', word)
if cleaned_word:
# 统计单词出现的频率
word_count[cleaned_word.lower()] += 1
return word_count
# 测试代码
input_string = "Hello, world! This is a test string. Hello world!"
word_count = get_words_from_string(input_string)
for word, count in word_count.items():
print(f"{word}: {count}")
这段代码会输出每个单词及其出现的频率。你可以根据实际需求对结果进行进一步处理,例如按照频率排序或者过滤掉出现次数较少的单词。
对于云计算领域的相关产品和服务,腾讯云提供了丰富的选择。你可以参考腾讯云的官方文档和产品介绍页面来了解更多详情。
领取专属 10元无门槛券
手把手带您无忧上云