Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >常用词的频率及其频率和?

常用词的频率及其频率和?
EN

Stack Overflow用户
提问于 2021-01-15 14:59:28
回答 2查看 64关注 0票数 0

我有两本字典。每本词典都收录了单词。有些词很常见,有些则不常见。我想要显示输出常用单词frequency1 frequency2和频率和。我该怎么做呢?我必须找到前20名。

例如,我的输出必须如下所示:

代码语言:javascript
运行
AI代码解释
复制
Common WORD frequ1. freq2 freqsum
1 print      10.     5.      15
2 number.     2.     1.       3. 
3 program     19.    20.      39

下面是我的代码:

代码语言:javascript
运行
AI代码解释
复制
commonwordsbook1andbook2 = []
for element in finallist1:
    if element in finallist2:
        commonwordsbook1andbook2.append(element)

common1 = {}
for word in commonwordsbook1andbook2:
    if word not in common1:
        common1[word] = 1
    else:
        common1[word] += 1
        
common1 = sorted(common1.items(), key=lambda x: x[1], reverse=True) #distinct2

for k, v in wordcount2[:a]:
    print(k, v)  
EN

回答 2

Stack Overflow用户

发布于 2021-01-15 15:21:36

假设字典中的每个单词都有单独的频率,我们可以做一些更简单的事情。比如..。

代码语言:javascript
运行
AI代码解释
复制
print("Common Word | Freq-1 | Freq-2 | Freq-Sum")
for i in freq1:
   if i in freq2:
      print(i,freq1[i],freq2[i],freq1[i]+freq2[i])
票数 0
EN

Stack Overflow用户

发布于 2021-01-15 15:25:17

由于不允许使用Counter,因此可以使用字典实现相同的功能。让我们定义一个函数来返回一个字典,其中包含给定列表中所有单词的计数。字典有一个get()函数,用于获取给定键的值,同时还允许您在找不到键时指定默认值。

代码语言:javascript
运行
AI代码解释
复制
def countwords(lst):
    dct = {}
    for word in lst:
        dct[word] = dct.get(word, 0) + 1
    return dct


count1 = countwords(finallist1)
count2 = countwords(finallist2)

words1 = set(count1.keys())
words2 = set(count2.keys())

count1.keys()将为我们提供finallist1中所有独特的单词。然后我们将这两个词转换为集合,然后找到它们的intersection以获得常用词。

代码语言:javascript
运行
AI代码解释
复制
common_words = words1.intersection(words2)

现在你已经知道了常用词,打印它们和它们的计数应该很简单:

代码语言:javascript
运行
AI代码解释
复制
for w in common_words:
    print(f"{w}\t{count1[w]}\t{count2[w]}\t{count1[w] + count2[w]}")
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65738411

复制
相关文章
内存频率
内存上一般都会标注内存容量以及频率等,如果您是新购买的内存,或者台式电脑,那么就可以拿出来看看,我们可以通过看内存表面铭牌标注即可知道
用户7657330
2020/08/14
1.7K0
内存频率有哪些?怎么看内存频率
内存上一般都会标注内存容量以及频率等,如果您是新购买的内存,或者台式电脑,那么就可以拿出来看看,我们可以通过看内存表面铭牌标注即可知道,如下图:
用户7657330
2022/09/08
5.6K1
内存频率有哪些?怎么看内存频率
[PHP] 频率限制类
比如要实现 单个ip限制60秒1次 单个关键字,比如手机号,限制60秒1次,3600秒10次 <?php class Sina_Mail_WebAntispam { const PREFIX
唯一Chat
2019/09/10
7820
[PHP] 频率限制类
【数字信号处理】基本序列 ( 正弦序列 | 数字角频率 ω | 模拟角频率 Ω | 数字频率 f | 模拟频率 f0 | 采样频率 Fs | 采样周期 T )
文章目录 一、正弦序列 ( 数字信号 ) 二、模拟角频率 与 数字角频率 关系 三、模拟信号 四、数字角频率 ω 与 模拟角频率 Ω 与 模拟频率 f 的关系 五、数字频率 f 与 模拟频率 f0 的关系 六、正弦序列示例 一、正弦序列 ( 数字信号 ) ---- 正弦序列 : x(n) = sin(\omega n) = sin(2 \pi f n) \omega n 是要计算正弦的弧度 , n 是一个整数值 , \omega 是角频率 , f 是数字频率 ; \omega 是角频率的单位
韩曙亮
2023/03/30
2.1K0
【数字信号处理】基本序列 ( 正弦序列 | 数字角频率 ω | 模拟角频率 Ω | 数字频率 f | 模拟频率 f0 | 采样频率 Fs | 采样周期 T )
网站抓取频率是什么,如何提高网站抓取的频率?
网站抓取频率是什么,如何提高网站抓取的频率? 每天都有数以万计的URL被搜索引擎爬行、抓取。这些URL透过相互链接,构成了我们现存的互联网关系。它在SEO日常工作中,扮演着重要的角色,并且给网站优化,
小唐同学.
2022/02/23
2.5K0
Python的频率分析和对数频谱
Python 频率分析和对数频谱 源代码 #! /usr/bin/env python # -*- coding: utf-8 -*- # __author__ = "errrolyan" # Date: 19-02-12 # Describe = "乐谱xml文件转化未为拼音” import wave import pyaudio import numpy import pylab #打开WAV文档,文件路径根据需要做修改 wf = wave.open("./wav/1弦0品+2弦0品.wav", "r
AI拉呱
2021/01/14
1.3K0
Discourse 升级的频率
请参考官方的链接:https://meta.discourse.org/t/how-do-i-manually-update-discourse-and-docker-image-to-latest/23325
HoneyMoose
2020/05/27
6560
Discourse 升级的频率
snp 频率查找
axel -S ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/release/20130502/ALL.chr11.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz
土豆pro
2020/02/17
8710
动态时钟频率
动态调整时钟频率输出,需要在 IP 界面勾选 Dynamic Reconfig选项。这时候 IP 会多出来一个 AXI-lite 的控制接口。
瓜大三哥
2020/09/22
3K0
动态时钟频率
【音频处理】音高 与 频率 对照表 ( 音符频率算法 )
手机中下载音准器软件 , 可以自动分析音频的频率 , 然后根据频率到上面的表格中查找 , 即可找到该音频对应的音高 ;
韩曙亮
2023/03/29
6.1K0
【音频处理】音高 与 频率 对照表 ( 音符频率算法 )
网站抓取频率是什么,如何提高网站抓取的频率?
网站抓取频率是什么,如何提高网站抓取的频率? 每天都有数以万计的URL被搜索引擎爬行、抓取。这些URL透过相互链接,构成了我们现存的互联网关系。它在SEO日常工作中,扮演着重要的角色,并且给网站优化,
开心分享
2020/08/06
1.7K0
Django 限制访问频率
最近做了一个系统由于部分接口需要进行耗时操作,因而不希望用户进行频繁访问,需要进行访问频率限制。如果要自己实现一个访问限制功能相对来说也不会太复杂,并且网上有各种代码可以参考。如果自己不想实现这个代码可以使用 Django Ratelimit 。
obaby
2023/02/24
1.4K0
[日常]灵活的频率限制实现
灵活的频率限制实现: 1.比如有这样的需要,当前用户,一分钟限制200次,一小时限制1000次 当前ip,一分钟限制2000次,一小时限制10000次
唯一Chat
2019/09/10
7350
获取cpu频率的代码
taskset是linux自带的一个命令,可用来将进程绑定到指定CPU 相关的函数有: sched_setaffinity, CPU_CLR, CPU_ISSET, CPU_SET, CPU_ZERO
一见
2018/08/10
2.7K0
基于Redis和配置中心的实时频率限制
如果使用网关,一般可以在网关进行限频控制;如果使用nginx,也可以使用lua+redis实现分布式限频;但是有的底层服务提供给内网其他应用调用,有的调用方本身没有对客户请求限频,所以请求都会到达底层服务。 内部应用,就不一定走网关,所以底层服务本身需要提供限频能力。 关键特性 分布式限频:依赖redis组件 不同接口不同策略:比如耗时很长的接口,频率更低 多维度策略:针对不同维度组合使用不同的限频策略,比如(uid, ip),uid 动态调整:接入配置中心,可以实现策略的动态调整和开关 实现原理 根
十毛
2021/06/29
1.2K0
[日常] nginx访问频率限制
=========================================================================
唯一Chat
2019/09/10
2.1K0
Django之频率组件
写一个类,继承自SimpleRateThrottle,(根据ip限制)问:要根据用户现在怎么写:
py3study
2020/01/20
6170
nginx 访问频率限制配置
https://blog.csdn.net/weixin_34416754/article/details/92691038
py3study
2020/12/16
2.9K0
nginx 访问频率限制配置
Nginx限制IP访问频率
最近网站经常出现假死的状态,重启nginx可恢复,但是短时间后又出现,经过排查日志发现,有一个 IP 存在过度频繁请求的情况,十分钟左右的时间请求了12000次左右,导致了服务器资源无法释放,所以产生了假死现象。
fastmock
2022/07/13
6.8K0
monit设置邮件频率和短信警报 原
当senmail 关掉后 会收到短信:localhost 192.168.16.204:25 connect failed!
拓荒者
2019/04/23
1.4K0

相似问题

python打印包含常用词或频率词的句子?

117

组合因子的频率及其逆

20

Java Hadoop排序词及其频率

15

标绘:单大列及其频率

14

计算R中的绝对频率、相对频率和累积频率

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档