Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在python中生成班加罗语文本的字云?

如何在python中生成班加罗语文本的字云?
EN

Stack Overflow用户
提问于 2020-10-31 23:04:28
回答 3查看 599关注 0票数 1

我尝试了下面的代码:

代码语言:javascript
运行
AI代码解释
复制
!pip install python-bidi
from wordcloud import WordCloud
from matplotlib import pyplot as plt
from bidi.algorithm import get_display

text="""মুস্তাফিজ"""

bidi_text = get_display(text)
print(bidi_text)
# https://github.com/amueller/word_cloud/issues/367
# https://stackoverflow.com/questions/54063438/create-wordcloud-in-python-for-foreign-language-hebrew
# https://www.omicronlab.com/bangla-fonts.html
rgx = r"[\u0980-\u09FF]+"
wordcloud = WordCloud(font_path='/content/Siyamrupali.ttf').generate(bidi_text)

#wordcloud = WordCloud(font_path='/content/FreeSansBold.ttf').generate(bidi_text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()

然后我得到了这个错误:

代码语言:javascript
运行
AI代码解释
复制
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-87-56d899c0de07> in <module>()
     12 # https://www.omicronlab.com/bangla-fonts.html
     13 rgx = r"[\u0980-\u09FF]+"
---> 14 wordcloud = WordCloud(font_path='/content/Siyamrupali.ttf').generate(bidi_text)
     15 
     16 #wordcloud = WordCloud(font_path='/content/FreeSansBold.ttf').generate(bidi_text)

2 frames
/usr/local/lib/python3.6/dist-packages/wordcloud/wordcloud.py in generate_from_frequencies(self, frequencies, max_font_size)
    381         if len(frequencies) <= 0:
    382             raise ValueError("We need at least 1 word to plot a word cloud, "
--> 383                              "got %d." % len(frequencies))
    384         frequencies = frequencies[:self.max_words]
    385 

ValueError:我们至少需要一个字来绘制一个字云,得到0.

这一行不是选择班加语: wordcloud = WordCloud(font_path='/content/Siyamrupali.ttf').generate(bidi_text)

我尝试了来自这里的几乎所有用于班加语的字体:https://www.omicronlab.com/bangla-fonts.html

毫无办法

EN

回答 3

Stack Overflow用户

发布于 2021-06-04 09:51:04

在单词云中,您没有用定义的来更改。在处理单词云中的文本时,它无法匹配模式,并返回一个空列表。在创建word云对象时传递rgx变量将解决您的问题。

代码语言:javascript
运行
AI代码解释
复制
wordcloud = WordCloud(font_path='/content/Siyamrupali.ttf',regexp=rgx).generate(bidi_text)

下面是代码的完整片段。

代码语言:javascript
运行
AI代码解释
复制
!pip install python-bidi
from wordcloud import WordCloud
from matplotlib import pyplot as plt
from bidi.algorithm import get_display

text="""মুস্তাফিজ"""

bidi_text = get_display(text)
print(bidi_text)
# https://github.com/amueller/word_cloud/issues/367
# https://stackoverflow.com/questions/54063438/create-wordcloud-in-python-for-foreign-language-hebrew
# https://www.omicronlab.com/bangla-fonts.html
rgx = r"[\u0980-\u09FF]+"
wordcloud = WordCloud(font_path='/content/Siyamrupali.ttf', 
regexp=rgx).generate(bidi_text)

#wordcloud = WordCloud(font_path='/content/FreeSansBold.ttf').generate(bidi_text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
票数 2
EN

Stack Overflow用户

发布于 2021-06-17 06:12:41

我使用下面的代码在Bangla生成了一个单词云。你可以试试:

def generate_Word_cloud(self,author_post,vocabularyWordnumber,img_file,stop_word_root_path):

代码语言:javascript
运行
AI代码解释
复制
stop_word_file = stop_word_root_path+'/stopwords-bn.txt'
print(stop_word_file)
f = open(stop_word_file, "r", encoding="utf8")
stop_word = f.read().split("\n")
print(stop_word)

final_text = " ".join(author_post)
print(final_text)
wordcloud = WordCloud(stopwords = stop_word, font_path='/usr/share/fonts/truetype/freefont/kalpurush.ttf',
    width = 600, height = 500,max_font_size=300, max_words=vocabularyWordnumber,
                      min_word_length=4, background_color="black").generate(final_text)
wordcloud.to_file(img_file)
票数 0
EN

Stack Overflow用户

发布于 2021-10-14 10:56:37

我遵循这句话,最终可以解决Ubuntu中的问题。

步骤1

代码语言:javascript
运行
AI代码解释
复制
!sudo apt-get install libfreetype6-dev libharfbuzz-dev libfribidi-dev gtk-doc-tools

步骤2

代码语言:javascript
运行
AI代码解释
复制
!wget -O raqm-0.7.0.tar.gz https://raw.githubusercontent.com/python-pillow/pillow-depends/master/raqm-0.7.0.tar.gz

现在,raqm-0.7.0.tar.gz文件应该位于下载部分。

步骤3

代码语言:javascript
运行
AI代码解释
复制
!tar -xzvf raqm-0.7.0.tar.gz

步骤4

代码语言:javascript
运行
AI代码解释
复制
!cd raqm-0.7.0

步骤5

代码语言:javascript
运行
AI代码解释
复制
!./configure --prefix=/usr && make -j4 && sudo make -j4 install

步骤6

现在你只需要重新安装枕头库。激活正确的环境。然后运行以下命令:

代码语言:javascript
运行
AI代码解释
复制
python3 -m pip install --upgrade pip
python3 -m pip install --upgrade Pillow

就这样!现在您有了一个工作枕头库,可以在图像中生成正确的孟加拉文和其他印地语字体。

此外,正如@Farzana Eva在其注释中所建议的,您需要在wordcloud对象中传递rgx变量。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64629441

复制
相关文章
快速理解 Vite 的依赖预构建
当我们使用 Vite 进行开发时,会进行依赖预构建,即将第三方依赖进行打包,并在开发环境下使用这些打包过的第三方依赖。
CandyTong
2023/02/24
1.5K0
快速理解 Vite 的依赖预构建
快速理解 Vite 的依赖预构建
当我们使用 Vite 进行开发时,会进行依赖预构建,即将第三方依赖进行打包,并在开发环境下使用这些打包过的第三方依赖。
CandyTong
2022/09/04
4.2K1
git更新脚本
说明 此脚本用于更新git仓库,主要用于使用ssh克隆的仓库,使用https克隆或者直接下载的不可使用此脚本进行更新,编写此贴用于保存脚本以供后用 Linux平台 Linux平台下的脚本使用的是bash shell脚本进行编写的 #! /bin/bash ######################################## #Usage: ./update comment "msg" ######################################## echo st
impressionyang
2021/05/06
8180
hbase的预region分区 脚本 经典 转
Region是表获取和分布的基本元素,由每个列族的一个Store组成。对象层级图如下:
stys35
2019/03/05
2K0
Gradle 构建脚本
Gradle提供了一种领域特定语言,目前同时支持 Groovy 和 Kotlin 。
佛系编码
2019/12/11
9230
Gradle 构建脚本
详解 Vite 依赖预构建流程
大家好,我是码农小余。我们知道,首次执行 vite 时,服务启动后会对 node_modules 模块和配置 optimizeDeps 的目标进行预构建。本节我们就去探索预构建的流程。
码农小余
2022/06/16
4.7K0
详解 Vite 依赖预构建流程
jenkins构建时环境变量问题
which: no java in (/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin) The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME should point to a JDK not a JRE
dogfei
2020/07/31
1.1K0
ansible执行带有环境变量的脚本不生效
jenkins发布时,使用ansible执行远程主机上的启动tomcat脚本发现不生效,启动tomcat的脚本中有环境变量。
HaydenGuo
2019/12/12
2.9K0
ansible执行带有环境变量的脚本不生效
构建与部署的脚本化
构建和部署系统必须一直保持活力,即这个系统不仅要从项目刚开始就开发,而且一直要持续到软件在生产环境中的维护阶段。一定要细心地设计和维护它,像对待其他源代码一样对待它,并定期使用,以便当我们需要时,可以确保它还能运行。
新亮
2022/06/30
3550
通过bat脚本配置系统环境变量
用户3519280
2023/07/08
1.4K0
[Go]解决goland terminal 环境变量不更新
在自己的电脑修改了PATH环境变量 , 但是goland terminal不更新 goland只在开机启动的时候会去读取系统的PATH环境变量 1.可以重启电脑解决 2.手动在terminal中设置一
唯一Chat
2021/04/26
3.1K0
[Go]解决goland terminal 环境变量不更新
【综述】基于Transformer的视频语言预训练
Survey: Transformer based Video-Language Pre-training
CV君
2022/04/18
1.1K0
【综述】基于Transformer的视频语言预训练
设置系统环境变量立即生效的VBS脚本
可以设置环境变量并立即生效, 与Windows批处理不同的是此脚本设置的环境变量可保证重启后一样有用. 保存以下内容为 设置环境变量.vbs , 修改要设置的环境变量名即路径即可开始运行设置. Set pSysEnv = CreateObject("WScript.Shell").Environment("System") 'Check whether a character string matches a regular expression ' ^\w+[@]\w+[.]\w+$ E
张善友
2018/01/19
1.8K0
ddns脚本更新DNSPod的解析记录
前两天dnspod突然跟新了API,说是向下兼容旧的API,但是我软路由用的别人的脚本不能正常解析.
小柒吃地瓜
2020/04/23
5K0
Python自动更新脚本
本脚本主要针对python2.6升级至python2.7.12,并且解决了升级后不能使用yum的问题。添加了ipython功能
py3study
2020/01/07
1.2K0
[Linux][bash]更新cowsay和fortune的bash脚本
上次更新fortune自定义发现召唤cowsay的bash shell脚本有小概率的bug,就是随机脚本可能超出cows列出图形的数量,这里修补下。
用户9314062
2022/05/20
6930
config.json详解【鸿蒙专题07】
上一节我在webview的实现中,用到了几个文件夹,这是单独拎出来,做一个介绍,这样的好处就是可以使你更加容易理解一个应用的开发流程。
徐建国
2022/03/30
1.5K0
config.json详解【鸿蒙专题07】
【安德鲁斯】基于脚本的数据库&quot;增量更新&quot;,如果不改变,每次更新java代码、!
1.当然,它是基于SQLiteOpenHelper.onCreate(第一个呼叫建立)、onUpdate(当所谓的升级计划)
全栈程序员站长
2022/07/18
4760
【安德鲁斯】基于脚本的数据库&quot;增量更新&quot;,如果不改变,每次更新java代码、!
数据获取脚本重大更新
之前很多脚本都有从高德获取,某个路径(公交地铁线路、OD导航等等)。由于我自己不太常用(是的,目前的状态是既不用画图,也不用做项目,平时看书写字、想事情),所以也没有体会到最后想导进ArcGIS的艰难(特别是一条路径一条路径地导入)。
Sidchen
2021/04/13
5520
数据获取脚本重大更新
golang构建项目的脚本
说来有些悲哀,最近升级了VSCode,golang插件居然无法使用了,一直无法使用,配置了大半天,还是不行,只能提交了反馈,希望能够得到回复吧。不过突然想到一个方法,就是编写脚本,然后在本地运行,虽然
陨石坠灭
2020/01/21
1.2K0
golang构建项目的脚本

相似问题

字节、字和双字数表示

22

指向双字节的指针--即4位字节--如何指向双倍,即8位字节?

13

将双字节转换为Pascal 6字节(48位)真实格式

13

32位和64位操作系统中的双字节大小

31

检测32位双字+双字进位/ C++

24
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档