首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 如何获取汉字笔画数?

    如果只是特定个别汉字,我们大可以硬编码一个字典在脚本中,但是如果想获取任意一个汉字笔画数呢? :")strokes = get_strokes_count(character)print("汉字'{}'的笔画数为:{}".format(character, strokes))尝试了一下,发现得到的结果实际上是该汉字在 在其在线查询工具Unihan Database Lookup中进行检索,发现查询结果中存在kTotalStrokes字段,即为所需的笔画数数据。 作为unicode的官方数据库,目前版本完全满足基本的汉字查询。Nice! 离成功更进了一步! 在regex101中测试正则,取出要的unicode部分和笔画数部分,单独存成文件, 以供查询.编码提取笔画信息file = Path("Stroke/Unihan_IRGSources.txt")output

    55700编辑于 2024-12-22
  • 来自专栏前端实验室

    这个老外竟然开发了一个汉字笔画

    今天给大家介绍一个开源的汉字库,里面提供了大量精确的汉字笔画数据,可以通过手绘模仿的方式来学习和练习书写汉字——hanzi-writer Hanzi Writer Hanzi Writer 是 javascript 免费开源库,根据汉字书写时按照笔画顺序的特征,可以播放正确笔画顺序的描边动画和练习测试。 可以让全球用户能够通过手绘模仿的方式来学习和练习书写汉字。 特点 丰富性: 包含9000+个常用汉字笔画数据,覆盖广泛。 准确性: 笔画轨迹详细且精准,模拟真实书写体验。 , { width: 100, height: 100, padding: 5, showCharacter: false, //不显示汉字 onComplete: function () { //动画结束的回调 console.log("动画结束"); }, }); 分布绘画 调用animateStroke方法,传入笔画

    1.7K10编辑于 2024-05-10
  • 来自专栏程序员小助手

    电脑编程是0和1表示了字母,为何不用0和1表示汉字笔画

    ---- 举几个例子: ANSI: 没有对汉字编码,不认汉字。 UTF-8:支持世界上大多数的语言字符,汉语,德语,日语,俄罗斯语字符。都给你指定好了,用的时候查字典就对了。 Unicode:解析出来汉字“中国”长这样:“\u4e2d\u56fd”。为啥是这个?国际上编码好了。 还有那么多emoji,你说有的地方认,有的地方不认,为什么?查字典,字典里没有,当然就认不出。 ---- 说了一串字符编码的问题,还没有说到“用汉字编写电脑系统和软件”! 未来在你手中,加油! 以上。

    66610发布于 2020-04-08
  • 来自专栏深度学习之tensorflow实战篇

    自然语言处理算法之cw2vec理论及其实现(基于汉字笔画

    单个英文字符(character)是不具备语义的,而中文汉字往往具有很强的语义信息。不同于前人的工作,我们提出了“n元笔画”的概念。 所谓“n元笔画”,即就是中文词语(或汉字)连续的n个笔画构成的语义结构。 问题与挑战: 自然语言处理的顶级会议ACL 2017,共提出了未来的四大研究方向,如何更好的利用“亚词”信息就是其中的一个。 通过观察中文字符内部组成,发现中文字符包含偏旁部首、字符组件,笔画信息等语义信息特征(如下图),基于偏旁部首和汉字组件特征的中文词向量模型已经有人提出,并取得了较好的效果。 ? 那么“大人”这个词的笔画信息就可以表示为: 大人: 一ノ丶 ノ丶 大人:13434 我从训练语料中获取到13354个汉字,并获取笔画信息,统计笔画种类和上图一致,只有5种笔画信息。 参考资料: word2vec提出了CBOW和Skip-Gram两个模型 cw2vec 一个c++版本的cw2vec github代码: 汉字相关 汉字字典抽取笔画 对比分析 参考文献:

    1.3K30发布于 2019-01-25
  • 来自专栏大大的小数据

    汉字的使用频率2024.4.15

    :param char: 单个汉字字符串 :return: 汉字笔画数 """ if 0x4E00 <= ord(char) <= 0x9FA5: # 检查是否汉字范围内 return int(chinese_char_map.get(char, '汉字不存在')) else: return '非汉字字符' # 用户输入汉字,获取笔画数 def get_strokes(char: str) -> int: """返回单个汉字笔画数量""" return chinese_char_map.get(char, '汉字不存在 8、画折线图 汉字出现最多的是13画 9、本来我想先学习笔画最少的汉字,为什么汉字笔画少的不给予最常用的意义呢? 11、统计1千个常用汉字(90%)内的4笔画内的汉字,可以打印出来学习了,共115个字 12、下一步:查询相关识字、甲骨文、图画识字的书籍,思维导图绘制

    58711编辑于 2024-04-17
  • 来自专栏机器学习AI算法工程

    CNN-RNN-CTC 实现手写汉字识别

    我们知道,脱机汉字识别的对象是方块汉字的图形,用于识别的特征是根据汉字图形提取的,因而字形变化对识别结果具有决定性的影响。 手写汉字的一些特点: ①基本笔画变化。 我国手写汉字笔画大都不具备上述的特点:横不平、竖不直,直笔画变弯,折笔的拐角变为圆弧,等等,例如,“品”字的三个“口”变成三个圆圈,“阝”变成“”;有时把较短的笔画变为“点”,有时则在起笔或折笔的拐角处增加额外的 方块汉字字形是一种艺术,书写时要求笔画及部件的形态和相互关系,尽量彼此协调,使整字字形结构匀称美观,因此上述笔画与部件的大小、位置变化,客观上是不可避免的。 笔画长短、部首大小及位置等的变化,使我们难以仿照印刷体汉字识别的办法事先确定它们的位置,按规定区域提取笔画或部首特征。 因此,对用于计算机自动识别的手写汉字应有所要求。具体地说,对构成汉字笔画及其相互关系,应有必要的规定和限制,不能无约束地随意书写。这种字叫做“限制性手写汉字”。

    5.2K22发布于 2019-10-28
  • 来自专栏机器学习AI算法工程

    cw2vec:蚂蚁金服公开最新基于笔画的中文词向量算法

    单个英文字符(character)是不具备语义的,而中文汉字往往具有很强的语义信息。不同于前人的工作,我们提出了“n元笔画”的概念。 所谓“n元笔画”,即就是中文词语(或汉字)连续的n个笔画构成的语义结构。 问题与挑战: 自然语言处理的顶级会议ACL 2017,共提出了未来的四大研究方向,如何更好的利用“亚词”信息就是其中的一个。 通过观察中文字符内部组成,发现中文字符包含偏旁部首、字符组件,笔画信息等语义信息特征(如下图),基于偏旁部首和汉字组件特征的中文词向量模型已经有人提出,并取得了较好的效果。 ? 词语:大人 分割为:(1)大 (2)人 2、 笔画特征 获取中文字符的笔画信息,并且把字符的笔画信息合并,得到词语的笔画信息。 那么“大人”这个词的笔画信息就可以表示为: 大人:一ノ丶 ノ丶 大人:13434 我从训练语料中获取到13354个汉字,并获取笔画信息,统计笔画种类和上图一致,只有5种笔画信息。

    1.4K20发布于 2019-10-28
  • 来自专栏新智元

    谷歌大脑研究员玩转汉字RNN:神经网络生成新华字典

    谷歌大脑东京分部的研究员hardmaru,用神经网络根据笔画生成汉字,新造了一系列“假汉字”。你别说,有些看上去还真像那么一回事。 汉字这个系统本质上是开放的。使用可用的元素(偏旁部首、笔画等等),可以制作出无数个不同的字符。 虽然代码目前还不能很准确地定位笔画的位置,但hardmaru实验中的一些结果,看起来非常像真实存在的汉字。 ? hardmaru实现的是一个生成“新造”汉字的网络sketch-rnn,与Graves手写体生成模型框架(见下)类似。 ? 用于训练的数据是真实的汉字,并且包含了笔画顺序。 因此,神经网络生成的汉字看上去也是按照一定程度上合理的笔画顺序来的。 ?

    95000发布于 2018-07-31
  • 来自专栏前端杂货铺

    汉字数组排序及如何检测汉字

    恰好有一栏的数据全部是中文汉字,如果仅仅对于汉字数组使用默认的sort排序,那么是针对汉字的unicode值进行比较排序,结果肯定与我们习惯的根据汉字的拼音排序大不相同。 这样,针对汉字数组,我们就很容易来实现本地化比较。 Chs.sort(function(a,b){ return a.localeCompare(b); }); 监测汉字 由于汉字在当前的系统中都是 unicode编码,因此可以使用unicode码值来判断是否是汉字汉字在unicode的范围是\u4E00-\u9FFF,因此可以使用正则来判断。

    2.8K30发布于 2018-03-15
  • 这个汉字工具库让中文处理变得超简单,开发者必备!

    cnchar 是一个功能全面的汉字工具库,提供拼音转换、笔画动画、偏旁查询、成语接龙、语音合成等20+种实用功能。 为什么你需要这个汉字工具库? 在开发中文类应用时,我们常会遇到这些痛点:汉字转拼音要考虑多音字笔画动画需要复杂SVG绘制成语数据需要维护庞大词库语音合成涉及复杂音频处理 cnchar 的出现完美解决了这些问题! 汉字结构可视化// 生成结构图cnchar.stroke('汉', { type: 'stroke', // 显示笔画顺序 animation: true, // 启用动画 color: ' 汉字笔画3.

    35310编辑于 2025-04-20
  • 来自专栏量子位

    神经网络造“汉字”新技能全开,biangbiang面自愧不如

    最近,谷歌大脑研究员David Ha做了个让神经网络和你一起写“汉字”的网页版Demo。你在页面上写几笔,神经网络会根据你写出来的部分,补完一个“汉字”。 我们起码可以看出,这个模型是用循环神经网络来预测下一笔该写什么、写在哪的; 其次,David Ha在Google参与的一项大工程,就是那个让你教机器画简笔画的Sketch-RNN,他之前在GitHub上发布的旧版 总之,这应该是一个以Sketch-RNN的JavaScript实现为基础,用KanjiVG训练的卷积神经网络,与之前广受欢迎的Google神经网络画简笔画系列同宗同源。 ? 一是因为它并不会真的用你的笔画匹配真正的汉字,而是根据你的笔画“创造一个像汉字的图形”,很多时候写出来的都实在不像字;另一个原因呢,就在它的名字Kanji-RNN,和数据集KanjiVG里。 sketch-rnn-js/README.md 很久以前的Sketch-RNN代码: https://github.com/hardmaru/sketch-rnn/ 如果你不知道量子位说的“Google用神经网络画简笔画

    51210发布于 2018-07-20
  • 来自专栏数据处理与分析

    汉字转拼音

    汉字转拼音 1、前言 FME的功能已经足够强大,在FME丰富的数据格式与众多转换器的支持下,我们可以完成很多复杂的工作。但是如果能使用Python来对其进行进一步的功能扩展的话,将会使FME更加开放。 在做完第一步的准备工作后,需要安装汉字转拼音的包pypinyin 如下图,安装所需包 ? 这样,就基本完成了环境的配置,我们可以进行下一步的操作。

    4.4K20发布于 2019-07-31
  • 来自专栏腾讯大讲堂的专栏

    变体美术字设计手册

    汉字的基本笔画笔画形状 笔画是汉子的最小构成单位,也是变体字设计中的核心,我们从汉字的基本笔画汉字笔画形状入手来了解变体美术字。 1. 汉字的基本笔画 汉字的基本笔画即「永」 字的八笔画,这是基于「永」 字八法产生的,它是古代书法家练习楷书的运笔技法,因为「永」 字的笔画每笔各有特色,而又互相呼应,故可将其作为评判楷书水平的标准,同时也是评判一个字体的基础标准 汉字笔画形状 汉字笔画形状主要是指笔画在起笔、收笔以及折处的特点,有「方、尖、圆、曲线」四种,曲线是比较特殊,它的起笔、收笔可以是 「方尖圆」,但它的笔画结构一定会产生扭曲变形。 学会辨别汉字笔画形状对之后 「看」 或者「做」变体美术字都是很重要的。 ? 注意:不要被某些笔画本身的特点误导,为了更容易理解,举个英文的例子。 ? 从汉字的基本笔画笔画形状入手进一步了解变体美术字。 三. 变体美术字的四种类别 1.

    1.2K80发布于 2018-02-11
  • 来自专栏历史专栏

    【愚公系列】2023年06月 网络安全(交通银行杯)-疑惑的汉字

    ---- 前言 当铺密码通常使用汉字来隐藏信息,专门用来加密数字,不需要密钥,明文信息包含在加密后的密文中。 较常见的当铺密码有两种,一种是将数字映射到对应笔画汉字,另外一种是利用汉字的字形特征,当前汉字有多少笔画出头就转化成数字几。 一、疑惑的汉字 1.打开题目 2.解题 由笔画数可得: 王夫 井工 夫口 由中人 井中 夫夫 由中大(67 84 70 123 82 77 125) ASCII码表转化为字符 flag:CTF{RM

    41310编辑于 2023-04-21
  • 来自专栏怪兽怪秀

    photoshop 普通图片修改成简笔画

    第一步:用ps打开自己想要制作简笔画的图片。

    2.7K20编辑于 2022-10-04
  • 来自专栏算法与编程之美

    PS|制作工笔画效果

    中国风盛行下,照片制作成工笔画效果也非常的受欢迎,工笔画效果给人的感觉就是非常的古风,有意境,非常漂亮。例如前段时间大火的《知否》。 ? 下面我们一起来看看如何将一张人物摄影处理成中国工笔画的风格吧! 1.首先在ps里打开图片,复制背景图层,将复制的背景图层通过Ctrl+Shift+U去色 ?

    63320发布于 2020-09-08
  • 来自专栏Windows Community

    UWP 手绘视频创作工具技术分享系列 - 文字的解析和绘制

    虽然能准确的勾勒出文字,但是缺点也很明显,首先 ttf 路径是文字的边缘路径,换句话说它是围着文字的周边描绘的,而不是正常的笔迹;其次 ttf 中的路径是完全没有顺序可言的,完全没有正常笔迹构成的文字笔画和笔顺 之所以不做汉字的适配,一方面是 VideoScribe 并没有重点推广中国市场,最主要的还是,汉字远比英文的情况复杂,汉字常用字就超过 3500 个。 虽然它们都是由固定的十几个偏旁部首组成的,也有一些途径可以拿到每个汉字笔画和笔顺,但是想得到某个汉字的每个笔画的相对位置,就没有办法了,所以想按照部首来组成汉字的路径,也就行不通了,这也是我们目前遇到的瓶颈 我们目前正在尝试的方式是:     ① 通过一些合作网站获取的一种正规字型的字体的路径数据,如微软雅黑这种没有笔画附加路径的字体,我们称为基础路径     ② 获取常见汉字的笔顺和笔画组成     ③ 对于每种字体,准备十几个部首的路径数据,覆盖所有汉字,我们称为部首路径     ④ 绘制时针对每个汉字,先取得笔顺中对应的笔画,对应取得基础路径中对应笔顺的起点,在从部首路径中取得对应部首。    

    1.3K80发布于 2018-04-28
  • 来自专栏TEL18600524535

    端到端学习:深度学习如何攻克汉字手写体识别技术难题

    去噪与平滑:使用滤波器去除图像中的噪点、划痕,平滑笔画边缘,提升图像质量。校正:对书写倾斜的图像进行旋转校正,使得文字处于水平位置。2.特征提取(核心):预处理后的图像被送入CNN模型。 CNN通过多层卷积层、池化层和激活函数,自动学习汉字的层次化特征。底层特征:最初的卷积层捕捉笔画边缘、角点、端点等局部特征。 中层特征:中间层将底层特征组合成更复杂的结构,如横、竖、撇、捺等基本笔画组件。高层特征:深层网络最终将这些笔画组件整合,形成能够代表整个汉字或部首的抽象特征表示。 最终,通过一个Softmax分类器输出一个概率分布向量,向量的每一个维度对应一个候选汉字(如3755个一级国标汉字或更庞大的字符集)。概率最高的那个汉字即为模型的识别结果。 书写风格多变:不同人的书写风格千差万别,包括笔画粗细、倾斜度、连笔、简写等。同一人在不同时间、不同心境下的字迹也可能不同,要求模型具有强大的泛化能力。

    19510编辑于 2025-09-12
  • 来自专栏从入门到出门

    汉字转拼音

    97710编辑于 2024-07-20
  • 来自专栏博客屋

    八款免费可商用现代科幻潮流高级黑字体合集

    包含 3755 个一级汉字、200 余个常用二级汉字以及英文大小写字母、阿拉伯数字和标点符号。对个人及企业终身免费授权,可用于商业用途,如广告设计等。 字体将复古感受融入笔画,大部分笔画末端有尖角外挑,结构转角采用非正圆倒角,具有独特的风格。创客贴金刚体由创客贴倾力打造,最初为支援抗击疫情而诞生。 基于 GB2312-80 字符集标准,包含大陆简体汉字 6763 个、繁体中文 16 个、英文大小写 52 个、阿拉伯数字 10 个以及 682 个符号。 为笔画较粗的大字重字体,90% 的大字面率,大中宫设计,笔画细节采用非常规的圆弧设计和倒角设计,弯勾笔画采用大曲率圆弧曲线,折笔笔画采用内直外弧的倒角方式,还借鉴了行书中连笔书写的精髓和笔锋的概念,搭配有几何风格的西文字符 Plix 普力士Plix普力士・潮流黑体|免费商用|人文风mix机械感Plix普力士是一款基于IBM Plex Sans汉字系列修改,可显示简体字。

    86421编辑于 2025-05-30
领券