首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

小白用自己游戏本训练方言分类AI识别模型

就萌生了个训练方言识别是哪里人的想法,当然,相比方言意思识别简单超多的还是。这里还是佩服国家队的中国电信,开源了30种方言的大语言模型。于是,我也决定利用开放的数据集训练个分类模型玩玩。...不小心发现了一个开箱即用的,于是,折腾起来:yeyupiaoling/AudioClassification-Pytorch 代码准备 就严格按照作者的python版本等进行的,没有例外,开源软件的版本兼容是令人一言难尽的...我是win11,不过git这种操作用的是WSL2进行的。...数据下载 经过选择,最终是用了这个KeSpeech,不过后面发现,我直接用的这个repo也是有个方言数据集3dspeaker_data可用的。不过下载一个已经用去几百G的空间,不想再下第二个啦!...测试和训练集的截取划分 我的数据准备过程比较傻瓜,直接用最基本的AI辅助编码写了两个脚本实现的,简单的说就是读取两个文本文件内容,建立两个字典,然后匹配,抽取前1200条数据,生成训练集,再抽取200多用于测试集

20110

Wikipedia的方言版本

今天,我惊奇地发现,wikipedia竟然有方言版本。...wikipedia是一个严肃的网站,而方言版接近于戏谑和恶搞,根本没有实用价值。希望能够废除这种做法。 举例来说,文言版的新闻页面是这样写的: # 津巴布韋大疫已四月,亡者四百餘。...在所有方言中,我只能看懂吴语版。但是,它更恶心,请看德国著名诗人里尔克的条目。 里尔克 (1875年养勒奥匈帝国个布拉格)是二十世纪顶顶有名个德语诗人之一。...这完全是苏州俚语,非常的粗俗,简直不堪入目。 也许很快,上海话版本就会出现。而且,一个版本还不够,因为市区的上海话,同川沙和南汇的上海话不一样,可能要三四个版本才够。...[相关链接] * wikipedia的265种语言版本一览表 * 申请开设新语言版本的官方指南 (完)

1.5K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    科大讯飞:智能语音识别率高达98%,支持22种方言

    全方位展示+深度解读关于智能营销,那些你不知道的事…… 2017年人工智能领域一大关键词——“语音” 2017年,“语音”成为人工智能领域的一大关键词,也将会是下一代人机交互的主要方式。...对于广告而言,语音交互广告拥有着超越传统广告形式的巨大潜力。 众所周知科大讯飞的智能语音技术处于全球领先的水平,以讯飞输入法为例,今年语音识别的准确率提高到了98%,并支持22种方言。...基于科大讯飞领先的语音合成、语音识别、语义理解技术,语音互动广告、明星合成广告、视频互动广告和H5互动广告都开始被广泛应用。...受众在展示的广告界面说出语音指令,经后台识别处理,与广告主设置的营销信息相匹配后进行反馈,让广告能听会说会思考。...流量甄别平均响应时间为5ms,在已知无效流量集上综合识别准确率达98%。

    4.2K60

    《鸿蒙Next:让人工智能语音交互听懂每一种方言和口音》

    在智能科技飞速发展的今天,鸿蒙Next系统中的人工智能语音交互技术正逐渐成为人们生活中不可或缺的一部分。然而,不同地区的方言和口音差异却给语音交互带来了巨大的挑战。...那么,鸿蒙Next上的人工智能语音交互技术是如何提高对不同方言和口音的识别能力的呢?...引入语音合成技术辅助识别- 生成标准方言语音样本:利用语音合成技术,根据方言的语音特征和语法规则,生成标准的方言语音样本,用于扩充方言语音数据集,增加语音识别模型对方言的学习和理解。...- 针对性优化:开发团队根据用户反馈的问题,对语音识别模型进行针对性的优化和改进,不断提升其对方言和口音的识别性能。...通过以上多种技术手段的综合应用,鸿蒙Next上的人工智能语音交互技术在提高对不同方言和口音的识别能力方面取得了显著的进展。

    12100

    常用的表格检测识别方法-表格内容识别方法

    常用的表格检测识别方法3.3 表格内容识别方法表格识别的研究主要涉及两个方面,一方面是对单元格内的文本进行识别,这一步通常是在确定单元格区域后,利用较为稳定的光学字符识别方法(OCR)来实现,这一方面不是表格识别研究的重点...Carbonell还提出了一种基于CNN的方法,即从输入的文档图像中联合进行手写文本检测、转录和命名实体识别。除了这个范式之外,信息抽取也可以作为其他问题来表述。...它构建了一个以文本段和字段作为图节点的依赖图,然后使用解码器从识别的图节点之间的连通性中提取字段值。...这些方法从光学字符识别(OCR)的角度解决了信息抽取任务。对于每一种类型的实体,这些方法设计了相应的解码器,负责识别文本内容并确定其类别。由于缺乏语义特征,这种方法在面对复杂的布局时不能很好地工作。...总的来说,近年来国内外研究者对表格内容识别都非常关注,这一领域的方法也呈现出多元化发展的态势。

    54320

    语音识别-人工智能的重要手段

    如今人工智能大热,不管什么行业都会联想到人工智能,当年的PC时代,到现在的移动时代,主要还是靠文字搜索,显然,文字搜索的效率和局限性相比语音差了很多。...所以,在人工智能时代来临之际,语音识别技术将成为先驱。 语音识别技术,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。...语音识别的目的就是让机器赋予人的听觉特性,听懂人说什么,并做出相应的动作。 现在越来越多的APP搜索支持语音,而且准确率也越来越高。...从互联网诞生之日起,搜索框便成为人们进入互联网的重要入口,但语音识别一经出现,搜索框的地位受到动摇,在未来或将逐步被取代。...不知道未来我那一口不标准的普通话能否精确翻译呢? 另外,哪里的方言最考验语音识别技术呢?

    1.1K20

    常用的表格检测识别方法——表格内容识别方法

    第三章 常用的表格检测识别方法3.3表格内容识别方法 表格识别的研究主要涉及两个方面,一方面是对单元格内的文本进行识别,这一步通常是在确定单元格区域后,利用较为稳定的光学字符识别方法(OCR)来实现,...这一方面不是表格识别研究的重点,不在此展开;另一方面是基于整个表格内容进行的表格分类、单元格分类、以及表格信息抽取等任务,这是当前表格识别研究的热门领域之一。...Carbonell还提出了一种基于CNN的方法,即从输入的文档图像中联合进行手写文本检测、转录和命名实体识别。除了这个范式之外,信息抽取也可以作为其他问题来表述。...这些方法从光学字符识别(OCR)的角度解决了信息抽取任务。对于每一种类型的实体,这些方法设计了相应的解码器,负责识别文本内容并确定其类别。由于缺乏语义特征,这种方法在面对复杂的布局时不能很好地工作。...总的来说,近年来国内外研究者对表格内容识别都非常关注,这一领域的方法也呈现出多元化发展的态势。

    43210

    常用的表格检测识别方法——表格结构识别方法(上)

    第三章 常用的表格检测识别方法3.2表格结构识别方法 表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。...与表格区域检测任务类似,在早期的表格结构识别方法中,研究者们通常会根据数据集特点,设计启发式算法或者使用机器学习方法来完成表格结构识别任务。...A Zucker提出了一种有效的方法CluSTi,是一种用于识别发票扫描图像中的表格结构的聚类方法。CluSTi有三个贡献。首先,它使用了一种聚类方法来消除表格图片中的高噪声。...S Raja提出了一种识别表格结构的方法,该方法结合了单元格检测和交互模块来定位单元格,并根据行和列预测它们与其他检测到的单元格的关系。此外,增加了结构限制的损失功能的单元格识别作为额外的差异组件。...C Ma提出了一种识别表格的结构并从各种不同的文档图片中检测其边界的新方法。

    1.3K30

    常用的表格检测识别方法——表格结构识别方法 (下)

    常用的表格检测识别方法——表格结构识别方法(下)3.2表格结构识别方法 表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。...与表格区域检测任务类似,在早期的表格结构识别方法中,研究者们通常会根据数据集特点,设计启发式算法或者使用机器学习方法来完成表格结构识别任务。...A Zucker提出了一种有效的方法CluSTi,是一种用于识别发票扫描图像中的表格结构的聚类方法。CluSTi有三个贡献。首先,它使用了一种聚类方法来消除表格图片中的高噪声。...S Raja提出了一种识别表格结构的方法,该方法结合了单元格检测和交互模块来定位单元格,并根据行和列预测它们与其他检测到的单元格的关系。此外,增加了结构限制的损失功能的单元格识别作为额外的差异组件。...C Ma提出了一种识别表格的结构并从各种不同的文档图片中检测其边界的新方法。

    2.9K10

    人工智能之头像识别

    图像识别是人工智能的一个重要方面,下面通过一个简单列子进行练习: 随着圣诞的到来,大家纷纷@官方微信给自己的头像加上一顶圣诞帽。当然这种事情用很多P图软件都可以做到。...但是作为一个学习图像处理的技术人,还是觉得我们有必要写一个程序来做这件事情。而且这完全可以作为一个练手的小项目,工作量不大,而且很有意思。 我们用下面这张图作为我们的测试图片。...用dlib的正脸检测器进行人脸检测,用dlib提供的模型提取人脸的五个关键点。代码如下: #!....circle(img,(point.x,point.y),3,color=(0,255,0)) # cv2.imshow("image",img) # cv2.waitKey() # 选取左右眼眼角的点...mask mask = cv2.resize(a,(resized_hat_w,resized_hat_h)) mask_inv = cv2.bitwise_not(mask) # 帽子相对与人脸框上线的偏移量

    2.5K100

    人工智能中的图像识别技术

    伴随着图像处理技术的飞速发展,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要的组成部分,并广泛地运用于面部识别、指纹识别、医疗诊断等等领域中,发挥重要作用。...图像识别技术概述 图像识别技术的含义 图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。...图像识别技术的过程 由于图像识别技术的产生是基于人工智能的基础上,所以计算机图像识别的过程与人脑识别图像的过程大体一致,归纳起来,该过程主要包括4个步骤: 1是获取信息,主要是指将声音和光等信息通过传感器向电信号转换...为使计算机的图像识别性能更为高效,采用随图像降维方法就是一种最直接而有效的方法。...小编相信,通过本次的科普,很多同学都对图像识别有了更深的理解,希望可以拓宽同学们的思路,利用人工智能的图像识别技术解决更多问题,造福社会,造福世界!

    2.6K10

    X# 点滴(六):Visual FoxPro 方言的“设置”

    虽然我很赞赏,有枣没枣先打三杆子的勇气,但是,作为程序员,如果要真正的掌握一门语言,帮助是基础,也是遇到问题时首先查看的重要文档。...因为 X# 支持好几种 XBASE 方言,所以,在对其懵懵懂懂的时候,最好是按“套路”来,使用 VS IDE 中提供的 Visual FoxPro 模板,基于它,练习“套路”,甚至“散打”。...在使用模板创建了 X#(Visual FoxPro 方言)的项目之后,我们首先需要设置项目的属性。但是,我们在其中看到的大多数是英文.........这些设置,是为了在交互模式下编译时告诉 X# 的编译器,它应该使用哪些参数,换句话说,就是告诉他,你在使用哪种方言,让其对它更好的“兼容”。...这里是未来版本可能会包含的帮助内容: 其中,对 Visual FoxPro 方言最最重要的是“允许老式赋值”(突然发现,旧式,更贴切)、“允许内存变量支持”和“允许未声明变量支持”。

    7410

    python进阶——人工智能视觉识别

    前言 python在人工智能方面可以毫不客气的说,比其他的所有语言都要有优势,因为python的背后有一个非常强大的资源库来支撑着python运作。...opencv库 opencv是最经典的python视觉库,它里面包含了很多种视觉的识别类型供开发者们使用。...opencv库的下载 我们可以在我们的pycharm里面输入以下代码进行下载,但这里我们下载的是阉割版的。...只需要记住安装在哪里,当我们使用的时候直接调取我们的安装目录就可以!) 当安装完成之后,我们就可以看到安装路径下的这些文件:  里面包含眼睛识别,面部识别等一些强大的识别算法!...: recogizer.read('tupian/tupian.yml') 定义名称数组: names=[] 识别全局变量定义: warningtime = 0 识别视频中人脸模块: def face_detect_demo

    31930

    python人工智能-图像识别

    PIL:(Python Imaging Library)是Python平台上的图像处理标准库,功能非常强大。 pytesseract:图像识别库。...错误提示的很明显: No such file or directory :”tesseract” 这是因为我们没有安装tesseract-ocr引擎 二、tesseract-ocr引擎 光学字符识别...国外OCR发展较早,像一些大公司,如IBM、微软、HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的软件系统。...Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。...0:定向脚本监测(OSD) 1: 使用OSD自动分页 2 :自动分页,但是不使用OSD或OCR(Optical Character Recognition,光学字符识别) 3 :

    3.3K40

    python实现人工智能识别水果

    2.卷积模型搭建:采用keras搭建模型,卷积层、池化层、Dropout层、全连接层、输出层 3.模型训练把数据集在建立的模型上进行训练,并把最好的模型保存到h5文件中,便于直接对模型进行测试。...测试前代码: from keras.applications.resnet50 import ResNet50 #//导入AI软件平台keras 里的AI模型 ResNet50 from keras.preprocessing...np #//载入模型 model = ResNet50(weights='imagenet') #//使model指向ResNet50模型 img_path = '鸟.jpg' #//等待识别的图像...(可用车,水果等),注:需把图片放该代码的同目录下 img = image.load_img(img_path, target_size=(224, 224)) #//载入图像 #//-图像的预处理...,第二个是字体大小 font = ImageFont.truetype('msyh.ttc', 30, encoding='utf-8') # 第一个参数是文字的起始坐标,第二个需要输出的文字,第三个是字体颜色

    1.2K61

    换了30多种方言,我们竟然没能考倒中国电信的语音大模型

    实际上,这件事已经有人做了:近日,中国电信人工智能研究院(TeleAI)发布了业内首个支持 30 种方言自由混说的「星辰超多方言语音识别大模型」,可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型...比如在以下这个会议场景中,面对多种方言的输入,星辰超多方言语音识别大模型的识别准确率达到业界领先。...在中国电信 CTO、人工智能研究院院长李学龙带领下,TeleAI 自主研发了星辰语音识别大模型。...其中的表征离散化方法,可以让模型在保留语音中任务相关信息的同时,去除其余不相关信息,达到降低语音推理传输比特率、减少内存使用、提升训练效率的目的,同时也为语音多任务(如 ASR、TTS、说话人识别等)统一模型构建...沿着近年来人工智能的技术发展趋势,我们可以看到,在实现通用人工智能的过程中,语音是关键的一部分,而语音识别是其中非常重要的一环。

    17510

    未识别的网络的原因 未识别网络的解决方法

    相信会有很多的网友遇到过一个问题,就是明明已经连接了路由器,却显示出一个黄色的小感叹号,互联网就无法正常使用了。再点击开关于网络连接的页面之后会显示未识别的网络。...那么在大家遇到这种情况的时候,会如何解决呢?下面就来为大家带来一些实用的解决方法。 image.png 一、未识别的网络的具体原因 首先在了解解决方法之前,先要知道这是如何产生的。...这个原因虽然简单,却也是最常见的网络故障原因之一。第二种原因就是猫或者是路由器出现了故障,导致电脑系统无法为识别出路由器的有关信息,进而导致了电脑查找不到有效的IP地址。第三种原因就是电脑出现了问题。...二、实用的解决方法 对于第一种原因导致的网络未连接,就只需要到指定的营业厅进行缴费即可。对于第二种原因,就需要将路由器进行重启。如果还是解决不了问题的话,就需要去联系有关的专业人士进行检查了。...第三种原因则是需要对电脑的IP地址进行手动的调试。只需要找到调试页面,对IP地址进行手动调整即可。 通过以上的分析讲解,相信大家已经对未识别的网络的原因有了一定的了解。

    7.2K20
    领券