首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    全国中文纠错大赛达观冠军方案分享:多模型结合的等长拼写纠错

    中文拼写检查任务是中文自然语言处理中非常具有代表性和挑战性的任务,其本质是找出文本段落中的错别字。这项任务在各种领域,如公文,新闻、财报中都有很好的落地应用价值。而其任务的困难程度也赋予了它非常大的研究空间。达观数据在CCL2022汉语学习者文本纠错评测比赛的赛道一中文拼写检查(Chinese Spelling Check)任务中取得了全国冠军,赛道二中文语法纠错(Chinese Grammatical Error Diagnosis)任务中获得了亚军。本文基于赛道一中文拼写检查任务的内容,对比赛过程中采用的一些方法进行分享,并介绍比赛采用的技术方案在达观智能校对系统中的应用和落地。赛道二中文语法纠错的获奖方案已经分享在达观数据官方公众号中。

    04

    开发丨图像处理一定要用卷积神经网络?这里有一个另辟蹊径的方法

    近年来,卷积神经网络(CNN)以其局部权值共享的特殊结构在语音识别和图像处理等方面得到了快速发展,特别是大型图像处理方面,更是表现出色,逐渐成为了行业内一个重要的技术选择。 不过,好用并不代表万能。这里 AI 科技评论从一个卫星图像分析的具体实例出发,介绍了CNN建模和本地拉普拉斯滤波这两种分析技术的效果对比,最终我们发现,本地拉普拉斯滤波的效果反而更好。 卷积神经网络 为了从卫星图像中分析和评估一项自然灾害造成的损失,首先需要得到相关地理区域实时的高分辨率的卫星图像,这是进行后续所有分析的数据基础。目

    09

    CNN 在语音识别中的应用

    本文介绍了语音识别技术中的端到端模型、基于CTC的序列模型、基于序列学习的注意力机制模型、基于3D卷积神经网络的语音识别系统等。其中,端到端模型可以直接从原始音频数据中学习到针对语音识别的抽象表示,具有较好的可扩展性和鲁棒性;而基于CTC的序列模型则通过连接主义学习的方法,将CTC定义的序列映射问题转化为神经网络中的参数优化问题,进一步提高了语音识别的准确率;基于序列学习的注意力机制模型则借鉴了语言学中的注意力机制,通过对输入序列进行加权处理,进一步提高了模型的识别准确率;基于3D卷积神经网络的语音识别系统则利用3D卷积核对输入序列进行卷积处理,提取出序列中的特征信息,进一步提高了模型的识别准确率。

    03

    Analytical Chemistry | 深度学习实现高分辨率LC-MS数据中的精确峰检测

    液相色谱与质谱联用(LC-MS)是代谢组学中最受欢迎的分析平台之一。尽管基于LC-MS的代谢组学应用程序种类繁多以及分析硬件的发展,但是LC-MS数据的处理仍然遇到一些问题。最关键的瓶颈之一是原始数据处理,LC-MS原始数据通常由成千上万的原始MS质谱图组成;每个光谱都有其自己的序列号,并且该数目随保留时间(RT)的增加而增加。这些数据通常包含数千个信号,使得手动数据处理几乎变得不可能。当前用于自动LC-MS数据处理的流程通常包括以下步骤:(1)检测感兴趣区域(ROI);(2)检测色谱峰,然后对其进行积分;(3)所有样品的峰匹配(分组);(4)通过注释相应的加合物和碎片离子将属于同一代谢物的峰聚类为一组。

    06
    领券