继上半年刷新LUNA世界纪录并永久保持,AI作曲国际大奖赛以及ISBI眼底图分析大赛斩获三个第一之后,平安科技AI成果再攀高峰,平安科技OCR团队在图像识别领域评测比赛COCO-Text任务1文本定位比赛中的成绩排名第一。比赛队员包括肖京博士、王健宗博士、吉亚云、朱星华博士以及洪振厚。
平安票证识别通是平安科技OCR团队自主研发的文字识别技术,平安集团首席科学家肖京博士作为平安票证识别通总设计师,平安科技副总工程师王健宗博士担任产品负责人,以基于深度学习的先进算法为智能引擎,精准识别身份证、行驶证等多种卡证和票据的图像文字信息,适用于各应用场景,可以迅速提升输入效率,优化用户体验。
产品介绍请参见以上二维码或此网站:https://yun.pingan.com/ssr/smart/OCR
COCO-Text是面向全球发起的挑战赛,世界各地的优秀团队和知名公司参与了此次比赛,此次比赛基于真实场景图像,围绕三个任务主题(Text Localization、Cropped Word Recognition、End-to-End Recognition)展开激烈竞争。
大赛提供63,686张图片,按比例用于训练、验证和测试,与许多其它场景文本数据集不同的是,COCO-Text的某些图像根本不包含文本,图像是在不考虑文本的情况下收集的,图像选择的随机性无疑加大了比赛的难度,对参赛者是一个不小的挑战。最终评估指标将平均精度(AP)视为主要评测度量,对算法适应性有极高要求。
平安科技OCR产品团队在此次比赛中挑战的主题是从真实场景图片中提取文字信息,该主题的研究价值巨大,对人工智能在地图导航、智能交通、信息检索、机器视觉等领域的发展有较强推动作用,具有广阔的应用空间和重要的研究意义。此任务相对于标准化规范文本信息提取难度更大,对真实场景图像进行文字信息提取的课题,面对着图像背景复杂,图片内容随机性强,图像分割算法要求高等诸多问题与挑战。平安科技OCR团队以在图像识别领域所积累的深厚经验为基础,针对大赛的第一项任务进行深入研究,采用前沿技术架构,多种算法进行数据增强,其中历经多次实验与参数调整,目前以平均精度(AP)68.61%勇夺第一。
目前参赛的团队中,最高成绩是平安科技OCR团队,平均精度(AP)高达68.61%。其余团队包括有:第二名Sogou团队,AP 68.45%; 第四名三星R&D团队,AP 66.30%;第五名上海交通大学,AP64.67%;第七名腾讯团队,AP 61.95%,以及其他国内外重要公司和学术机构团队。
COCO-Text测评成绩排名(PATech-AILab为平安科技)
这次比赛平安科技再次登顶世界第一,充分证明了平安在AI图像领域领先的实力,这些屡获大奖背后后,体现着平安人的脚踏实地与不断进取,着眼与当前需要解决的实际问题,体现了平安科技在人工智能领域不懈探索的执着精神,专注于助力国家人工智能发展战略的突破。
领取专属 10元无门槛券
私享最新 技术干货