首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    微信扫一扫有多强大?识物的技术揭秘:抠图与检索

    |  微信扫一扫识物是典型的“离线写,在线读”的业务,业务数据的存储和检索库的构建都是在离线环节完成。我们通过爬虫系统收录了小程序生态下的商品图片,下载后进行检测抠图,提取检索特征,最终构建成检索库交付到线上环境。这篇文章将主要介绍这一部分的工作。 0 什么是识物 识物是以图像或视频作为输入,用以挖掘微信生态下商品、物品等有价值等信息。这里我们基本覆盖了微信全量优质小程序电商,涵盖上亿商品 SKU,聚合了微信内的搜一搜、搜狗等资讯,最终聚合后呈现给用户。百度识图和阿里拍立淘也是基于该技术发展而来。 工程上

    04

    基于Tess4j的图片识别

    Tess4J是对Tesseract OCR API的Java JNA 封装。tesseract是跨平台的OCR(Optical Character Recognition,光学字符识别)引擎,让开发者非常容易的集成OCR能力到他们自己的应用。通过强大的API从图片中识别和提取文本内容。Tess4J支持主流的图片格式,如TIFF,JPEG,GIF,PNG,BMP,and PDF。 OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

    04

    腾讯教育联合首师大“双优云桥”助力内蒙古自治区中部片区开展统编“三科”教师培训

    为提升内蒙古地区教师的教学水平,内蒙古中部片区国家统编教材教师学科培训已开展数月。6月2日,2000余位内蒙古教师通过腾讯教育与首都师范大学“双优云桥”项目共同打造的“双优云桥-首师优字”平台,接受了“双优云桥-首师优字”中小学汉字识写教学解决方案的培训,提升了国家通用语言文字的教育教学水平。 据了解,首都师范大学“双优云桥-首师优字”中小学汉字识写教学解决方案依托于该校在书法教育领域积淀的资源,以“字理识字”与“六法”理论为基础,以匹配语文部编版教材的“硬笔、毛笔、粉笔”全套课程资源为核心,结合腾讯教育“

    03

    腾讯教育助力首都师范大学“双优云桥”在平谷区落地实施“首师优字·墨香平谷”项目

    自3月7日腾讯教育与首都师范大学“双优云桥”项目建立战略合作以来,继6月共同实施内蒙古自治区中部片区国家统编三科教材教师学科培训后,腾讯教育进一步发挥技术优势,结合首都师范大学教科研优势,持续加力“双优云桥-首师优字”中小学汉字识写教学解决方案,推动项目全覆盖实施。12月12日首都师范大学—平谷区战略合作签约仪式暨“首师优字·墨香平谷”项目启动会顺利召开,标志着腾讯教育与首都师范大学“双优云桥”合作项目迈入一个崭新的发展阶段。 首都师范大学党委书记孟繁华、平谷区区长狄涛、教育部语言文字应用管理司副司长王晖

    02
    领券