首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

用于机器视觉任务的图像压缩前处理

最近,越来越多的图像被压缩并发送到后端设备进行机器视觉分析任务(例如目标检测),而不仅仅是供人类观看。然而,大多数传统的或可学习的图像编解码器都是最小化人类视觉系统的失真,而没有考虑到机器视觉系统的需求。在这项工作中,我们提出了一种用于机器视觉任务的图像压缩前处理方法。我们的框架不依赖于可学习的图像编解码器,而是可用于传统的非可微分编解码器,这意味着它与编码标准兼容,并且可以轻松部署在实际应用中。具体而言,我们在编码器之前增加一个神经网络前处理模块,用于保留对下游任务有用的语义信息并抑制无关信息以节省比特率。此外,我们的神经网络前处理模块是量化自适应的,可以在不同的压缩比下使用。更重要的是,为了联合优化前处理模块和下游机器视觉任务,我们在反向传播阶段引入了传统非可微分编解码器的代理网络。我们在几个具有不同骨干网络的代表性下游任务上进行了广泛的实验。实验结果表明,我们的方法通过节省约20%的比特率,在编码比特率和下游机器视觉任务性能之间取得了更好的权衡。

06

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案 | 镁客请讲

图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。 我们经常会遇到这种状况,想要把图片压缩的又小又能保持图片的高清度;想要在语音聊天时保持通话流畅;想要在视频时保持视频的清晰度和流畅度…… 图鸭科技就是这样一家公司,他们主要研发图片压缩、通信传输和视频分析技术与产品。 每个起点都不简单 高起点的图像压缩技术 图鸭科技的CEO是来自上海交通大学的武俊敏。武俊敏在创立图鸭科技前曾在专门做3G手机视频直播业务的掌赢科技当过首席科学家,主要研究人脸美化和表情迁移技术。 武俊敏在掌赢科技

07
领券