01、GOT-OCR2.0
GOT-OCR2.0
是一款开源强大的端到端 OCR 模型,不仅支持传统的场景文本和文档识别,还能处理乐谱、图表、甚至复杂的数学公式!
模型设计采用了一个集成的 vision encoder 和 decoder,能够同时处理多种类型的 OCR 输入,从而极大提高了信息传递的效率。
尤其是在高分辨率图像处理方面,GOT-OCR-2.0 采用了 local attention 机制,以避免全局注意力机制在高分辨率图像中的内存消耗问题。
Star:3.8k
项目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
02、Maccy
Maccy
是一款轻量级的开源 macOS 剪贴板管理工具,它能帮你记录剪贴板历史,并可以快速找到之前的剪贴板内容,快捷键操作,简单快捷。
Star:12.1k
项目地址:https://github.com/p0deje/Maccy
03、DrawingSpinUp
DrawingSpinUp
是一款非常有趣的 3D 动画生成系统,它能够通过输入单一角色绘画生成高质量的 3D 动画,极大地简化了从 2D 图像到 3D 动画的制作流程。
Star:306
项目地址:https://github.com/LordLiang/DrawingSpinUp