首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    从业务角度理解深度学习及其应用

    近几年,深度学习在图像、音频处理等领域得到了广泛的应用并取得了骄人的成绩,本文根据笔者的工作实践,谈谈对深度学习理解,以及我们的应用和经验。文章涉及的很多结论,是笔者个人的理解和不充分实验的结果,所以难免谬误,请读者不吝指正。 机器学习就是学习对象的表示 “机器学习/深度学习模型依靠左右互搏,可以迅速达到很高的智能水准。”、“人工智能/深度学习能毁灭人类的奇点即将来到!” 网络上经常出现这类观点,让笔者非常惊讶。而让笔者更惊讶的是,很多人居然相信了。那么,什么是机器学习呢? 机器学习的对象是我们生活中所接触

    02

    Nature Communications:社会训练通过重新配置我们的预测误差来形成对自我和他人边界的重新估计

    区分自我与他人是人类社会生活中最重要的分类之一,在社会活动中如何区分出“自我”意识和“群体”或“他人”意识直接影响了我们如何与社会其他群体产生互动,个体如何在某种文化的生态下,建立自己的分类系统和解释系统是社会心理学界研究的研究热点。一般认为,人们更倾向于使自己的信念和价值观与社会群体相一致。但是,在陈述某种信念时却不接受这些信念的行为,对于预测他人行为和参与社会互动同样至关重要(比如你遇见不相信科学的人的时候,他虽然可以和你讨论关于科学的理论,但他实际上是不相信科学的,那你们之间就会产生关于彼此价值的认同问题)。因此,有必要在自我-他人的区分和自我-他人的融合之间取得一种平衡。

    03

    AIGC席卷智慧办公,金山办公如何架构文档智能识别与理解的通用引擎?

    如今,智慧办公是企业办公领域数字化转型的题中之义。作为国内最早开发的软件办公系统之一,金山办公如何应用深度学习实现复杂场景文档图像识别和技术理解?本文将从复杂场景文档的识别与转化、非文本元素检测与文字识别、文本识别中的技术难点等多个方面进行深度解析。 作者 | 金山办公CV技术团队 出品 | 新程序员 在办公场景中,文档类型图像被广泛使用,比如证件、发票、合同、保险单、扫描书籍、拍摄的表格等,这类图像包含了大量的纯文本信息,还包含有表格、图片、印章、手写、公式等复杂的版面布局和结构信息。早前这些信息均采用

    01

    论文解读 LLaMA-Adapter V2 多模态领域又一佳作

    在本文中,我们提出了LLaMA-Adapter V2,一种参数高效的视觉指令模型。具体而言,我们首先通过解锁更多可学习参数(例如,norm、偏置和比例),增强LLaMA Adapter,这些参数在整个LLaMA模型中分布指令跟踪能力。其次,我们提出了一种早期融合策略,只将视觉token输入到早期的LLM层,有助于更好地融合视觉知识。第三,通过优化可学习参数的不相交组,引入了图像-文本对和指令跟踪数据的联合训练范式。这种策略有效地缓解了图像-文本对齐和指令跟踪这两个任务之间的干扰,并通过小规模的图像-文本和指令数据集实现了强大的多模态推理。在推理过程中,我们将额外的专家模型(例如,字幕,OCR系统)集成到LLaMA-Adapter中,以在不增加训练成本的情况下进一步提高其图像理解能力。与原始的LLaMA-Adapter相比,LLaMA-Adapter V2只需在LLaMA上引入14M参数,就可以执行开放式多模态指令。新设计的框架还展示出更强的基于语言的指令跟踪能力,甚至在聊天互动中表现出色。

    03

    哀悼!旷视首席科学家孙剑突然离世,终年45岁,曾任微软亚洲研究院首席研究员

    点击图片立刻参与! 孙剑博士,一路走好。 作者 | 镁客星球编辑部 今天凌晨,巨星陨落。 6月14日,“AI四小龙”之一的旷视科技发布讣告,旷视首席科学家、旷视研究院院长孙剑博士因突发疾病抢救无效于2022年6月14日凌晨去世。 旷视科技在讣告中表示: 我们万分难过,旷视首席科学家、旷视研究院院长孙剑博士因突发疾病抢救无效,于2022年6月14日凌晨,永远离开了我们。 孙剑博士一生专注于科研工作。他的不幸离世,让旷视失去了一位在人工智能技术领域探索和创新的领路人。每一位和他共事过的旷视同学,失去了一位智

    03

    扫码

    添加站长 进交流群

    领取专属 10元无门槛券

    手把手带您无忧上云

    扫码加入开发者社群

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭
      领券