暂无搜索历史
Face Vid2vid是一个基于视频驱动的肖像动画生成框架。它的工作原理是从驱动视频中提取运动特征,并将这些特征应用于静态肖像图像上,以生成连贯的动画效果。F...
⚡[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney
一致性模型(CM)是一种新兴的生成模型,以高质量和快速生成著称。然而,当一致性模型被应用于潜在空间中的高分辨率、文本条件的图像生成时(即潜在一致性模型,Late...
本文提出的方法RB-Modulation(Reference-Based Modulation)是一种训练自由的个性化扩散模型技术。以下是该方法的详细细节:
MegActor 是一款无中间表示的肖像动画师,它使用原始视频而不是中间特征作为驱动因素来生成逼真生动的头像视频。
光与物体相互作用的方式决定了它们的外观。在图像编辑领域,控制和操纵这种交互是一个强大的工具!IC-Light 代表“施加一致的光”,是一个应对这一挑战的项目,为...
本文考虑基于图像的虚拟试穿,在给定一对分别描绘人和衣服的图像的情况下,渲染穿着精选服装的人的图像。与其他方法(例如基于 GAN)相比,之前的作品采用现有的基于样...
虚拟试穿技术允许用户在线上购物时预览服装在自己身上的效果,从而提高购物体验并减少退货率。
该项目探索文本到图像生成的新方法,重点是集成多个低秩适应 (LoRA) 以创建高度定制和详细的图像。推出 LoRA Switch 和 LoRA Composit...
AI视频技术的发展历程可以追溯到2022年,当时初创公司Runway在这一领域取得了显著成就,其技术甚至被用于热门科幻电影《瞬息全宇宙》的视频编辑。此后,AI视...
[AI Milestone] AiPhone is coming | AI+手机时代已来
虽然我们读到的内容通常是关于创建文本和图像的,但排名前 10 的应用程序中有 3 个是在教育领域:Brainly、CourseHero 和 TurnItIn。
在人工智能驱动的软件开发不断发展的格局中,ReplaceAnything 作为一种尖端工具出现,使开发人员和创意人员能够彻底改变他们的内容创建过程。这一创新的应...
通过 Textual Inversion、DreamBooth 和 LoRA 等方法,个性化图像合成取得了重大进展。然而,它们在现实世界中的适用性受到高存储需求...
人类舞蹈视频生成框架,它基于扩散模型(Diffusion Models,DM)。旨在根据目标身份和姿势序列生成高质量的定制化人类视频。以下是文章的核心内容:
图像由像素组成,每个像素都有一种颜色,包括黑色和白色。色调映射是一种数字图像处理技术,用于修改像素的色调值。换句话说,色调映射包括调整具有高动态范围的图像的色调...
创建出色的 HDR 图像的基础在于捕获多重曝光。利用相机上的曝光定格来拍摄一系列照片,每张照片都有不同的曝光值。目标是至少进行 3 次曝光:1 次曝光不足,1 ...
这篇论文介绍了一个名为AnyText的新型扩散模型,专注于生成准确且连贯的图像中的视觉文本。AnyText是一个基于扩散的多语言视觉文本生成和编辑模型,它通过两...
masterpiece, best quality, ((pure white background)), standing, black hair bun,c...
低照度图像增强只是对在低环境光环境下拍摄的图像进行增强,以提高图像视觉清晰度,如下图所示:
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市