Photoshop Neural Filters - Super Zoom
Super Zoom 是 Adobe Photoshop 中 Neural Filters(神经网络滤镜)的子功能,定位为“一键式智能图像放大与细节修复”,解决传统插值放大导致的模糊、锯齿等问题。AI 模型会迅速评估图像的各个细节元素,包括颜色分布、纹理特征、边缘轮廓等关键信息。通过对这些元素的精准识别与理解,Super Zoom 能够智能地预测并生成缺失的图像细节,从而实现高质量的图像放大。
基础步骤
- 在 PS 中打开图像,进入
滤镜 > Neural Filters; - 下载(第一次使用)并启用
Super Zoom; - 点击
➕ 或 ➖ 选择目标倍率(如 2x); - 选择是否启用
加强图像细节、加强面部细节(针对人像)或 移除 JPEG 伪影(针对压缩图片); - 拖动滑块选择
降噪 或 锐化 程度; - 选择生成
新图层 或 新文档。
参数
- 增强图像细节:通过 AI 算法智能分析图像,提升整体清晰度;
- 移除JPEG伪影:自动识别并消除由于多次压缩导致的块状伪影,恢复原始画质。但注意可能会导致纹理、高光等细节丢失,建议使用
蒙版 进行细节过滤。此功能更适合 2.5D/3D 图片,能有效平滑压缩痕迹;对于2D图片,可能过度柔化硬边缘,导致线条模糊或细节丢失。 - 加强面部细节:勾选后激活面部细节(如睫毛、瞳孔、唇纹)增强功能。不仅适用于面部,还会对发丝、金属材质、服饰纹理等进行全面提升。此功能更适合 2.5D/3D图片,能修复模糊和优化五官细节;对于2D图片,可能可能过度生成 “伪真实” 细节,增加不必要的噪点。
降噪 & 锐化
降噪 和 锐化 功能二者配合可提升画质纯净度与细节清晰度,同时规避单一操作的副作用,推荐根据图像细节进行动态平衡:
- 降噪:去除图像中的噪点,在放大后噪点会更加明显。但需注意参数设置,过高可能导致细节丢失;
- 锐化:调整图像的锐度,通过边缘对比度增强,抵消放大导致的模糊,尤其适合硬边缘内容。但过高的锐化可能产生 “锐化白边”,建议适度调整以获得自然效果。
Stable Diffusion - Extras
在 Stable Diffusion WebUI 的 Extras 选项卡中,内置了 图像放大 和 脸部修复 功能。它支持从基础插值到 AI 超分的多维度处理,可显著提升图像分辨率,将小图、模糊的图或有噪点的图放大、清晰化处理为更大的图。
基础步骤
- 在 WebUI 界面顶部导航栏找到并点击 Extras 选项卡。
- 上传待放大的图像。
- 设置放大比例(二选一即可):
- Scale By:输入放大倍数(如 2 表示放大至原图 2 倍)
- Scale to:直接输入目标分辨率(如 1920x1080)
- Upscaler 1 选择主放大算法。
- Upscaler 2 配置辅助放大算法,用来避免 Upscaler 1 过度处理的问题(如锐化过度/磨皮失真)。可以使用一些普通方法算法,比如
Lanczos 或 Nearest(传统插值算法)。Upscaler 2 visibility 滑块,则是给以上选择好的两种算法之间做一个合成效果的比例分配。可以在 0-1 之间调节,越接近 0,Upscaler 2 的可见度越低,也就是 AI 生图更多地参考 Upscaler 1 中的放大算法。越接近 1 则相反,建议 0.3-0.7 之间微调。 - GFPGAN 与 CodeFormer 是系统提供的两个脸部修复算法,可单独或组合使用。若图像含人物脸部,建议启用。
放大算法
WebUI 内置多种超分辨率(Upscale)模型,不同算法针对不同风格效果最佳。例如,R-ESRGAN-Anime6B (下图第一行)更适合放大动漫风格内容,能有效增强线条清晰度和色彩饱和度;而 4x-UltraSharp (下图第二行)则更适合提升真实场景或真人照片的细节与质感。根据图像类型选择合适的模型,可获得更理想的放大效果。
传统放大算法(基于数学插值)
另外,有的是传统的放大算法,仅通过数学计算插值填充像素,无法生成新细节。其本质是对原始像素的权重分配与复制,与AI超分模型有本质差异。适合快速预览或基础放大,但容易出现 模糊或锯齿:
- Nearest:最近邻插值,最简单的放大方法,直接复制邻近像素值。放大后图像会显得非常生硬,整体效果不如 Lanczos。放大后图像锯齿感明显,边缘呈阶梯状,易产生 像素化块状失真(如马赛克)。仅适用于显存极低时的快速预览(计算速度最快)或像素风格的图片。
- Lanczos:基于加权平均插值,利用原始像素信息增强细节,效果优于 Nearest。它通过为像素周围的点赋予不同权重(根据距离远近),在放大过程中进行补间处理。尽管能修复部分细节,但放大后的图像 仍然模糊。适用于辅助AI算法(如作
Upscaler 2),中和 AI 过度锐化或伪影。
现代放大算法(基于 AI )
这类算法利用深度学习技术,通过训练神经网络来生成更高分辨率的图像,能够显著增强图像细节,提升清晰度与真实感,适合对画质要求较高的场景:
- ESRGAN(Enhanced Super-Resolution GAN):基于生成对抗网络(GAN)的超分辨率模型,能大幅提升图像细节和锐度,适用于多种场景。增加了很多看上去很真实的纹理,但是有时可能会过度拟合,出现不好的效果。
- R-ESRGAN 4X+:R 是 Real-Time 的意思,+ 代表可放大 4 倍以上。该算法在 ESRGAN 的基础上进行了改进,能够对图像去模糊降噪,可消除 JPEG 伪影并增强纹理细节。但可能会有涂抹感,导致出现偏硬的色块感,适合写实图片。
- R-ESRGAN-Anime6B:Anime 是二次元的意思,6B 指的是在 60 亿参数的动漫数据集上训练的结果,其中包含了大量不同风格、不同质量的动漫图像。许多其他 AI 图像放大工具专注于绘画或摄影风格,因此它们会在动漫图像上留下瑕疵,无法很好地处理动漫图像中的线条。它专为动漫风格图片设计,效果极佳。
- ScuNET:在 Lanczos 基础之上具备去噪点的功能,对人体肌肤有一定磨皮效果,如果单纯只是想去噪点的话,用这个算法很适合。基于深度学习,使用生成对抗网络(GAN)进行训练。主要用在提高图像的视觉效果和感知质量,例如在图像增强、视频处理等。
- ScuNET PSNR:与 SCuNET 相比,在真人质感领域几乎没有区别,适合动漫。基于深度学习,使用均方误差(PSNR)进行训练。主要用在提高图像的客观质量和准确性,例如在医学图像分析、监控视频处理等。
- 4x-UltraSharp:基于 ESRGAN 做了优化模型。UltraSharp 顾名思义,会让图片变得平滑、锐利,适合修复表面纹理有问题的图片。很适合真实场景和真人图像,能增强质感和细节,保留皮肤纹理与毛发细节,减少 “塑料感”。
- SwinIR_4x:基于 Transformer 架构,属于对抗网络的新型算法。很好地保持了照片的自然外观,但会使图像变得平滑,几乎像 Instagram 的皮肤校正滤镜一样。输出区域不稳定,有些区域模糊,有些区域又能放大细节。
- BSRGAN:即双线性超分辨率生成对抗网络,包含退化模型和超分辨率模型,通过联合训练从退化图像中恢复出高分辨率图像。适合修复低质量图片,但绘画或其他纹理丰富的图像可能会丢失一些细节。在特定场景下,其他升级器可能效果更佳。
- LDSR(Latent Diffusion Super Resolution):潜在扩散超分辨率模型,以出色的照片级真实感图像处理能力而闻名,在锐化和平滑之间具有良好的平衡。但处理动漫或卡通风格时,图像可能会出现随机噪点或伪影等问题。比其他升级器慢得多,如果没有强大的 GPU,几乎无法使用。
更多算法
除了 Stable Diffusion WebUI 内置的算法,社区与第三方平台提供了丰富的扩展算法资源,可进一步满足个性化需求。例如 OpenModelDB 收录超 200 种图像放大算法,涵盖 ESRGAN 变种、SwinIR 衍生模型及二次元专用算法(如 AnimeSR、Real-CUGAN)。一位国外的热心播主也 总结 了 300 多种放大算法的优缺点,并提供了对比图供参考。
使用方式:下载 .pth 格式模型文件后,放入 WebUI 的 models/ESRGAN 目录,重启即可调用。
脸部修复
Extras 面板还提供了图像后期处理功能,包括针对人脸修复的两种主流工具:
两个模型可单独或组合使用,通过 GFPGAN visibility、CodeFormer Weight 和 CodeFormer visibility 来设置它们的参与度。
ComfyUI
在 ComfyUI 中,可以通过模块化的方式构建图像放大的工作流:
- 加载图像
- 模块名称:
Load Image - 功能:从本地加载一张输入图像,作为工作流的起点。
- 加载放大模型
- 模块名称:
Load Upscale Model - 功能:加载特定的图像放大模型。
- 图像放大
- 模块名称:
Upscale Image (Using Model) - 功能:使用加载的放大模型对图像进行放大。
- 加载人脸修复模型
- 模块名称:
FaceRestoreModelLoader - 功能:加载人脸修复模型(GFPGAN 或 CodeFormer)
- 人脸修复
- 模块名称:
FaceRestoreCFWithModel - 功能:使用加载的人脸修复模型对放大的图像进行人脸优化。
- 参数设置:
- FaceDetection:定位和识别图像中的人脸区域。
- retinaface_resnet50 :基于 ResNet50 的 RetinaFace 模型,具有较高的检测精度,适合对检测准确性要求较高的场景。
- retinaface_mobile0.25 :基于 MobileNet0.25 的 RetinaFace 模型,相对轻量化,在保持一定检测精度的同时,计算速度较快,适合对实时性要求较高的场景。
- YOLOv5l :基于 YOLOv5 的人脸检测模型,具有较强的实时性和较好的检测效果,能够快速准确地检测出图像中的人脸。
- YOLOv5n :同样是基于 YOLOv5 的人脸检测模型,但模型更小、速度更快,适合在资源有限的环境下使用。
- Fidelity(对于 CodeFormer):保真度参数,0 高修复 - 1.0 低修复。
- 输出图像
- 模块名称:
Save Image - 功能:保存最终修复后的图像。
开源工具
Upscayl GUI
Upscayl GUI 是一款免费开源的图像放大工具,支持 Windows、MacOS 和 Linux 系统。界面 简洁直观易用,操作简单。提供多种 AI 模型供选择,如 Real-ESRGAN、RemaCRI、UltraSharp 等,适用于不同类型图片的放大需求。且无需联网,保障用户隐私安全。
在线网站
如果不想使用本地工具,还可以选择像 Imagewith.AI 这样的在线 AI 图像放大工具。直接通过浏览器访问,无需下载额外的软件或模型,生成的放大图像没有水印。⚠️ 缺点是每日有免费次数限制,尺寸最大 8000 x 8000px。
其他 GUI
- chaiNNer:基于节点的图像处理 GUI,兼容 OpenModelDB 上的所有模型,并支持 PyTorch (CUDA)、ONNX (CUDA) 和 NCNN (AMD/Intel) 运行框架。由于采用节点式工作流设计,用户可以灵活地构建复杂的图像处理管道,拥有更强的控制力,但同时也增加了一定的学习曲线。
- VideoJaNai:原名 AnimeJaNaiConverterGui,提供简洁易用的 GUI,支持 TensorRT(NVIDIA 显卡)、DirectML 和 NCNN 后端,可快速对视频进行升级处理。但仅兼容 ONNX 模型,如果需要使用 PyTorch 模型,可通过 chaiNNer 转换为 ONNX 格式后加载。
- VSGAN-TensorRT-docker:基于 TensorRT 加速的视频超分辨率 解决方案,通过 Docker 容器化部署,支持多种模型(如 ESRGAN、SwinIR)对视频帧进行逐帧处理,但需要手动调整参数,适合对性能有极致要求的专业视频后期团队。