发布

CSDN社区搬运

专栏成员
281
文章
73071
阅读量
23
订阅数
图论求解平面TSP问题算法复现
旅行商问题(Traveling Salesman Problem,TSP)作为组合优化领域的经典难题,在物流配送、电路布线、旅游规划等众多实际场景中具有广泛应用。其核心在于寻找旅行商遍历所有城市且不重复、最终返回起点的最短路径,然而随着城市数量的增加,问题复杂度呈指数级增长,传统算法在求解大规模 TSP 问题时面临巨大挑战。
Srlua
2025-01-02
1050
基于域自适应的双光融合​​​ ​​
红外和可见光图像融合的目标是将红外图像和可见光图像的互补信息结合起来,以实现更全面的环境感知。这意味着通过融合两种类型的图像,可以获得比单独使用任何一种图像更丰富的场景信息。
Srlua
2025-01-02
1270
SAM-Adapter
SAM-Adapter 的核心思想是通过引入轻量级适配器,将任务特定知识注入到冻结的 SAM 模型中,以增强其在下游任务中的适应能力。适配器的设计简洁高效,通过灵活的任务知识输入,提升了模型的性能与泛化能力,特别是在数据稀缺场景下表现突出。
Srlua
2025-01-02
1050
小算力LVLMs,gpt4平替
LVLMs是干什么的?其实非常好理解,简单来说就是GPT4o干的事情,输入一张图片和一句话,LVLMs会给出一个回答。GPT4目前是闭源的,目前开源的做法都是想法了接近gpt4的性能。而对于研究人员而言,没有强大的算力的支持,也只能在一些小规模的LVLMs上寻找一些方法上的创新。下面将介绍一种MOE-LLaVA的方法。
Srlua
2025-01-02
740
局部图像水印嵌入
图像水印技术最初是为了知识产权保护和复制保护而开发的,如好莱坞工作室对DVD的水印。随着生成性AI模型的发展,水印的应用也在演变。例如,美国白宫的行政命令、加州法案、欧盟AI法案和中国AI治理规则都要求AI生成的内容能够被轻松识别,并将水印作为检测和标记AI生成图像的推荐或强制措施。
Srlua
2025-01-02
1070
信息增强的图像超分辨率重建
单图像超分辨率(SISR)的任务是旨在从其低分辨率版本重建出高质量的图像。基于CNN的网络在性能方面取得了显著的成功。然而,CNN的归纳偏置限制了SISR模型捕获长距离依赖性的能力。它们的固有局限性源于参数依赖的感受野扩展和不同层中卷积算子的核大小,这可能会忽略图像中的非局部空间信息。
Srlua
2025-01-02
1230
超越扩散模型,图像生成新方法
在图像生成领域,研究者们已经开发了多种类型的生成模型,每种都有其独特的优势和应用场景。这些模型可以大致分为三大类:变分自编码器(VAE)、扩散模型(Diffusion Models)以及最近提出的Visual AutoRegressive (VAR) 模型。下面将逐一介绍这三类模型的基本概念、特点及其在实际应用中的表现。
Srlua
2025-01-02
1450
逐步蒸馏论文复现
本文对这篇论文进行复现:Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes 目前已发表在2023ACL上
Srlua
2025-01-02
1690
AIGC之VAE详解与代码实战
参考论文文章: https://arxiv.org/pdf/1312.6114 https://arxiv.org/pdf/1606.05908v2 如下图所示,生成模型的目标是在一个已只分布p(z)中随机采样z,经过网络G,生成的结果x~=G(z)x=G(z)是满足训练数据p(x)的分布,我们假定生成的分布为pgpg​,训练样本的分布为pdatapdata​,一个非常麻烦的事是我们不知道,也无法去知道pdatapdata​的分布,无法去做损失函数求解G。你可以这样理解,我们生成网络的目的是要得到pg=pdatapg​=pdata​,如果我都知道pdatapdata​,我直接在pdatapdata​采样不就完事了,还需要生成网络干嘛?让我们来回顾一下GAN网络,GAN怎么做的呢,GAN网络结构引入了D判别器,可以去翻一下前面的GAN,你会发现所有的损失函数是在D网络出来结果的损失,进而去约束G网络,实际上根本没有去求解pdatapdata​的分布,通过对D做损失优化,最终G网络生成的pgpg​是等于pdatapdata​的,不得不佩服D网络引入的巧妙性。
Srlua
2025-01-02
1460
基于图的去中心化社会推荐过滤器
这篇论文由中国科学技术大学团队于2023年发表在TKDE期刊上,主要研究领域是基于用户-用户和用户-事件社会关系的推荐生成。由于这些社会关系可以轻松地用图结构数据来表示,因此图神经网络在这一领域具有很大的发展潜力。然而,现有的基于图的算法在处理数据时往往忽略了用户或事件的偏好偏移量。作者给出的一个示例说明了这种偏移量的重要性:挑剔的用户给出的低评分并不一定意味着他们对产品的态度是消极的,因为这些用户通常会给出低评分,这可能会导致图结构数据分析产生误差。现有的方法通常将这种偏差作为标量融入模型训练中,但作者认为这种做法不足以捕捉所有相关信息。此外,作者指出,用户之间的社会联系也应被考虑在内,因为具有相似偏好的用户往往会对彼此产生更大的影响。基于此,作者提出了一种新的算法来解决这些问题。
Srlua
2025-01-02
690
自监督对比学习奠基之作CPC
对比学习是为了在不关注样本全部细节的情况下,训练一个Encoder将样本转化为表征(representation,比如用一个编码器将数据编码成高维向量,就可以将得到的向量称为是数据的representation),使得representation包含了更显著的、重要的、有区分度的特征,学到这样的表示之后,用来帮助提升下游任务的性能。
Srlua
2025-01-02
1330
让机器感受你的情绪!
随着近年来社交媒体的快速增长,社交媒体上的用户生成内容(例如视频)的量大幅增加。不同模态的自动情感分析有利于人机交互,并吸引了大量的研究兴趣。多模态情感分析(MSA)旨在捕获和整合来自不同相关模态的情感信息,以预测说话者的情感状态或倾向。通常,我们可以从视频中获得三种形式:视觉,声学和文本。情感分析是一个重要的研究领域,旨在从人类话语中提取和融合情感信息。由于人类情感的多样性,多模态分析往往比单一模态分析更准确。为了补充相关模态之间的信息,一种有效的方法是执行跨模态交互。最近,基于transformer的框架已经显示出强大的捕获长范围依赖关系的能力,从而引入了几种基于transformer的多模态处理方法。
Srlua
2025-01-02
950
AIGC入门之生成对抗网络
原始论文:https://arxiv.org/abs/1406.2661 放一张GAN的结构,如下:我们有两个网络,生成网络G和判别网络D。生成网络接收一个(符合简单分布如高斯分布或者均匀分布的)随机噪声输入,通过这个噪声输出图片,记做G(z)。判别网络的输入是x,x代表一张图片,输出D(x)代表x为真实图片的概率。最终的目的式能够生成一个以假乱真的图片,使D无法判别真假,D存在的意义是不断去督促G生成的质量
Srlua
2024-12-28
1060
三维场景重建3D高斯点渲染复现
多视图立体视觉网络(MVSNet, Multi-View Stereo Network)是计算机视觉领域中用于从多视角图像中重建3D几何结构的一种深度学习方法。MVSNet通过利用卷积神经网络(CNNs)对输入的多张图像进行特征提取,然后基于这些特征来计算不同视角之间的匹配代价,并构建代价体积(cost volume)。接下来,通过3D卷积操作对这个代价体积进行处理,以预测每个像素的深度值,最终生成稠密的深度图和点云数据。
Srlua
2024-12-28
2220
StyleShot任意风格快照
本文通过复现并解读图像风格迁移领域最新的SOTA方法,来解读基于深度学习的图像风格迁移领域的最新研究进展。本文解读的论文是《StyleShot: A Snapshot on Any Style》,作者来自同济大学和上海人工智能实验室。
Srlua
2024-12-27
890
医学图像前沿:公平性研究
在眼科学中,盘杯分割充当了评估视神经头结构和早期阶段诊断青光眼的基本步骤。该任务的目标是从扫描激光眼底成像(SLO)中预测一个分割图,区分背景视盘和杯体。此任务的成功依赖于分割模型的准确分割。 这里提出的Fairseg框架致力于消除分割模型对不同人口群体的“歧视”,以确保其在不同群体上盘杯分割任务的公平性。 该篇文章还开源了第一个用于医疗图像分割公平性研究的大型数据集,我已经下载好,并将网盘链接放置在了附件当中。
Srlua
2024-12-27
830
初入图像处理:水稻剑叶夹角测量
随着计算机技术的不断发展,人们开始探索如何让计算机像人一样 “看” 和理解图像中的信息。计算机视觉作为一门交叉学科,融合了计算机科学、数学、物理学和生物学等多个领域的知识,旨在赋予计算机自动分析和理解图像内容的能力。图像处理是计算机视觉的基础,通过对图像进行各种处理操作,为后续的高级视觉任务如目标识别、场景理解等提供必要的数据预处理和特征提取。在数字媒体领域,图像是信息传播的重要载体。从早期的静态图片编辑到如今的视频流媒体处理,图像处理技术在提高图像质量、增强视觉效果以及满足用户对多媒体内容的多样化需求方面发挥着关键作用。例如,在电影制作中,图像处理技术用于特效制作、色彩校正和画面修复;在数字摄影中,它可以帮助摄影师调整照片的曝光、色彩平衡和锐度,以获得更好的视觉效果。在工业生产过程中,机器视觉系统被广泛应用于产品质量检测、零部件识别和装配操作等环节。通过图像处理技术,机器视觉系统能够快速、准确地获取产品的外观特征和尺寸信息,从而实现对产品质量的高效监控和自动化生产流程的精确控制。在机器人技术中,图像处理为机器人提供了感知周围环境的能力,使其能够识别目标物体、避开障碍物并执行各种复杂的任务。 水稻是世界主要粮食作物之一,水稻剑叶夹角对理想株型选育至关重要。传统人工测量方法效率低且易损伤作物,而机器视觉技术为作物表型信息获取提供了新途径。
Srlua
2024-12-27
790
模糊眼底图像的校准分割​​​ ​​​
在医学图像分析的场景中,经常会遇到来自多个临床专家或评估者对于一张图像的不同标注,以期减轻对于模糊图像的诊断错误。 我们这里要介绍的方法来自CVPR2021的一篇工作,其提出了一种可以挖掘多评价者标注中蕴藏的丰富的一致或不一致信息的方法,并利用其校准模型预测,提升模型的分割性能。
Srlua
2024-12-27
780
APCP燃料制作和相关性质研究
摘要:本文研究了含铝高氯酸铵-端羟基聚丁二烯复合推进剂(APCP)的制作过程及其性能。通过改变高氯酸铵的粒度分布和铝含量,分析了这些变化对推进剂性能的影响,旨在提高火箭发动机性能的一致性和可靠性。研究结果显示,采用三峰粒度分布和适当的铝含量,可显著提高APCP的燃烧性能和一致性。
Srlua
2024-12-23
1690
基于预测反馈的情感分析情境学习
Improving In-Context Learning with Prediction Feedback for SentimentAnalysis
Srlua
2024-12-23
760
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档