长上下文大型语言模型(LCLLMs)确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为,LCLLMs不需要像...
当Transformer模型发布时,它彻底革新了机器翻译领域。虽然最初是为特定任务设计的,但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Trans...
大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
清华大学智能产业研究院副研究员周浩在智源大会上,以计算机从业者的身份,向大家分享了 AI 人做蛋白质设计遇到的多重挑战,并从数据结构、生成算法、预训练 3 个方...
在第六届北京智源大会上,北京大学第一医院副院长、心血管研究所所长、北京大学第一医院-智源联合实验室牵头人李建平教授以「临床心肌缺血预测手段及困难」为题,分享了A...
北京时间 6 月 20 日凌晨,CVPR 2024 正式公布了本届会议的最佳论文等奖项,「BIoCLIP: A Vision Foundation Model ...
dp53m 可特异性识别突变 p53-R175H 蛋白,实现目标蛋白的靶向降解。进而抑制突变 p53 蛋白功能性表达,实现抗肿瘤功效,且无明显毒性反应。
【新智元导读】今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4...
该工作目前在X(Twitter)上受到广泛关注。被清华大学官方账号以及AK转载,论文视频累计浏览量超过100,000,论文代码已开源。
由于生成真正的随机数过于昂贵,所以Python、Java等语言都内置了「伪随机数生成算法」。虽然生成的数字序列是完全可预测的,但它看起来就像是真正的随机数。
本文作者李宏康,美国伦斯勒理工大学电气、计算机与系统工程系在读博士生,本科毕业于中国科学技术大学。研究方向包括深度学习理论,大语言模型理论,统计机器学习等等。目...
张鉴殊:武汉大学本科三年级学生,目前在张潼教授的指导下担任研究实习生,主要研究方向是大语言模型,多模态大语言模型以及持续学习。当下在寻找 2025 fall 博...
姿态估计是一种计算机视觉技术,旨在从图像或视频中识别和理解人体的姿势或动作。它涉及检测人体的关键点,如头部、肩膀、手臂、腿部等,并确定它们之间的关系,以推断出人...
本文精选了美团技术团队被SIGIR 2024收录的3篇论文进行解读,第一篇论文围绕如何利用深度学习,来整合广告拍卖和混排;第二篇论文扩展定义了全用户纵向联邦推荐...
中科院、华科大、北科大、华南理工等机构的“知乎导派”大佬们(网名“真可爱呆”、“洗芝溪”等)又联合发布了最新研究成果。
Mastering Business Innovation with ChatGPT&GPTs,AI tools
当我们看着时钟的秒针移动时,我们的大脑会激活一系列的神经元,这些神经元对特定的视觉角度敏感。这些细胞形成美丽的「风车」图,每部分代表不同角度的视觉感知。
在COVID之后,像很多英国大学一样,雷丁大学也更多地转向线上考试。学生在规定时间中完成题目或论文,而且是完全的开卷模式,参考课程材料、论文、书籍、互联网材料都...
【新智元导读】近日,一篇出自中国团队之手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚...