暂无搜索历史
对于开发者来说,编码是一个既复杂又精细的过程。如何让这个过程变得更简单、更智能?如何进一步提升开发效率?豆包 MarsCode 近日正式发布,针对这些问题给出了...
“我们不想当行业领导者,相反,我们期待行业内出现领军者,这样我们才能专注于我们独特的价值贡献”。
为了让大模型在特定任务、场景下发挥更大作用,LoRA这样能够平衡性能和算力资源的方法正在受到研究者们的青睐。
只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。
Hedra的目标是建立一个人人都可访问的多模式创作工作室,因此将音频、图像、视频都结合在了一起。
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。
清华大学电子系城市科学与计算研究中心推出了第一个无需自然语言的纯时空通用模型——UniST,首次展示了纯时空模型本身的通用性和可扩展性,研究成果已被KDD202...
自OpenAI的GPTs带头之后,各大AI应用纷纷推出一键@不同智能体协作,以及配套的创建智能体功能。
作为继OpenAI、微软、谷歌后,最后一个万众期待的尖子生,苹果在上周举行的WWDC24全球开发者大会上,终于交出了自己的“AI答卷”。
选择这样做的理由,Hinton的解释是想要用AI探索新材料,进而帮助人们解决气候变化问题。
日前,AI顶会常客选手商汤科技,已经披露了今年成绩单:50篇论文入选,其中还有9篇被录用为Oral、Highlight。
排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!
苹果OpenAI官宣合作,GPT-4o加持Siri,让AI个性化生成赛道热度飙升。
从3月发布以来,潞晨Open-Sora一直热度不减,GitHub上揽星已经17.5K。
本周,CVPR 2024正在美国西雅图拉开序幕。今年CVPR论文投稿数再次创下新纪录,可想而知本届会议的火热。
结果短短一周之内,这一挑战就被一位博主Ryan Greenblatt完成了一半,准确率达50%;而此前的SOTA仅为34%。
它以Llama 3为基础,参数量只有8B,却在奥赛级别的题目上取得了比肩GPT-4的准确率。
不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。
而根据事后的消息来看,这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。
GPT-4o掀起一股全模态(Omni-modal)热潮,去年的热词多模态仿佛已经不够看了。
暂未填写公司和职称
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市