发布

啥是AI啊?

关于AI的大杂烩
专栏成员
10
文章
2556
阅读量
9
订阅数
DeepSeek 尘埃落定后你需要知道的三件事
图片 单个新 AI 模型的推出通常不会在科技圈外引起太大轰动,也不会吓坏投资者,导致股市蒸发 1 万亿美元。现在,距离 DeepSeek 的辉煌时刻已经过去了
大脸猫不吃鱼
2025-02-05
740
关于 DeepSeek ,大多数人忽视的8 件事
以上内容改编自Marcus on AI,这是AI专家Gary Marcus的Substack新闻通讯。
大脸猫不吃鱼
2025-02-05
1290
DeepSeek:技术领导者需要知道的五件事
DeepSeek 给商界和科技界带来了冲击。在地缘政治紧张和股价暴跌的新闻头条中,准确了解 DeepSeek 的新 AI 模型对企业意味着什么(从长期 AI 战略到日常技术实验)是一项挑战。
大脸猫不吃鱼
2025-02-05
1160
超大型开源 AI DeepSeek-V3 发布,表现超越 Llama 和 Qwen
中国人工智能初创公司 DeepSeek 于2024年12月26日发布了一种新的超大模型:DeepSeek-V3。
大脸猫不吃鱼
2025-02-05
1080
技术分析:DeepSeek 如何改进 Transformer 架构?
DeepSeek 最近发布了 DeepSeek v3,这是目前在开放权重模型中基准性能表现最好的模型,同时还发布了一份技术报告,详细描述了该模型的训练过程。令人印象深刻的是,他们仅使用了 280 万个 H800 小时的硬件训练时间就实现了这一 SOTA 性能——如果我们假设 40% MFU,这相当于大约 4e24 FLOP。这比性能类似的 Llama 3.1 405B 少了大约 10 倍的训练计算量。
大脸猫不吃鱼
2025-02-05
5450
高性价比、开源开放——DeepSeek 让科学家兴奋不已
中国研发的大型语言模型DeepSeek-R1令科学家们兴奋不已,它被认为是 OpenAI 的 o1 等“推理”模型的经济实惠且开放的竞争对手。
大脸猫不吃鱼
2025-02-05
1060
Artificial Analysis测评报告:DeepSeek V3质量、性能和价格分析
此报告主要分析 DeepSeek 的 DeepSeek V3 并与其他 AI 模型在关键指标方面的比较,包括质量、价格、性能(每秒token数和第一个token的时间)、上下文窗口等。
大脸猫不吃鱼
2025-02-05
6620
DeepSeek vs ChatGPT,四大维度分析
DeepSeek的出现震惊市场,特朗普甚至将其描述为美国科技行业的“警钟”。DeepSeek声称其 R1 模型的成本仅为业内其他产品的一小部分,这引发了关于整个行业未来的思考,并导致某些公司市值下跌。与此同时,DeepSeek仅在在美国发布一周后,就成为了下载量最大的免费应用。那么,它与那些更早面世,也更加昂贵的其他产品,例如OpenAI的ChatGPT和谷歌的Gemini相比如何呢?
大脸猫不吃鱼
2025-02-05
3160
撕毁 AI 剧本,巨头争先效仿,DeepSeek做对了什么?
图片 不久前,DeepSeek发布了大型语言模型R1在美国科技界引起震动。R1不仅与美国本土竞争对手的最佳表现相匹配,而且建造成本仅为其一小部分。美国股市因此损
大脸猫不吃鱼
2025-02-03
2650
不止于ChatBot,DeepSeek下隐藏着什么?
谁能想到一家中国量化公司发布全新AI聊天机器人正在全球科技界掀起巨浪,2025开年最热的科技圈事件,莫过于DeepSeek不仅以惊人速度登顶美国iOS免费应用下载榜,将ChatGPT甩在身后,更引发英伟达单日市值蒸发6000亿美元(约合4830亿英镑)——创下美股历史最大单日跌幅纪录了吧?
大脸猫不吃鱼
2025-02-03
2350
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档