前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 10

蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 10

作者头像
用户10675374
发布于 2024-11-08 02:23:36
发布于 2024-11-08 02:23:36
1610
举报
文章被收录于专栏:ShoelessCaiShoelessCai

目前这篇是蚂蚁集团关于攻防算法白皮书的最后两个章节,基本原文,不涉及算法。

Ch4 大模型测评

4.1 通用大模型评测框架

评估范围:不同的领域,如金融、医疗或法律,拥有不同的数据特性、任务需求和合规要求。 能力维度: 1.知识能力。衡量模型对广泛知识的了解程度,教育程度范围涵盖,义务教育、高等教育、职业教育。 2.推理能力。该维度针对模型的逻辑分析与问题解决能力。推理涉及数学计算和逻辑判断,还包括对复杂 问题的因果推断,和程序代码的生成与 debug 能力。 3.理解能力。评估模型对于给定文本的深入理解程度,包括对文字含义的把握、主旨的抽取、语境的解读以及创意写作。 4.语言能力。关注模型在理解和生成语言方面的能力,包括对字词的精准辨识、分类、含义解释以及新词创造;对语句、段落的语法结构进行解析和错误纠正;以及将一种语言翻译为另一种语言的能力。包括同义词辨析、句子改写、多语种翻译等任务,来全面评估模型的语言处理能力。 5.安全能力。确保模型的输出不仅符合技术要求,还要符合社会和道德规范,这是避免潜在风险和不当使用的关键。通过设置与实际应用场景相符的测试用例和模拟情境,可以检验模型在各种复杂环境下的安全表现。 数据分类: 1.网络爬虫。大模型评测集的数据来源包含网络爬虫、教科书、业务数据,以及问答社区和知识库等渠道,旨在全面衡量模型的知识掌握和实际应用能力。网络爬虫数据为模型提供了丰富的语言环境和现实世界的情境,包括最新的新闻、流行话题和公众讨论教科书是权威的学术资源,它们给模型带来了正式的学科知识和概念性学习材料。 2.业务数据。业务数据则来源于特定行业或企业,这些数据集中于具体领域的专业知识和场景,对于评估模型在专业环境中的适用性至关重要。 3.社区问答。问答社区和知识库如知乎提供了用户生成的问题与答案,这些实际的交互数据可以检验模型的应答质量和问题解决能力。 综合这些来源,评测集能够更精确地揭示模型在理解和生成语言、处理知识信息、以及与用户交互方面的实际表现。 题型分类: 1.文本补全测试。评估模型预测和插入缺失文本片段的能力,要求模型展现 对上下文的理解并准确推断出合适的内容。 2.多项选择测试。旨在衡量模型能否在多个可能答案中选择最合适的一项,从而考验模型的知识储备,阅读理解和分析判断能力。 3.文本摘要生成。检验模型提取关键信息并有效压缩长篇文章为简洁摘要的能力,这对于评估模型的信息处理和概括能力至关重要。 4.代码生成。此类测试专注于模型理解编程语言规范并根据功能需求生成准确代码的能力,是衡量其技术应用潜力的关键。 5.工具调用。测试模型能否正确使用特定工具或服务来完成任务,如查询数据库、调用 API 接口等,这反映了模型的实用性和交互能力。 构建方式: 1.对于 PDF 格式的数据。可以采用 OCR 技术进行电子化处理,随后通过人工干预进行清洗和校正,以确保构建出高质量的评测题目。相比于可能被模型预训练过的网页文本格式试题,PDF 格式的数据更能保障评估结果的客观性,以避免数据穿越的潜在影响。 2.对于未标注的教科书或专业资料,可以利用语言模型的转换功能,将这些内容转化为填空题、问答题以及选择题等形式。鉴于生成式大模型可能产生的幻觉问题,直接利用大模型生成题目可能无法确保其有效性。因此,利用教科书和专业资料作为基础,借助模型本身的语言理解能力构建评测题目是一种非常有效的方案。 此外,专家构造的评估集也是评测工具箱中的重要组成部分。这类评估集能够有效避免数据泄露问题,并且人类专家能够创造众多独特而富有挑战性的评估数据。然而,专家构造评估集也面临规模有限、创建和更新成本高昂的局限性。 3.针对业务数据的题目构建,可以通过精心设计的提示(prompt)和规则将业务数据转化成具体的评测题型,以此评估模型在实际业务环境中的适用能力。 评测方法: 1.客观评估。客观评估通过量化指标来衡量模型在特定任务上的表现,是小模型时代主流的评估方法,常用的评估指标包括:准确率、F1 分数、ROUGE 指标、METEOR 分数以及 pass@k 指标等。 2.主观评估。采用以人类评价者的主观感知为基础的评估方法,能够更全面地衡量模型的综合性能。主观评估则依靠人类专家根据经验和判断来进行,它涉及对模型性能的个人感知评价和比较,旨在识别模型的优势和潜在的改进空间。 对于人工评估,使用 GPT-4 进行评估可作为其替代方法(团队内部评估过,GPT-4 作为人工评估替代方案,与专业达标人员评估相关度高,且效率大大提升)。 以众包方式让不同的大模型进行匿名随机的对抗测评。这种评级基于国际象棋等竞技游戏中广泛使用的 Elo 评分系统(Elo 是一种计算玩家相对技能水平的方法,通过两名玩家之间的评分差异可以预测比赛的结果)。 3.上下文学习与思维链。研究领域已发展出具有代表性的评估方法如“上下文学习”(In-Context Learning)和“思维链推理”(Chain of Thought, CoT)等。包括 Zero-shot learning, Few-shot learning, Chain of Thought(CoT)。

4.2 大模型在金融领域的评测概述

首先,完整性是金融领域大模型评测的一个重要方面。金融通识掌握和应用的宽度和深度,决定了能够多大程度上客观的反馈大模型的总体综合能力。 其次,针对性也是金融领域大模型评测需要关注的重要方面。金融领域的特殊性包含了业务合规性、事实准确性、推理正确性、事件实时性等方面。 最后,在金融领域大模型与通用大模型的评测对比中,区分度显得尤为重要。金融场景任务评测的代表性要求评测集能覆盖并代表实际发生的金融场景任务,这包括使用真实业务数据(经处理确保合规)和经过实际金融场景任务检验的评测任务及数据。 因此,对于金融大模型评测而言,一个具备完整性的评测体系应涵盖从基础知识到高级金融理论、从通用应用到特定领域应用的全方位评估。

4.3 大模型在金融领域的评测实践

两个案例:第一个是上海财经大学的FinEval 金融评测集,展示学术界是如何构建金融评测的维度,第二个是蚂蚁集团的Fin-Eva 金融评测集,展示工业界如何对金融业务进行评测以及评测的工业框架。 上财 FinEval 金融数据集:FinEval 是一个高质量的多项选择题的集合,涵盖金融,经济,会计和证书等四大领域。它包括 4661 个问题,涵盖了 34 个不同的学科。从选题的角度来看,金融领域和会计领域分别包括 10 个不同的科目,经济领域和证书领域分布包括 7 个科目。在数据集分割方面,开发集、验证集、测试集和总集各包含 34 个主题,分别是由 170、1151、3340 和 4661 个问题组成。 四大领域 金融、经济、会计、证书。 蚂蚁大模型评测集 Fin-Eva:Fin-Eva 涵盖金融认知、领域知识、金融逻辑、内容生成以及安全合规五大类能力 33 个子维度共 8446 个测评题,题目类型为单选题。Fin-Eva 覆盖财富管理、保险、投资研究等多个金融领域,数据源包括蚂蚁各业务领域、开源数据、模型蒸馏,经过数据脱敏、文本聚类、语料精筛等处理过程后,结合金融领域专家的深度加工最终构建而成。 五大领域 金融认知类:考察模型金融文本的理解和提取能力。 领域知识类:考察模型是否具备全面的金融领域知识,以及能否通过专业能力考试。 金融逻辑类:考察模型是否具备完成复杂金融任务的推理和计算能力。 内容生成类:考察模型总结和生成专业金融文本的能力。 安全合规类:考察模型能否辨别金融领域的安全和合规问题。

Ch5 金融大模型发展中的人才培养

5.1 人才需求分析

随着大模型与业务场景的深度结合,产业界对大模型人才有需求的企业也急剧增长。

从基础理论角度,将金融业务与大模型相结合需要具备跨学科的综合能力,包括金融学基础、计算机、软件工程人工智能等学科能力。 从人才岗位需求来看,现有对大模型人才的划分大致包括算法侧、架构侧、应用侧人才,不同岗位对人才能力的偏重不同,但需求相互交叉。 算法侧人才负责大模型核心研发,主要包括对金融专业语料库等数据进行处理。 架构侧人才偏向工程,除了传统前后端开发及测试之外,还需要大模型架构人才,实现分布化的部署、数据安全的保护和应用实现,其技能需求包括 Web 开发、分布化部署等计算机技术。 应用侧人才聚焦于金融具体场景任务,其基于内部协同和行业认知,面向行业给出应用解决方案。

5.2 人才教育体系的调整与创新

首先,人才培养应该强调跨学科的教学设计。随着金融科技的兴起,金融领域与其他学科的交叉融合变得更加紧密,但现有教育体系对学科前沿的交流和融合仍不充分。 其次,人才培养应该鼓励教学内容创新,培养具有深厚专业知识和交叉能力的复合型人才。 最后,人才教育应该鼓励教学模式创新,培养具有实践动手能力、科研创新能力、能够快速适应变化环境的人才。

5.3 跨界合作与持续学习机

在大模型的设计开发、垂直领域的大模型应用等环节建立“产学研用”多元主体一体化的合作模式,通过多样合作交流、构建持续性的学习机制,促进人才培养,实现互动共生、互利共赢。 除此之外,面对金融科技和行业趋势的快速变化,金融大模型的人才培养和持续学习显得至关重要。 此外,金融机构和行业协会还需要培养金融大模型从业者的行业法规意识和行业伦理观念。

5.4 人才评估与认证体系

首先,建议建立闭环管理的金融科技人才评估与认证体系。持续完善“制定-实施-评估-完善”的制度体系闭环管理机制。 其次,建议建立多元化的金融科技人才评估认证指标与认证方式。 最后,加强与行业需求的对接和实时反馈机制建设。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ShoelessCai 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
蚂蚁集团开 “卷” 金融大模型,“四力和一” 解决产业真命题
大模型最让人印象深刻的是它们的「涌现」行为,数以万计的二进制计算决策融合成一种仿佛人类的理解力和创造力,让金融行业看到开发一个专注金融的语言大模型的巨大价值。
机器之心
2023/09/19
6090
蚂蚁集团开 “卷” 金融大模型,“四力和一” 解决产业真命题
【GPT-5 一年半后发布?对此你有何期待?】GPT-5:AI技术的新纪元
IT之家6月22日消息,在美国达特茅斯工程学院周四公布的采访中,OpenAI首席技术官米拉·穆拉蒂被问及GPT-5是否会在明年发布,给出了肯定答案并表示将在一年半后发布。此外,穆拉蒂在采访中还把GPT-4到GPT-5的飞跃描述为高中生到博士生的成长。“像 GPT-4 这样的系统则更像是聪明的高中生智力水平,在接下来的几年里,我们期待在特定任务上达到博士的智力水平。事情正在飞速变化、改善。”他强调“博士级”的智能仅适用于某些任务,并非全面达到甚至超越人类水平——“这些系统在特定任务中已经达到了人类水平,当然,在许多任务中,它们还达不到。”综合IT之家此前报道,科技界多位领袖,包括微软 CTO Kevin Scott 和阿里巴巴董事长蔡崇信,都曾表达过对 AI 系统发展之快的惊叹。新一代大语言模型GPT-5的即将登场,又将对我们的工作和日常生活产生怎样的影响呢?它将带来哪些新的应用场景和创新可能性?我们又该如何准备迎接这一新的技术变革?现在就加入讨论吧!在此分享你的见解和期待,一起畅想AI赋能下的未来!
Francek Chen
2025/01/23
1440
【GPT-5 一年半后发布?对此你有何期待?】GPT-5:AI技术的新纪元
蚂蚁集团保险科技探索与实践:AI新科技重塑保险服务,带来行业新体验
保险行业对于社会民生和国民经济的重要性不言而喻,其作为风险管理工具,为人民群众提供保障和福利,推动经济的稳定和可持续发展。保险行业在新的时代背景下,面临着新的机遇和挑战,需要不断创新和转型,以适应社会需求的变化和经济结构的调整。
机器之心
2023/09/19
3020
蚂蚁集团保险科技探索与实践:AI新科技重塑保险服务,带来行业新体验
恒生电子探路金融大模型
恒生电子董事长刘曙峰表示,大模型是信息技术的最新突破,刷新了人们对机器智能的认知,同时也在刷新行业应用传统AI模型的模式。
数据猿
2023/09/27
3530
恒生电子探路金融大模型
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VII
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VII 之前的几篇文章: 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VI 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - V
用户10675374
2024/11/08
1220
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VII
AI大模型在软件开发流程中的创新应用与挑战
在21世纪的软件开发领域,人工智能(AI)技术的应用正日益深入,其中AI大模型技术以其强大的数据处理能力和智能化特征,正在重塑传统的软件开发流程。AI大模型,如自然语言处理(NLP)模型和机器学习(ML)模型,通过提供更高效的代码生成、缺陷检测、自动化测试等功能,极大地提升了软件开发的效率和质量。本研究旨在探讨AI大模型如何影响软件开发的各个阶段,以及这些变化对软件工程师、开发流程和最终产品的影响。
燕鹏
2024/11/08
6420
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VI
这是第五篇关于蚂蚁金服和上海财经大学,大模型阐述的文章:蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - V。 接下来讨论 基于隐私泄露 的方法。 第一,自由文本推断攻击。 对抗攻击(adversarial attack)旨在利用对抗样本(adversarial example)来欺骗受害模型(victim model)。攻击模型(attack model)通过对原样本进行轻微的扰动来生成对抗样本,其真实的分类标签 与原样本保持一致,但是受害模型的判断却会出错。 对抗攻击被认为可以暴露受害模型的弱点,同时也有助于提高其鲁棒性和可解释性。 ShoelessCai 评注:之后我们也会看到,文章对于模型的可解释性,进行长篇大论的解释。我们可以认为是针对黑盒模型,一种测试性解释。换言之,如果全是线性模型,我可以按照输入模型的变量,去分析解释因素(factor),或者承载(load)。这时候我知道导致我输出变量的改变是什么。但是针对神经网络类型的模型,反向侦测可能就是一种思路。 在图像领域已有CleverHans、Foolbox、Adversarial Robustness Toolbox (ART)等多个对抗攻击工具包,这些工具包将图像领域的对抗攻击模型整合在一起,大大减少了模型复现的时间和难度,提高了对比评测的标准化程度,推动了图像领域对抗攻击的发展。 简要介绍一下这些算法。 CleverHans,该平台的攻防框架,将攻防算法模块化,全球研究者能在这一平台上,快速研发不同的对抗样本生成算法和防御算法。以 FGSM 和 PGD 为例,生成对抗样本,与干净样本对比正确率。因为是模块化平台,上述做法,可以通过调用函数实现。 以 FGSM 为例,如下述方式定义参数,使用 CleverHans 平台。 def fast_gradient_method( model_fn, x , eps, norm, clip_min=None , clip_max=None, y=None , targeted=False , sanity_checks=False, ) Foolbox,较为成熟度工具箱。 无目标攻击 raw, clipped, is_adv=attack( fmodel, data.to(device), target.to(device), epsilons=0.1 ) 有目标攻击 raw, clipped, is_adv=attack( fmodel, data.to(device), epsilons=0.15, criterion=criterion ) 可以发现 有无目标攻击 有一点不同就是是否含有 target。无目标攻击需要样本 target,告诉模型“只要最终判定的类别不为 target 即可”。有目标攻击,则是提供 criterion 参数,告诉了模型该如何定向分类。 两种攻击模式都存在 epsilons 参数,这是必要参数,设定了像素点最大变化大小(没怎么懂,先放着)。上述的 attack 实际返回了三个变量:第一,raw 就是正常攻击产生的对抗样本;第二,clipped 就是通过 epsilons 剪裁生成的对抗样本;第三,is_adv 包含每个样本的布尔值,指示 raw 中哪些样本它们既被错误分类,又在干净样本周围的小邻域内(半径为 epsilon)。 上述代码的解释比较直接,我们可以认为,FoolBox 就是用参数描述目标,让模型的分类能力变差,这才是所谓的攻击。这就是这类工具箱,免疫型操作的 Basic Idea。 从文章的描述看,调用工具箱,以及 PyTorch,还是比较容易提升模型的“免疫力”的。 Adversarial Robustness Toolbox (ART),专门用于机器学习稳健性的 Python 工具包,具有模型防御功能,接下来,我们来看看是如何起作用的。官方文件,“applications against the adversarial threats of Evasion, Poisoning, Extraction, and Inference. ”。 按照 ShoelessCai 的理解。ART 主要针对模型进行如下操作,污染样本、抽取重要信息,以及干预模型预测这类事件。这是 ART 这个工具箱的官方解释。注意,这个工具箱是持续地更新和迭代的。 回到正文。 文本领域鲜有类似的工具包,据我们所知目前仅有 TextAttack 这一个文本对抗攻击工具包。然而它所覆盖的攻击类型十分有限(仅支持gradient-/score-based类型的攻击以及字/词级别的扰动),其可扩展性也有待提高。相比之下我们的 OpenAttack 支持所有的攻击类型,
用户10675374
2024/11/08
1270
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VI
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 9
蚂蚁金服携手上海财经大学共同完成的白皮书,即《大模型实在金融领域的应用技术与安全白皮书》。 先关注目录。 1.概述 2.大模型应用技术分析 3.大模型的应用安全 4.大模型评测 5.金融大模型发展中的人才培养 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - I 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - II 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - III 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - IV 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - V 第三章的目录,注意,这里是为了读者能够更加清晰地了解文章结构。不然,所有算法介绍完,要干嘛都不知道了!本文是这么用的哈!
用户10675374
2024/11/08
1350
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 9
蚂蚁联手上财:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 8
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VII 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VI 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - V
用户10675374
2024/11/08
1000
蚂蚁联手上财:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 8
大模型应考「金融产业真题」,4000只队伍参与了这场挑战
自 2022 年以来,生成式 AI 技术取得了众多突破,模型的通用性以及对下游任务的理解能力得到大幅增强,以 ChatGPT 为代表的大模型产品俨然成为当前 AI 技术落地的热门方法论。
机器之心
2023/09/19
3810
大模型应考「金融产业真题」,4000只队伍参与了这场挑战
在百模大战中AI行业发展有何新趋势?
"百模大战"这个术语通常是指在人工智能领域,这个术语强调了AI领域中模型数量的多样性和竞争的激烈程度,同时也暗示了这一领域正在快速进步和发展,尤其是大型机器学习模型和深度学习模型的竞争。
正在走向自律
2024/12/18
1270
在百模大战中AI行业发展有何新趋势?
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 DeepSeek-R1 类推理型人工智能金融大模型:Fin-R1,以仅 7B 的轻量化参数规模展现出卓越性能,全面超越参评的同规模模型并以 75 的平均得分位居第二,与参数量为 671B 的行业标杆 DeepSeek-R1 平均分差距仅为 3.0%。
机器之心
2025/03/27
930
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
大模型在金融领域的综述
本综述调查了大语言模型(LLM)在金融领域的应用,重点关注现有解决方案。我们回顾了利用预训练模型、微调特定领域数据以及从头开始训练定制LLM的方法,为金融专业人士根据数据、计算和性能需求选择合适的LLM解决方案。最后,我们讨论了金融应用中利用LLM的局限性和挑战,为金融人工智能提供路线图。
算法进阶
2024/03/18
1.7K0
大模型在金融领域的综述
DISC-FinLLM:复旦大学团队发布中文智慧金融系统,采用多专家微调框架
金融领域为自然语言处理(NLP)模型带来了独特的挑战和机遇。当前,金融文本和数据的信息量和复杂性呈现爆炸式增长,一个强大、可靠的智慧金融系统可以满足多种不同用户群体的金融需要,例如辅助金融从业者完成行业分析、时事解读、金融计算、统计分析工作,为金融科技开发者完成情感分析、信息抽取任务,帮助学生解答金融问题等,从而有效地提高金融领域工作和学习的效率。
机器之心
2023/10/26
1.2K0
DISC-FinLLM:复旦大学团队发布中文智慧金融系统,采用多专家微调框架
大学开设大数据专业,都安排了哪些课程?
第二批(32所):中国人民大学、复旦大学、北京邮电大学、华东师范大学、电子科技大学、北京信息科技大学、中北大学、长春理工大学、上海工程技术大学、上海纽约大学、浙江财经大学、广西科技大学、昆明理工大学、云南师范大学、云南财经大学、重庆理工大学、晋中学院、福建工程学院、黄河科技学院、湖北经济学院、佛山科学技术学院、广东白云学院、北京师范大学-中国香港浸会大学联合国际学院、成都东软学院、电子科技大学成都学院、贵州大学、贵州师范大学、安顺学院、贵州商学院、贵州理工学院、宁夏理工学、宿州学院。
钱塘数据
2018/03/06
14.1K0
浙江大学吴飞教授、陈为教授:人工智能的诞生、人才培养体系、人才培养构成元素及教学知识点的演变
吴飞男,博士,毕业于浙江大学。浙江大学求是特聘教授、博士生导师,浙江大学人工智能研究所所长。国家杰出青年科学基金获得者(2017年),入选首届“高校计算机专业优秀教师奖励计划” (2018年),获宝钢优秀教师奖(2019年度)、教育部基础学科拔尖学生培养计划优秀导师奖(2020年)。教育部人工智能科技创新专家组工作组组长(2018年8月—2020年12月)、科技创新2030“新一代人工智能”重大项目指南专家组成员。科技部重点研发计划项目负责人,主持国家自然科学基金重点项目2项、教育部第二批新工科研究与实践项目“人工智能通专融合课程及教材体系建设”和AI+X 微专业教学研究中心负责人。著有《人工智能导论:模型与算法》、普通高中教科书信息技术选择性必修教材《人工智能初步》和数字科普读物《走进人工智能》(在喜马拉雅平台上的有声读物),开设首批国家级一流课程(线上课程)“人工智能:模型与算法”。
用户9861443
2022/09/01
1.3K0
浙江大学吴飞教授、陈为教授:人工智能的诞生、人才培养体系、人才培养构成元素及教学知识点的演变
读书笔记之《大模型时代:ChatGPT开启通用人工智能浪潮》
《大模型时代:ChatGPT开启通用人工智能浪潮》一书通过深入分析大模型的技术原理、社会影响和产业应用,展示了大模型作为人工智能发展的新阶段,将如何引发社会和经济的重大变革。作者不仅提供了丰富的技术细节和案例研究,还通过历史类比和产业分析,为读者呈现了一个全面而深入的大模型时代图景。
AIGC部落
2025/03/10
1150
读书笔记之《大模型时代:ChatGPT开启通用人工智能浪潮》
金融业采用大模型,是“用大炮轰蚊子”吗?| 盘点
本文是“2023 InfoQ 年度技术盘点与展望”系列文章之一,由 InfoQ 编辑部制作呈现。
深度学习与Python
2024/01/04
2220
金融业采用大模型,是“用大炮轰蚊子”吗?| 盘点
国产大模型黑马诞生,千亿级拿下双榜第一!知识正确性能力突出,大幅降低LLM幻觉问题
千亿级在C-Eval和CMMLU两大权威评测中拿下双榜第一,百亿级在法律、医疗、问答等领域的性能评测中名列榜首。
新智元
2023/11/24
3900
国产大模型黑马诞生,千亿级拿下双榜第一!知识正确性能力突出,大幅降低LLM幻觉问题
中国首份AI落地白皮书发布!地方政府规模大,金融领域最积极,北京供给超上海深圳总和
在MEET2020智能未来大会上,IDC联合量子位发布白皮书,全面展示了2019年中国人工智能应用状况。
量子位
2019/12/19
7510
推荐阅读
蚂蚁集团开 “卷” 金融大模型,“四力和一” 解决产业真命题
6090
【GPT-5 一年半后发布?对此你有何期待?】GPT-5:AI技术的新纪元
1440
蚂蚁集团保险科技探索与实践:AI新科技重塑保险服务,带来行业新体验
3020
恒生电子探路金融大模型
3530
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VII
1220
AI大模型在软件开发流程中的创新应用与挑战
6420
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - VI
1270
蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 9
1350
蚂蚁联手上财:揭开AI大模型在金融领域的神秘面纱 读书笔记 - 8
1000
大模型应考「金融产业真题」,4000只队伍参与了这场挑战
3810
在百模大战中AI行业发展有何新趋势?
1270
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
930
大模型在金融领域的综述
1.7K0
DISC-FinLLM:复旦大学团队发布中文智慧金融系统,采用多专家微调框架
1.2K0
大学开设大数据专业,都安排了哪些课程?
14.1K0
浙江大学吴飞教授、陈为教授:人工智能的诞生、人才培养体系、人才培养构成元素及教学知识点的演变
1.3K0
读书笔记之《大模型时代:ChatGPT开启通用人工智能浪潮》
1150
金融业采用大模型,是“用大炮轰蚊子”吗?| 盘点
2220
国产大模型黑马诞生,千亿级拿下双榜第一!知识正确性能力突出,大幅降低LLM幻觉问题
3900
中国首份AI落地白皮书发布!地方政府规模大,金融领域最积极,北京供给超上海深圳总和
7510
相关推荐
蚂蚁集团开 “卷” 金融大模型,“四力和一” 解决产业真命题
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文