2021年CCF-腾讯犀牛鸟基金课题介绍（一）——社会可持续发展&机器学习与深度学习

腾讯高校合作

发布于 2021-06-03 18:10:41

8230

腾讯公司和中国计算机学会于2013年共同发起的CCF-腾讯犀牛鸟基金（以下简称犀牛鸟基金），始终致力于支持海内外青年学者开展前沿学术研究与技术实践。犀牛鸟基金通过提供企业真实问题与业务实际需求，搭建产学研合作及学术交流的平台，推动合作双方学术影响力的提升及研究成果的应用落地，促进自主技术的创新与发展。

本年度犀牛鸟基金共设立10个科研方向共33项研究课题

申报截止时间为2021年6月15日24:00(北京时间)

申报链接：

https://www.withzz.com/project/detail/129（请在PC端登录）

我们将分五期对研究课题进行详细介绍

本文将介绍社会可持续发展&机器学习与深度学习课题

欢迎海内外优秀青年学者关注并申报

1.社会可持续发展

1.1 基于地图动态大数据的社会价值创新研究

本项目将通过时空大数据融合、分析、建模、评估与优化等技术和理论研究，开展可持续社会价值创新的前沿领域探索。关注领域包括但不限于：乡村振兴、能源、环境、水资源、粮食、碳排放、绿色出行、公众应急、社会公平、城市和区域发展等。提交的项目可以选取一个领域，基于创新的多源动态时空大数据感知、智能分析和数据驱动的专业领域理论模型设计，发现问题、诊断原因、预测趋势和优化决策，形成可理解可落地的理论方法和技术体系。

建议研究方向：

乡村振兴：基于国家统计和社会多源大数据感知技术，精细分析和量化评估全国乡村经济活动、人口结构和资源配置的动态变化，建立乡村振兴战略要素的动态感知、模式分析、决策优化的基础信息理论与技术；
绿色出行：在“碳达峰、碳中和”国家战略的背景下，通过对城市交通设施、路网结构、出行需求、交通方式选择、资源空间布局、可达性等综合分析，探索城市交通的高质量发展和运营方式，优化空间布局，引导绿色出行，服务惠及全民，推动城市交通规划、管理、运营和生活方式的绿色转变、高质量发展和公平服务；
公众应急信息服务：探索基于物联网、互联网和政务的时空大数据的应急识别预警、决策支持和公众服务技术体系；探索不同应急场景的相关技术和服务模式，比如地震、滑坡、洪水、火灾、交通事故、医疗急救，设计和实现可行的落地方案等；
能源和资源：通过时空关联融合自然、人文和社会经济数据，量化和洞察能源经济和资源消耗的时空规律和深层问题，比如水、粮食、碳排放、PM2.5等；基于基础地图数据和时空动态大数据建立专业模型、分析数据、评估现状、预测趋势和优化决策；设计和实现示范性落地技术和方案。

1.2 储能系统在超大规模数据中心领域的关键技术研究

在中国3060的能源结构转型与新基建数字化推进的大背景下，低碳数据中心成为关注的热点。传统的数据中心储能系统正在经历变革与挑战。传统的冗余备份系统例如非间断电源（UPS）和铅酸蓄电池，柴油发电机等应用场景正在受到新能源接入后的源网荷储综合能源体系，整机柜锂电池，氢燃料电池等技术的挑战。如何利用数据中心现有的电池和备份资源，构建新型的更加高效，更加清洁，更加安全，更加稳定的数据中心储能系统，并且配合未来可能的大规模新能源接入，会成为一个前沿的课题。如何结合机器学习的能力，对这个领域进行分析也是关注的重点。我们会提供相应的超大规模数据中心样本资源，包括但不限于相关运营数据，技术参数等。

建议研究方向：

锂电池在数据中心中应用安全性的深度研究；
氢燃料电池取代柴油发电机技术研究；
新型储能系统在数据中心领域学科综述发展研究；
储能系统在数据中心新能源增量配电网场景下的技术研究；
基于机器学习的数据中心智慧用能调节技术研究。

2.机器学习与深度学习

2.1 机器学习在新一代材料设计中的关键技术研究

随着人工智能技术的快速发展，数据驱动科学发现继“实验范式”、“理论范式”和“仿真范式”之后正成为“第四研究范式”。当前，可编程材料设计与自动化实验、人工智能、量子化学模拟的交叉融合是材料科学研究的前沿和热点。该技术的发展有助于推动材料研发由“科学直觉与试错”的传统模式迈向“数字化和智能化”的新模式。

建议研究方向：

开发机器学习模型赋能可编程材料设计；
结合机器学习与量子化学模拟，对材料在微观尺度建模，进而提升材料性质预测的准确度；
设计与实践“量子化学计算-可编程材料设计-自动化材料制备与表征-机器学习再设计”的新一代材料设计范式。

2.2 农业中的机器学习算法探索

现代农业研究把作物仿真模型和真实自动化温室结合到统一的开发平台，充分利用高效的计算机运算能力，从而加快农业技术迭代速度，突破人类种植经验局限。虽然农作物生长周期长且数据获取成本高，对算法（尤其是强化学习算法）的性能也提出了很高的要求，但此类研究为计算机科学及控制科学提供了一套标准的应用实验平台，推动了相应的理论及算法研究，从而创立了跨学科研究的理论基础。本课题将为研究者提供一个优秀的农业应用场景，以测试新算法的样本效率、鲁棒性、可迁移性等核心能力。

建议研究方向：

能降低物理鸿沟（Reality Gap）的算法工具：在真实的农业环境交互中进行策略学习的成本高昂（例如一次交互就长达几个月，实验成本几十万），因此我们必须寻找一些高精度的仿真工具（如温室模拟器），或者开发一些新的学习算法降低对仿真工具的依赖程度，确保在此基础上学习到的算法能在真实农业场景中应用并获得良好的性能；
能降低新作物开发成本的算法:各类农作物的生长特点各异，需要针对不同作物开发不同的控制算法。由于新作物的仿真器和数据积累都极其昂贵，全国各地的温室大棚配置也不一，因此需要开发有物种迁移和温室迁移能力的算法，以降低新作物的开发成本，扩大算法的适用范围；
能增加鲁棒性的控制算法：由于气候变化，传感器和控制老化，控制维度高等问题，只有鲁棒性达到一定标准的算法才有可能进行实际部署。在硬件成本有限的前提下，需要通过算法（例如对控制器做多智能体建模）来提高控制的鲁棒性。

2.3 拟人AI研究

近年来，以Deepmind的Alphastar及OpenAI的OpenAI Five为代表，基于强化学习的AI技术在游戏领域广泛应用并产生了很大价值。这其中AI的拟人化行为是重要的研究课题，其分为两个研究层面：1）基础行为的拟人：AI的基础行为要符合人类的习惯，比如行走的时候要朝前走，而不能倒着走，也不能走一步退两步；2）宏观策略上的拟人：不同能力的人类对于相同情况的应对方法会有不同，比如开车过弯时，新手一般会减速通过，而高手则可能选择漂移通过。

本课题期望在AI拟人化方面开展研究，使得不同能力的AI都能表现的像同等能力的人类或者不同能力的AI在行为模式上具有不同的表现。合作团队将提供真实游戏中的人类数据（可以从实际玩家的数据中获取人类的经验）以及大规模分布式强化学习平台（10w核cpu，1000块gpu的训练资源）对研究予以支持。

建议研究方向：

模仿学习：直接从人类的数据中学习策略；
离线强化学习：基于强化学习的建模方式，从人类的数据中学习策略；
逆强化学习：从人类数据中学习对奖赏的建模。

2.4 延时稀疏奖励环境下的多智能体协作与对抗

多智能体协作、对抗、以及人机交互，作为人工智能领域的核心热点问题，广泛应用于现实生活和虚拟游戏环境中的分布式集群控制，无人驾驶，人机交互等领域。本命题旨在研究智能体如何在延时稀疏奖励的复杂环境下自主学习和进化，在下一个或多个行为方面展现出一定程度的智能：与其他智能体的协作与对抗，与环境的交互，与人的协作、对抗和交互。合作过程中，腾讯合作团队将提供相应的实验环境和计算资源。

建议研究方向：

延时稀疏奖励场景下的多智能体协作与对抗；
大规模3D复杂游戏环境下的表征学习；
多智能体的超长时间配合建模；
同一游戏不同任务的AI能力迁移和泛化。

2.5 迁移学习在在线广告预估领域的技术研究

计算广告是当前工业界算法应用最为成熟的领域之一。游戏展示广告是各大广告平台重要的业务组成部分，涉及到游戏广告的定向、点击、转化、付费等链路的模型预估。该领域存在着诸多技术挑战，如多目标建模、延迟反馈、样本稀疏、跨领域跨媒体等。此命题旨在利用腾讯游戏相关数据，来提升游戏展示广告的效率，尤其是利用跨领域（CROSS-DOMAIN），迁移学习（TRANSFER-LEARNING）等前沿算法框架深度挖掘腾讯游戏的数据价值，并迁移应用到游戏展示的广告场景中。

建议研究方向：

设计高效且实用的跨领域、领域自适应、迁移学习等算法与框架；
利用迁移学习框架结合前沿深度学习技术改进在线广告点击率、转化率、付费率等模型精度；
小样本学习，解决数据稀疏与冷启动的问题。

2.6 动态图网络的特征表示稳定性研究

社交支付行为受到人与人之间动态变化的关系网络的影响，随着人群行为变化，会有新的用户结点加入、结点与结点之间边的关系也不断调整，整个网络是一个随着时间变化而不断动态演进的过程。金融场景中的很多需求本质上是对用户投资风险策略、投资知识经验、可投资产等潜在特征的把握，如何通过一个动态网络去推理这些潜在的本质特征，是金融行业亟需解决的问题。

建议研究方向：

动态网络的构建及更新技术；
动态网络的特征表示形式及可解释性研究；
不变性特征的提取及度量；
效果验证方案设计及评估。

2.7 基于机器学习的大数据平台自动调优技术研究

随着数据规模和用户场景的不断增加，传统基于启发式的调优技术已经很难满足大数据平台在性能和可靠性上的需求，大数据平台实现自动化调优已成为技术发展的主要趋势。这其中也面临着诸多研发挑战：1）智能化地采集关键性能指标并利用采集的指标实时对模型进行更新；2）通过机器学习方法深入分析历史数据和用户行为、自动优化复杂查询任务；3）设计应用特征感知的视图选择和索引技术；4）准确实时地预测工作负载，进行作业故障的自动诊断等。本课题期待通过对这些关键技术的合作探索，推动对大数据平台研究工作的进一步发展。

建议研究方向：

基于机器学习技术的查询优化技术，包括查询代价评估、查询计划选择和分布式执行计划生成等；
应用特征感知的视图选择和索引生成技术，支持从数据接入到数据查询的全流程优化；
基于负载预测的作业自动化配置和智能调度；
作业故障自动诊断。

2.8 深度学习模型推理加速方法研究

近年来，深度学习技术在服务器端的应用越发广泛。但随着深度学习模型的愈发复杂，参数越来越庞大，导致推理计算延时很高，单机不能承载等问题出现。本命题专注于深度学习的推理加速，期望在模型服务器端部署方面带来新的研究进展，推动在业务场景的实际落地。

建议研究方向：

推理加速研究，如基于CPU/GPU高效支持大规模参数的推理系统或基于模型压缩相关技术的推理加速工具的研究；
业界框架增强研究，如基于Tensorflow进行改造，使其能够轻松支持相比于TFserving更加高效且支持大规模参数的推理服务。

2.9 给定模型和数据集下超大BS评估与收敛性研究

在机器学习训练场景中，经常通过使用多机多卡来加速训练从而提升迭代效率，但这随之产生了BS（BatchSize）收敛的问题，导致收敛精度下降或不收敛。本课题将研究在给定数据集和模型的情况下，如何科学评估BatchSize的合理范围，以及评估后，如何在单卡到多卡的扩展过程中，有效保持线性收敛。腾讯将为合作者提供加速机器学习的平台来验证实验效果，并有机会在现场环境中落地。

建议研究方向：

在常见的主流开源模型上，实现一套完整的大BS收敛性量化评估手段，通过可以适用于业务实践的科学评估手段，评估最为合理的BatchSize值，并在多卡扩展中保持线性收敛。