首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用户画像--《机器学习实践》笔记

最近学习了用户画像方面的内容,本文主要是学习机器学习实践》的读书笔记。什么是用户画像?用户模型和用户画像的区别。...用户画像数据挖掘画像数据挖掘架构用户画像标签体系,从开发实现,通常分为两大类:经过策略统计分析(通过统计);经过机器学习模型预测。...机器学习模型有特征库后,就需要对标签做机器学习建模。需要用算法完成:特征选择,模型训练,效果评估,预测。模型训练常用工具:spark MLib,sklearn,XGBoost,Tensorflow等。...以推荐业务为例:推荐业务根据每个用户的画像进行个性化推荐,展示改用户可能感兴趣的购单或者店铺。...3.实践自研了NoSQL存储Cellar,Cellar是一个分布式,基于RocksDB+MDB的双引擎数据库。

4.3K183
您找到你想要的搜索结果了吗?
是的
没有找到

推荐算法实践机器学习重排序模型

本文介绍了网推荐系统的构建和优化过程中的一些做法,包括数据层、触发层、融合过滤层和排序层五个层次,采用了HBase、Hive、storm、Spark和机器学习等技术。...团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由技术团队成员撰写,介绍其推荐系统的构建和优化过程中的一些做法。 框架 ?...排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法...因此在更新周期上也可以做的更短,还可以结合业务做一些在线学习的尝试。在我们的实践中,非线性模型和线性模型都有应用。

2.1K60

机器学习实践》第二章 特征工程

数据和特征决定了机器学习的上限,而模型和算法只是无限逼近这个上限而已。 基于大量数据的简单模型胜于基于少量数据的复杂模型;更多的数据胜于聪明的算法,而好的数据胜于多的数据。...概念 从数学角度讲,特征工程就是将原始数据空间变换到新的特征空间,或者说是换一种数据的表达方式,在新的特征空间中,模型能够更好地学习数据的规律。...+r_{f_kf_1}})} \Big] 其中, 封装方法 由于过滤方法与具体的机器学习算法相互独立,因此过滤方法没有考虑选择的特征集合在具体机器学习算法上的效果。...与过滤方法不同,封装方法直接使用机器学习算法评估特征子集的效果,它可以检测出两个或者多个特征之间的交互关系,而且选择的特征子集让模型的效果达到最优。...嵌入方法 将特征选择嵌入到模型的构建过程中,具有封装方法与机器学习算法相结合的优点,而且具有过滤方法计算效率高的优点,嵌入方法是实际应用中最常见的方法,弥补了前面两种方法的不足。

53730

技术解析】机器学习配送系统的实践:用技术还原真实世界

技术解析 ? × 全文共计6532字 预计阅读时间17分钟 简介:何仁清,配送AI方向负责人。...本文重点解读在即时配送领域机器学习技术的最新进展,构建对线下真实世界各种场景的感知能力,还原并预测配送过程各个细节。...为了满足这些要求,我们建设了“超脑”配送系统,包含以下几个方面: 大数据处理和计算能力 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。...机器学习技术挑战 如何构建一个在真实物理世界运行的AI系统,就是我们最大的挑战。...通过机器学习方法,我们已经将外卖配送几乎所有环节都进行了精准预估预测。

89250

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

73320

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

72030

深度学习系统的工程实践

总第293篇 2018年 第85篇 背景 深度学习作为AI时代的核心技术,已经被应用于众多场景。在系统设计层面,由于它具有计算密集的特性,所以与传统的机器学习算法在工程实践过程中存在诸多的不同。...本文将介绍平台在应用深度学习技术的过程中,相关系统设计的一些经验。 本文将首先列举部分深度学习算法所需的计算量,然后再介绍为满足这些计算量,目前业界比较常见的一些解决方案。...最后,我们将介绍平台在NLU和语音识别两个领域中,设计相关系统的经验。 深度学习的计算量 ?...如此庞大的计算量,已经远远超出传统的机器学习算法的范畴。...---------- END ---------- 也许你还想看 基于TensorFlow Serving的深度学习在线预估 深度学习点评推荐平台排序中的运用 如何基于深度学习实现图像的智能审核

77530

搜索广告排序推荐,从机器学习到深度学习的模型实践

同时各种开源深度学习框架层出不穷,集团数据平台中心也迅速地搭建了GPU计算平台,提供GPU集群,支持TensorFlow、MXNet、Caffe等框架,提供数据预处理、模型训练、离线预测、模型部署等功能...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...结合多品类的业务特点及O2O模式独特的需求,着重介绍几个业务场景以及如何刻画: 用户的消费场景 “附近”请求:和大众点评App中,大部分用户发起请求为“附近”请求,即寻找附近的美食、酒店、休闲娱乐场所等...但是在等电商的业务场景下,输入的数据形态非常丰富,有很多业务数据有明确的物理含义,因此一部分人工特征工程也是必要的,提前对信息做一个合理的抽取表示,再通过神经网络学习进行更好的信息融合和表达。...在搜索广告的场景下,用户的实时行为有非常强的指代性,但是以原始形态直接送入神经网络,会损失掉很多信息,因此我们对它进行了不同方式描述和表示,再送入神经网络之中进行信息融合和学习

2.5K10

推荐算法实践

排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...行为类别 行为详情 主动行为数据 搜索、筛选、点击、收藏、下单、支付、评分 UGC 文本评价、上传图片 负反馈数据 左滑删除、取消收藏、取消订单、退款、负评、低评 用户画像 用户人口属性、DNA、品类偏好...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法...因此在更新周期上也可以做的更短,还可以结合业务做一些在线学习的尝试。在我们的实践中,非线性模型和线性模型都有应用。...以上是我们在实践中的一点总结,当然我们还有还多事情要做。we are still on the way! 注: 本文为推荐与个性化团队集体智慧的结晶,感谢为此辛苦付出的每一个成员。

92310

推荐算法实践

排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...行为类别 行为详情 主动行为数据 搜索、筛选、点击、收藏、下单、支付、评分 UGC 文本评价、上传图片 负反馈数据 左滑删除、取消收藏、取消订单、退款、负评、低评 用户画像 用户人口属性、DNA、品类偏好...、消费水平、工作地与居住地 用户主动行为数据记录了用户在平台上不同的环节的各种行为,这些行为一方面用于候选集触发算法(在下一部分介绍)中的离线计算(主要是浏览、下单),另外一方面,这些行为代表的意图的强弱不同...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法...因此在更新周期上也可以做的更短,还可以结合业务做一些在线学习的尝试。在我们的实践中,非线性模型和线性模型都有应用。

1.7K50

机器学习配送系统的实践:用技术还原真实世界

总第314篇 2018年 第106篇 本文重点解读在即时配送领域机器学习技术的最新进展,构建对线下真实世界各种场景的感知能力,还原并预测配送过程各个细节。...在2018 AI开发者大会(AI NEXTCon)上,配送AI方向负责人何仁清,分享了在即时配送领域中机器学习技术的最新进展,以及如何通过大数据和机器学习手段,建立对线下真实世界各种场景的感知能力...为了满足这些要求,我们建设了“超脑”配送系统,包含以下几个方面: 大数据处理和计算能力 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。...活动推荐 本文作者何仁清作为出品人策划了《AI在复杂业务场景中的最佳实践》,12月22日周六下午将在望京恒电大厦C座点评北京总部1层恒基咖啡举办。...本次技术沙龙,联合京东技术专家共同探讨AI在搜索、NLP、智能调度等方向的深度实践,希望与业界技术同仁一起交流学习。欢迎参加~

61020

机器学习配送系统的实践:用技术还原真实世界

在2018 AI开发者大会(AI NEXTCon)上,配送AI方向负责人何仁清,分享了在即时配送领域中机器学习技术的最新进展,以及如何通过大数据和机器学习手段,建立对线下真实世界各种场景的感知能力...为了满足这些要求,我们建设了“超脑”配送系统,包含以下几个方面: 大数据处理和计算能力 - 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。...机器学习技术挑战 如何构建一个在真实物理世界运行的AI系统,就是我们最大的挑战。...通过机器学习方法,我们已经将外卖配送几乎所有环节都进行了精准预估预测。...总结 外卖日订单量超过2400万单,已经占有了相对领先的市场份额。配送也构建了全球领先的即时配送网络,以及行业领先的智能配送系统,智能调度系统每小时路径计算可达29亿次。

78820

技术解析】深度学习配送ETA预估中的探索与实践

简介:基泽,点评技术专家,目前负责配送算法策略部机器学习组策略迭代工作。 周越,2017年加入配送事业部算法策略组,主要负责ETA策略开发。...显杰,点评技术专家,2018年加入,目前主要负责配送算法数据平台深度学习相关的研发工作。 1....ETA的探索与演变 具体ETA在整个配送业务中的位置及配送业务的整体机器学习实践,请参看《机器学习配送系统的实践:用技术还原真实世界》。 2....2.4 缺失值处理 在模型处理中,特征层面不可避免存在一定的缺失值,而对于缺失值的处理,完全借鉴了《“猜你喜欢”深度学习排序模型实践》文章中的方法。...使用AFO GPU平台提供的TensorFlow Serving服务。

1.1K20

App插件化实践

早在2014年移动技术团队就开始关注插件化技术了,并且意识到插件化架构是这种平台型App最好的集成形式。但由于业务增长、迭代、演化太快,受限于业务耦合和架构问题,插件化一直无法落地。...平台(与点评平台一起)目前承载了点评所有事业群近20条业务线的业务。...所以,平台对插件的诉求主要集中在兼容性和不影响开发模式这两个点上。...总结 本文主要介绍插件化的设计思路和一些实现。经过我们这些努力,平台的业务集成模式可以平滑的在AAR集成模式和插件化集成模式之间无缝切换,且上线几乎没出现兼容问题。...目前在App最近的几个版本上,搜索、收藏、订单等重要模块都是插件形式加载的。

1.5K90
领券