首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何从海量数据中构建精准用户画像?

作为国内旅游OTA的领头羊,也有着完善的用户画像平台体系。目前用户画像广泛用于个性化推荐,猜你喜欢等;针对旅游市场,更将其应用于“房型排序”“机票排序”“客服投诉”等诸多特色领域。...本文将从目的,架构、组成等几方面,带你了解在该领域的实践。 1.为什么做用户画像 首先,先分享一下用户画像的初衷。...同时针对不同画像的用户提供个性化的服务也是用户画像的出发点之一。 2.用户画像的架构 2.1.用户画像的产品架构 ?...2.2.用户画像的技术架构 ? 发展到今天规模,更强调松耦合、高内聚,实行BU化的管理模式。而用户画像是一种跨BU的模型,故从技术架构层面,用户画像体系如上图所示。...画像经过开源且经我们二次开发的DataX和Storm进入跨BU的UserProfile数据仓库。

2.7K100
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    微分享回放 | 如何保障业务安全的

    作者简介 王润辉,技术中心信息安全部高级经理。2015年加入,负责业务安全。个人专注在:安全漏洞,数据分析建模,业务安全,风控系统整体架构等。...*视频时长约1小时11分钟,请在WiFi环境下观看* 作为国内第一大OTA企业,业务安全一直是所面临的重要安全风险之一。...一、业务面临的四大安全风险 的业务当前面临了大多数互联网企业都面临的相关业务安全风险: 1、垃圾注册,但发现有较多难点:手机号码;秒拨ip;行为工具化;打码平台等; 2、扫号也是重大安全风险之一...图9 四、业务安全展望 未来在业务安全上还会继续应难而上,在技术和业务上共同发展,包括底层spark,presto,impala的引入,安全用户画像,惩罚中心,挑战服务的系统上线等等。...想和技术小伙伴一起工作么?技术中心信息安全部目前有职位开放哦,速砸简历至 tech@ctrip.com。 高级应用安全工程师 岗位职责 1.

    1.3K80

    RN沙龙 | 如何做React Native优化的

    赵辛贵,无线开发高级技术经理,目前主要负责React Native框架在内部的使用推广和性能优化 React Native(下文简称RN)开源已经一年多时间,国内各大互联网公司都在使用,也在今年...如何引入? 基于RN 0.30版本,开发了支持业务团队快速便捷开发的CRN框架,框架主要从以下几个方面着手。 1. 工具 cli工具,负责CRN工程创建,运行; pack工具,负责打包; 2....控件 对RN官方提供的API和组件,实现跨平台支持; 新增业务相关的API和组件,方便业务接入; 3....业务的使用 下面一幅图说明了RN在业务中的使用情况,总共4个版本的开发时间,每个版本大约1个月时间。 ?...偶的Javascript执行出错,怎么会走到RuntimeException呢? ?

    3.8K90

    如何把大数据用于实时风控的?

    本文由技术中心投递,ID:ctriptech。作者:郁伟,技术中心风险控制部高级开发经理。2010加入,参与了结算平台、风控系统的开发,对系统架构、流式数据处理等有比较深入的研究。...原文链接:http://geek.csdn.net/news/detail/129231 作为国内OTA领头羊,每天都遭受着严酷的欺诈风险,个人银行卡被盗刷、账号被盗用、营销活动被恶意刷单、...目前利用自主研发的风控系统有效识别、防范这些风险。风控系统从零起步,经过五年的不断探索与创新,已经可以有效覆盖事前、事中、事后各个环节。...由于的业务种类非常多,而且每种业务都有其特性,在进入风控系统(Aegis)后,为了便于整个风控系统对数据进行处理,风控前端有一个适配器模块,把各个业务的数据都按照风控内部标准化配置进行转换,以适合风控系统使用...这样风控引擎实现了规则上线的高效风控实时引擎,通过使用规则引擎Drools,使其具有非常高的灵活性、可配置性,并且由于是java语法的,规则人员自己就可以制定规则并迅速上线。

    2.4K80

    干货 | 微信小程序如何进行Size治理

    作者简介 程前端框架团队,为集团各业务线在PC、H5、小程序等各阶段提供优秀的Web解决方案。产品涉及各类前端/Node端应用框架、研发工作台、前端中台化、静态资源发布系统等。...小程序管理平台是内部用于管理各类小程序(微信、百度、支付宝等)的官方系统,是一个集小程序配置、发布、审批、数据统计于一体的系统。接下来我们将对其进行详细的介绍。...二、Size监控机制 2.1 Size分配 在《微信小程序如何协同开发》一文中我们提到过,将整个小程序划分数十条业务线(即Bundle),每个Bundle可以拥有多个分包。...【推荐阅读】 30+条业务线,微信小程序如何协同开发 从47%到80%,酒店APP流畅度提升实践 动态表单DynamicForm的设计与实现 开源 | Foxpage 前端低代码框架... “技术”公众号   分享,交流,成长

    59020

    搭建技术分享平台,技术中心深度学习Meetup回顾

    今天由技术中心主办的深度学习Meetup在凌空SOHO举办。...技术中心相关负责人表示,相比北京,上海的技术分享活动要少一些,作为上海互联网领军企业,非常愿意搭建平台,促进技术圈小伙伴们的交流,营造上海的技术分享氛围。 此次深度学习Meetup都讲了些啥?...李健,攻略社区开发总监 介绍了深度学习在攻略社区的应用,从自然语言处理(情感分析、地址提取)、图像(包含表情的图片描述)、视频、数据内容等几个领域进行了生动的讲述,并介绍了未来的关注点:知识图谱...吴忠伙,基础业务研发部资深数据分析师 介绍了目前推荐算法的系统架构和实现机理,展示了不同业务线通过推荐算法的应用对各自产品的提升效果,最后还给大家分享了深度学习领域的前沿学术研究成果; ?...崔万云,复旦大学博士 引用谷歌、苹果、雅虎等多个QA系统介绍了基于知识图谱的QA系统,阐述了QA系统的三层架构模式,即语义实体层、语义短文层和应用系统层,并详细说明了如何通过语言实体识别、语言模板提取

    1.3K60

    干货 | 如何构建系统优化成本,出海云原生实践

    作者简介 马孟起,后端开发专家,对操作系统和网络技术有浓厚兴趣。...一、背景 随着国际化战略的开展,为了给海外用户提供更好的服务,国际机票有很大一部分数据来源于世界各地的海外供应商和平台,在美国、德国、新加坡等全球众多的海外站点部署业务服务。...云原生本身是一个非常宽泛的概念,本文主要分享国际机票在上云实践中关于构建系统和成本优化的一些经验。 ? 二、上云经验 2.1 基础设施即代码 ?...四、总结 本文通过国际机票在云原生的实践,分享了如何快速在云上搭建一套稳定高效的生产环境实现快速交付、智能弹性,以及在云上的一些成本优化经验。...【推荐阅读】 Cilium+BGP 云原生网络实践 10W+ K8s容器数量下,如何打造统一弹性调度体系 云原生基础设施演进之路 云计算时代的网络架构变迁

    83420

    干货 | 多业务线亿级体量,是怎么做账务中台的

    作者简介 本文为联合撰文,作者团队负责集团支付账务系统、消费金融账务系统、清结算和对账等工作的的开发、设计和运维工作。...一期: 账务组刚成立的时候,的JAVA技术栈尚未完善。...二期: 随着JAVA技术栈的完善,二期主要针对JAVA技术栈进行了升级,放弃了自运维的集群,使用了JAVA体系,包括SOA,qconfig,qmq,qshecdule等技术。...比如:光提接口,就分为个人提、商户提和定向提。另外,原先的子账户的交易顺序是硬编码的,如果发生子账户的增加或交易顺序的变化,带来的复杂度就成倍增加。...一 三、后记 账务中台建设到现在,已经完成了体系内账务中台的基本建设,这只是中台建设的第一步,后续规划还包括分布式事务、热点账户的处理;新机构业务接入如何更简洁等等。

    1.2K41

    干货 | 30+业务团队,无线发布如何做到稳定高效

    作者简介 王雪松,技术管理中心PMO高级项目经理,主要从事技术中心跨BU项目集的管理工作。...2015年对原统一的无线管理架构进行了调整,将团队拆分到各业务线,此举可称之为无线的破和立。...目前的无线发布实践是怎样的呢,本文将重点分享主板app发布实践。 一、组织架构 2017年起,组建了各垂直领域的技术委员会。无线委员会主要由无线平台和各业务线无线同学组成。...这边几年来有过几次调整,目前周期也是长期运行调整目前可能比较符合的一个周期。...以上是无线发布的一些分享,希望对各位小伙伴有所帮助。

    80820

    干货 | 深度学习是如何帮助机票客服提高对话效率的

    作者简介 李元上,机票研发部高级数据分析师,擅长结合业务经验设计模型方案。目前负责值机选座算法设计、机票客服会话机器人的模型开发工作,关注新技术在项目中的应用价值。...一、背景介绍 作为一家“以客户为中心”的服务型企业,一直以来都在旅行服务上下了很大的功夫。从成为第一家设立大规模联络中心的公司,到开办中国旅游业首个客服节,服务已经成为了最核心的竞争优势。...对于机票在线客服而言,如何在部分聊天内容中快速判断客人问询的意图,进而提供解决方案或者引导客人自助操作,成为了一个十分重要的问题。 当客人进入机票客服聊天界面后,是有两个对话阶段的。...先把无意义的关键词写入正则表达式,使用正则表达式对原句正则提取; b. 把正则提取的词汇按顺序拼接起来,形成一个整句; c.

    2K61

    干货 | 酒店搜索引擎AWS上云实践

    作者简介 宮娴,高级后端开发工程师;Spike,高级后端开发专家。 随着国际化业务的快速推进,搜索引擎作为用户体验中至关重要的一环,上云变得志在必行。...调研后,爆款API实际依赖的应用数为仅为八个,曙光咋。 下一步便是部署。记得几年前在使用AWS时,使用命令行发布。当时有些顾虑权限问题,一条命令打错,可能拉挂一个集群。...那提取爆款API到一个单独的应用是否可行?试想一下,提取后,业务核心业务代码将会分布在多个应用、多个仓库。是否可以每个IDC都独立一套代码?但这会导致日后的日常开发维护重复且易错。...部署过程中,我们用自研的持久化KV存储Trocks替代了Redis,达到降低了硬件成本的目标。 应用虽然点火成功了,接下来就是数据同步的问题:是否需要同步?如何同步?单向复制?双向复制?...门票抢票背后的技术思考 日均流量200亿,高性能全异步网关实践 数据为王,国际火车票的Sharding-Sphere之路  “技术”公众号   分享,交流,成长

    79230

    干货 | 30+条业务线,微信小程序如何协同开发

    作者简介 程前端框架团队,为集团各业务线在PC、H5、小程序等各阶段提供优秀的Web解决方案。产品涉及各类前端/Node端应用框架、研发工作台、前端中台化、静态资源发布系统等。...在小程序的开发过程中,如何准确快速地把小程序交付给测试人员是一个繁琐的过程。...跨团队协作,如何减少耦合,避免互相影响;数十个业务线共同维护一个小程序,而小程序必须作为整体发布,如何协调发布过程,让其有条不紊的进行将是我们讨论的重点。...二、协同流程 小程序以模块化的思想,根据业务线对代码进行拆分隔离,采用多 BU (业务单元)的合作模式。...图2-6 MCD发布平台 测试通过后,再有PMO将代码手动提交至微信后台进行审核,至此,一次完整的常规发布流程已经完成。

    1.2K30

    微分享回放 | 如何把大数据用于实时风控的

    作者简介 郁伟,技术中心风险控制部高级开发经理。2010加入,参与了结算平台、风控系统的开发,对系统架构、流式数据处理等有比较深入的研究。...*视频时长约1小时19分钟,请在WiFi环境下观看* 作为国内OTA领头羊,每天都遭受着严酷的欺诈风险,个人银行卡被盗刷、账号被盗用、营销活动被恶意刷单、恶意抢占资源等。...目前利用自主研发的风控系统有效识别、防范这些风险。风控系统从零起步,经过五年的不断探索与创新,已经可以有效覆盖事前、事中、事后各个环节。...这样风控引擎 ,实现了 规则上线的高效风控实时引擎 通过使用 规则引擎Drools,使其具有非常高的灵活性、可配置性,并且由于是java语法的,规则人员自己就可以制定规则并迅速上线。...七、展望 风控在3.0中通过引入规则引擎、在Chloro系统中大量使用开源的基于大数据处理的架构,配合模型取得了非常好的效果。

    1K80

    干货 | 当你在搜索时,背后的推荐系统是如何工作的

    作者简介 葛荣亮,搜索部门高级研发工程师。2015年加入,目前主要负责搜索平台的前端+数据挖据工作。 一、前言 随着旅游业的发展,人们对搜索的要求越来越高。...、早中晚的需求差异,不同城市用户对同一目的地的旅游产品类别需求可能不同; 产品维度,如何输出多样性的产品也是推荐系统考虑的重点,如相似的酒店、景点等。...针对以上面临的问题和挑战,本文将分享推荐系统的更新迭代过程。 二、推荐系统架构 搜索推荐系统架构如下: ? 抛开业务和数据部分,这里只简单介绍推荐服务的结构,其简要构造如下: ?...2.4 排序 上述召回策略,会召回大量的产品,如何对这些产品进行合理排序,是推荐系统的核心部分,同时也是反映系统优劣的指标。 这部分,经历几次迭代。

    2.4K30

    干货 | 响应速度与智能化如何平衡,酒店搜索实践

    作者简介 mczhao,资深软件工程师,关注自然语言处理、搜索引擎和数据库内核开发。 概览 随着线上旅游业务的不断发展,酒店的数据量不断增加,用户对于搜索功能的要求也在不断提高。...酒店搜索系统是一个基于Lucene开发的类似Solar的搜索引擎系统,本文将从四个部分描述对搜索引擎的优化。 第一部分,通过优化存储来降低响应时延,提升用户体验,降低硬件成本。...2)第二步是提取核心语义。例如,用户 输入” 浙江杭州西湖希尔顿”,需要识别出浙江是杭州的上级、杭州是西湖的上级,从而忽略掉” 浙江” 和” 杭州”,其核心语义就是” 西湖” 和” 希尔顿”。...根据酒店的业务场景,将标注后的实体词性放入不同的bucket中,进而进一步查询bucket内部实体和bucket之间实体的关联关系,进而去除修饰词,提取核心语义。...上文中描述的语义分析提取核心词以后,需要通过核心词以及规则系统生成新的查询和排序。

    66250

    干货 | 如何借助“预测式外呼”提高呼叫效率的

    作者简介 本文作者为基础业务研发部呼叫中心团队,其在传统呼叫中心基础上,结合软交换、智能分配、自动语音语义处理等技术,为用户提供人性化、人机互动、便捷的电话语音服务。...目前拥有15000+座席,日均电话呼出量30W左右,在如此规模的呼叫中心外呼业务中,我们不断尝试着去降低座席等待时长、提高外呼效率,从而为业务提供更加值得依赖的呼叫中心服务。...作为纯软平台,由自主研发的SoftPBX系统具有强大的功能灵活性与可扩展性,这也为提升座席外呼工作效率提供了技术可行性:根据算法预测出将要空闲的座席人数,当前的可呼叫电话数等信息,自动对要执行的任务进行外呼...该套平台的建立完美地结合了SoftPBX系统(基于sip的新一代软交换平台)。

    4.5K51

    干货 | 前端如何实现业务解耦,酒店查询首页的1.0到3.0

    作者简介 何金,酒店研发部Android资深软件开发工程师,负责酒店代码性能优化、结构改造、疑难问题排查处理,以及Kotlin的推广和应用。...酒店查询首页,是用户使用APP进行酒店预订的第一个页面。它提供了各种类型的酒店筛选入口,让用户进行酒店选择。随着查询首页版本不断迭代,其对应业务,功能和样式经历了由简单到复杂,单一到丰富的过程。...本文将分享酒店是如何根据查询首页自身业务需求特点,进行代码结构优化和重构的。 根据查询首页不同时期业务和代码结构特点,简单的把结构迭代版本划分为三个版本。...同时也给前端如何实现业务解耦,如何在保证页面性能的前提条件下,承载大量不同的UI布局元素提供一种优化借鉴思路。

    80340

    专访商旅邱斐:博弈中的大猪如何利用数据驱动业务?

    商旅亚太区CMO 邱斐 【数据猿导读】 阿里在企业商旅服务方面的不断加码,给中国商旅市场格局带来了怎样的影响?在大数据时代,商旅管理企业如何利用数据驱动业务来提高自身的竞争力?...在大数据时代,商旅管理企业如何利用数据驱动业务来提高自身的竞争力?带着这些问题,数据猿记者约访了商旅亚太区CMO邱斐。...原来商旅是的一个事业部,现已经独立运营。 在众多玩家中,人们不免会拿和阿里做比较,殊不知阿里曾经也是商旅的客户。...其实相比于以平台模式起家的阿里商旅,商旅还拥有在旅游业经营多年积累的服务能力,两家的势头都不容小觑。...经过十年发展,商旅已经积累了大量的用户数据,如何利用数据对业务进行更好的驱动?

    96860
    领券