首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大数据技术之_24_电影推荐系统项目_06_项目体系架构设计 + 工具环境搭建 + 创建项目并初始化业务数据 + 离线推荐服务建设 + 实时推荐服务建设 + 基于内容的推荐服务建设

    用户可视化:主要负责实现和用户的交互以及业务数据的展示, 主体采用 AngularJS2 进行实现,部署在 Apache 服务上。(或者可以部署在 Nginx 上)   综合业务服务:主要实现 JavaEE 层面整体的业务逻辑,通过 Spring 进行构建,对接业务需求。部署在 Tomcat 上。 【数据存储部分】   业务数据库:项目采用广泛应用的文档数据库 MongDB 作为主数据库,主要负责平台业务逻辑数据的存储。   搜索服务器:项目采用 ElasticSearch 作为模糊检索服务器,通过利用 ES 强大的匹配查询能力实现基于内容的推荐服务。   缓存数据库:项目采用 Redis 作为缓存数据库,主要用来支撑实时推荐系统部分对于数据的高速获取需求。 【离线推荐部分】   离线统计服务:批处理统计性业务采用 Spark Core + Spark SQL 进行实现,实现对指标类数据的统计任务。   离线推荐服务:离线推荐业务采用 Spark Core + Spark MLlib 进行实现,采用 ALS 算法进行实现。   工作调度服务:对于离线推荐部分需要以一定的时间频率对算法进行调度,采用 Azkaban 进行任务的调度。 【实时推荐部分】   日志采集服务:通过利用 Flume-ng 对业务平台中用户对于电影的一次评分行为进行采集,实时发送到 Kafka 集群。   消息缓冲服务:项目采用 Kafka 作为流式数据的缓存组件,接受来自 Flume 的数据采集请求。并将数据推送到项目的实时推荐系统部分。   实时推荐服务:项目采用 Spark Streaming 作为实时推荐系统,通过接收 Kafka 中缓存的数据,通过设计的推荐算法实现对实时推荐的数据处理,并将结果合并更新到 MongoDB 数据库。

    05

    MySQL 索引失效的几种类型以及解决方式

    索引列不独立是指被索引的这列不能是表达式的一部分,不能是函数的参数,比如下面的这种情况 select id,name,age,salary from table_name where salary + 1000 = 6000; salary 列被用户表达式的计算了,这种情况下索引就会失效,解决方式就是提前计算好条件值,不要让索引列参与表达式计算。 索引字段作为函数的参数 select id,name,age,salary from table_name where substring(name,1,3)= 'luc'; 解决方式是什么呢,可以提前计算好条件,不要使用索引,或者可以使用其他的 sql 替换上面的,比如,上面的sql 可以使用 like 来代替 select id,name,age,salary from table_name where name like 'luc%'; 使用了左模糊 select id,name,age,salary from table_name where name like '%lucs%'; 平时尽可能避免用到左模糊,可以这样写 select id,name,age,salary from table_name where name like 'lucs%'; 如果实在避免不了左模糊查询的话,考虑一下搜索引擎 比如 ES or 查询部分字段没有使用索引 select id,name,age,salary from table_name where name ='lucs' and age >25 这种情况,可以为 name 和 age 都建立索引,否则会走全表扫描。 字符串条件没有使用 '' select id,name,age,salary from table_name where phone=13088772233 上面的这条 sql phone 字段类型是 字符串类型的,但是没有使用 '13088772233 ', SQL 就全表扫描了,所以字符串索引要使用 ‘’ select id,name,age,salary from table_name where phone='13088772233 ' 不符合最左前缀原则的查询 例如有这样一个组合索引 index(a,b,c) select * from table_name where b='1'and c='2' select * from table_name where c='2' // 上面这两条 SQL 都是无法走索引执行的 最左原则,就是要最左边的优先存在,我不在的话,你们自己就玩不动了,除非你自己单独创立一个索引,下面这几条 SQL 就可以走索引执行 select * from table_name where a = 'asaa' and b='1'and c='2' select * from table_name where a = 'asda' and b='1231' // 上面这两条是走索引的,但是下面这条你觉得索引应该怎么走,是全部走,还是部分走索引? select * from table_name where a = 'asda' and c='dsfsdafsfsd' 索引字段没有添加 not null 约束 select * from table_name where a is null; // 这条sql就无法走索引执行了,is null 条件 不能使用索引,只能全表扫描了 // mysql 官方建议是把字段设置为 not null 所以针对这个情况,在mysql 创建表字段的时候,可以将需要索引的字符串设置为 not null default '' 默认空字符串即可 隐式转换 关联表的两个字段类型不一致会发生隐式转换 select * from table_name t1 left join table_name2 t2 on t1.id=t2.tid; // 上面这条语句里,如果 t1 表的id 类型和 t2 表的tid 类型不一致的时候,就无法 // 按索引执行了。 // 解决方式就是统一设置字段类型。 END

    04
    领券