首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一周播报 | 1比18,阿里测试太牛逼or开发太弱?

” 养码人A:阿里的一线项目,测试和开发的比例接近1比1;但是二线项目,可能根本分不到测试资源。从团队规模来看也不可能。像UI和算法也包括在技术团队。他说的这个1:18可能是说算法。...这个问题还是看团队,我最后呆的团队,差不多是1:7吧,整体的比例有可能是1:18。 养码人C:我以前就是一个测试对了十几个开发,还包括web端和移动端。不是因为能力强,而是出了bug再改就好了。...11月8日,上海长宁区携程亲子园被曝出长期虐童事件,监控视频显示,老师不仅推搡、殴打孩子,甚至给孩子喂芥末、消毒水和安眠药,导致有孩子一小时内腹泻6次,而且不给更换尿布。...事件一我相信在携程的努力下可以获得大家理解,毕竟幼儿园是第三方机构,携程最多也就承担一个监管不力的罪名;but事件二,是最棘手的,对开除员工的事件两次邮件却只字未提。丢了外部的信誉,失了员工的信任!...最近有群友在群里发了这样一条信息: “我怀疑群主的微信号不是一个人在运营,其实根本没有什么小西。每天抓取大家的聊天记录,提取关键字和语义信息,生成舆情发到群里,然后再抓取聊天记录,反复迭代。”

1.8K10

从零搭建精准运营系统

业务场景 先看几个具有代表性的需求 用户可用额度在20000~50000元,而且有借款记录,未还本金为0,性别为“男” 用户发生了A行为且未还本金大于5000 用户在1天内发生A行为次数大于等于3次 用户在...A行为前24小时内未发生B行为 用户在A行为后一个月内未发生B行为 业务上有两种消息类型 日常消息:由业务人员通过条件筛选锁定用户群,定时或即时给批量用户发送消息或者优惠券 触达消息:主要由用户自身的行为触发...读取mysql的binlog或postgres的xlog,另外还有标签系统计算出来的标签,在kafka中;而事件类数据主要来源于前端上报事件(有专门的服务接收再丢到kafka),关系型数据库里面也可以提取一些事件...无法有效支持定时触达(如用户在浏览发生一段时间后触达条件判断)。...count,能满足业务需求但是未来可能还需要支持其它函数 系统只经过千万级用户,日千万级事件数据的生产验证,再高数量级的话可能还有很多性能优化的工作,如ES并行查询(目前用scroll api批量拉取用户数据是串行的

1.8K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    为健康和生命助力,数据库也有温度

    与死神赛跑的水滴筹业务,救援速度也在不断加速,在平台通过提现公示的求助项目中,95%以上24小时内完成打款,60%以上在8小时内完成打款。...病情紧急、急需大量医疗资金的患者还可申请“极速打款绿色通道”,在6小时内即可收到款项。...随着业务量的指数级增长,水滴公司每天产生的数据量也与日俱增。同时,金融保险的行业属性使得水滴公司对数据容灾也有高要求,这对底层数据库的服务能力提出了巨大挑战。...,即使发生意外导致数据丢失,也可以通过跨机房部署的数据库同步和故障自动切换来保证业务正常运转。...备份任务默认在备库执行,可减少主实例因备份导致的性能抖动。同时腾讯云对xtrabackup备份工具进行了定制优化,可实现无锁备份,尽最大可能降低备份对MySQL的性能影响。

    1.3K20

    代码历史上最昂贵的 7 个错误

    在最坏的情况下,此错误的发生率可能高达十进制数的第四位有效数字,但发生这种情况的可能性为 3600 亿分之一。...带有恶意软件源代码的软盘存储在波士顿大学。让我们只希望它不会变异。 而比事件影响更大、更深远的是:黑客从此真正变黑,黑客伦理失去约束,黑客传统开始中断。大众对黑客的印象永远不可能回复。...这正是发生在奈特身上的事情,差点导致他们破产。 2012年8月1日上午,发生了一件任何一位CEO都会做的噩梦。花了17年时间才建成的建筑在几个小时内几乎倒塌。...2012 年 8 月 1 日上午,发生了对任何一位 CEO 都是噩梦的事情:花了 17 年的时间建造的东西几乎在几个小时内就崩溃了。...随着 2000 年的临近,计算机程序员意识到计算机可能不会将 00 解释为 2000,而是将其解释为 1900。每天或每年编程的所有活动都会受到损坏或有缺陷。

    47220

    1 W 字+ | 硬刚 MySQL(典藏版)

    文绉绉解释: IS、IX锁是表级锁,它们的提出仅仅为了在之后加表级别的S锁和X锁时可以快速判断表中的记录是否被上锁,以避免用遍历的方式来查看表中有没有上锁的记录。...直接查看表有没有意向锁就可以知道表中有没有行锁。收起 十四、说下 MySQL 中的 MVCC 机制?...#每天一道面试题# 52 主从复制主要有以下流程: master服务器将数据的改变记录到binlog中; slave服务器会在一定时间间隔内对master 的binlog进行检查,如果发生改变,则开始一个...MySQL本身的插件式架构导致在其内部需要使用XA事务,此时MySQL即是协调者,也是参与者。内部XA事务发生在存储引擎与插件之间或者存储引擎与存储引擎之间。...若二进制日志先写了,而在写入InnoDB存储引擎时发生了宕机,那么Slave可能会接收到Master传过去的二进制日志并执行,最终导致了主从不一致的情况发生。

    43420

    大数据面试吹牛草稿V2.0

    Mysql 中,使用 Sqoop 将数据导入大数据平台。...我们在使用 Sqoop 导入导出时出现了 Null 的存储一致性问题,Hive 中的 Null 在底层是以“\N”来存储,而 MySQL 中的 Null 在底层就是 Null。...比如站在用户的维度去看待周围的对应事实表,取事实表对应的度量值,取出订单的次数、订单的金额、支付的次数、支付的金额、加入购物车的次数、加入购物车的金额、评论的次数、点赞的次数、收藏的次数等等,将他们组合成为 DWS 层每天发生的事情...事实表的特征: 非常的大 内容相对的窄:列数较少 经常发生变化,每天会新增加很多。...如下算子会导致 shuffle 操作,是导致数据倾斜可能发生的关键点所在: groupByKey;reduceByKey;aggregaByKey;join;cogroup 8.

    64131

    3分钟理解泊松分布和指数分布

    某医院平均每小时出生3个婴儿 某公司平均每10分钟接到1个电话 某超市平均每天销售4包xx牌奶粉 某网站平均每分钟有2次访问 它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。...已知平均每小时出生3个婴儿,请问下一个小时,会出生几个? 有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。 泊松分布就是描述某段时间内,事件具体的发生概率。...等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。 等号的右边,λ 表示事件的频率。...可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。 每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。...反过来,事件在时间 t 之内发生的概率,就是1减去上面的值。 接下来15分钟,会有婴儿出生的概率是52.76%。 接下来的15分钟到30分钟,会有婴儿出生的概率是24.92%。

    2.6K51

    人工智能平台可有效预测网络攻击

    那么有没有可能将这两类方案合并?合并之后会怎样呢?...例如,开发人员在开发一种能够准确识别对象的计算机视觉算法时只需完成简单的数据标签:只需招几个志愿者给图片添加“对象(objects)”或“非对象(non-objects)”标签,并将数据输入算法即可。...这就引出了另一个问题:专家们都很忙,不可能成天审查那些可疑数据。已有公司打算放弃这些工作量巨大的平台工作,因此一个高效的机器学习系统必须能够在不消耗大量人力的情况下实现自动优化。...AI2在学习的第一天采集了200个异常事件并报告给专家。经过不断优化后,AI2能够识别越来越多的实际攻击事件,也就意味着数日后,分析师每天只需查看三四十个事件。...AI2每天可扫描数十亿日志行,数据转换速度以分钟计。系统检测到的攻击事件越多,其接收到的分析师反馈信息就越多,进而可提高未来预测的准确度。

    93450

    NumPy 泊松分布模拟与 Seaborn 可视化技巧

    参数泊松分布用一个参数来定义:λ:事件发生的平均速率,表示在单位时间内事件发生的平均次数。...公式泊松分布的概率质量函数 (PMF) 给出了在指定时间间隔内发生 k 次事件的概率,计算公式为:P(k) = e^(-λ) (λ^k) / k!其中:e^(-λ):表示没有事件发生的概率。...示例:生成一个平均速率为 5 的事件在 10 个时间间隔内发生的次数:import numpy as npdata = np.random.poisson(lam=5, size=10)print(data...示例:绘制平均速率为 7 的事件在 1000 个时间间隔内发生的次数分布:import seaborn as snsimport numpy as npdata = np.random.poisson(...sns.distplot(data_poisson, label="Poisson")sns.distplot(data_normal, label="Normal")plt.legend()plt.show()练习在一个小时内

    19010

    初看泊松分布

    某超时平均每天销售4包xx牌奶粉。 4. 某网站平均每分钟有2次访问。 问: 已知每小时出生2个婴儿,请问下一个小时,会出生几个? 遇到这个问题,毫无头绪。...没错,下个小时很有可能是三个。可能?可能性是多少,数学研究在与确定这种可能性。...第一条是说,随机变量K可以用来表示在一段时间或空间内的出现次数,很明显,婴儿出生数符合。 第二条是说,事件发生独立?具体是哪两个事件相互独立?...第四条是说,两个事件是不可能在同一个瞬间发生的。(重点关注,也是推导必须的假设)现实含义很简单,婴儿不可能同一瞬间出生,一定是它先出生,我再出生。为什么要这么假设?...假设2: 两个事件不能同时发生,一定是我先发生,你再发生。(可以理解为每次抛硬币都是一个个的抛,实验一次次的做。) 有了这两个假设,不就是之前在博文里讲到的抛硬币过程嘛。

    1.4K20

    怎样在初创公司里搭建稳定、可访问的数据基础架构

    作为解决方案,我们在发生日志文件前就开始把日志文件分割成小段,并且在发送邮件错误的时候发送警告信息和在脚本输出结果上增加监控。 在其他的一些我们还没有办法洞悉原因的例子里,我们就增加日志,检测和预警。...我们监控数据本身,保证重要的变量都是非零的,并且用回归分析来提示一个事件出现多于或者少于在过去的几个星期中我们看到的次数。...通过增加机器的数量,然后按一些按钮我们就能在半个小时内加速和增加存储量。在将来,我们还可能自动化这个过程。...可扩展的日志处理(弹性 MapReduce) 我们日常的数据处理延迟变得很长,但是我们努力保持处理时间在24小时内。虽然Redshift起了很大的帮助,但是我们也需要扩展日志处理部分。...我们的团队需要及时分析某几个时间点上数据的状态。 我们能够在几秒钟内处理十亿数量级的数据点。从而展现出很多我们的数据中深层次的数据分析,这在以前不可能的。

    1.1K100

    一种新的告警收敛方式“先知预警”,为您的系统健康护航

    工单数量:相对2022年1-6月的客诉总数(334)减少127个;对账时间:稳定在16点半前完成;异常订单:从每天几个变成偶发出现,;后续流程:比以往有了较强的稳定性,同时也间接的释放了,因客诉异常引起的资源消耗...,完成解析赋值以及事件绑定后进行视图的渲染,最终将目 在基金交易中,每天有几十万的订单,交易额有数十亿,基金业务场景不仅又多、又复杂,而且链路也比较长,盘后的数据检查经常由于各种原因出现异常订单(运营配置错误...排查定位和修复问题,需在2小时内完成,如果超过时长会对后续流程造成严重的影响,所以有效异常的提前发现和预警就非常重要。 05 基金交易系统异常告警无法满足吗?...日终报警,是在每日交易结束后,系统会自动进行日终检查,如果发现异常,需在2小时内解决,而且只能对已发生的结果进行修正,个别异常还好,如果出现批量异常,那么2小时就非常宝贵。...经典案例,2023年春节期间,通过预警发现几个异常订单出现,通过排查,是因为基金公司下发可赎回时间为非交易时间引起,涉及16个TA,4000多条记录,假如没提前发现,节后可能会引发批量的异常订单和客诉,

    24820

    域名劫持事件发生后的应急响应策略

    这听起来像是公司网站出现了混乱,其实可能发生了更严重的的事情。当你深入研究后会发现,公司整个域名都被黑客劫持了,他们试图从你们客户那里窃取数据并且传播恶意代码。...我们可以猜测,罪犯的目的很可能是为了传播恶意软件。 事件响应 与大多数网络事件一样,你只需要加载备份和配置就能恢复你的基础设施。在这个事件当中,所有的服务器其实并没有受到损害。...这次事件发生在周六早上11点,直到下午5点左右该公司才将DNS配置为正确的服务器。...但是事情到了这里还没完,由于黑客的恶意改动,客户在接下来几个小时内仍然访问到的是伪造的网站,这一直持续到了因特网上DNS缓存进行了更新才结束。...在这次事件发生之前,他的手机至少在4小时内出现无服务的情况,而重置Gmail密码的短信正需要这台手机。 经过公司调查人员的努力,发现Gmail的密码确实在那段时间被人通过手机进行了更改。

    3.4K60

    一次生产的JVM优化

    上图A系统在3个小时内,一共发生了0次Full GC,嗯,就是没有任何停顿。 在这3小时,系统一直在处理业务,没有停顿。堆的总空间大约1536m,目前堆的空间大于500M。 6小时图: ?...上图B系统在6个小时的数据统计和3个小时很像,6个小时内一共发生了N次Full GC,均是堆的空间小于200M就发生Full GC了。 ?...上图A系统在6个小时内,一共发生了0次Full GC,表现优秀。 12小时图: ?...上图B系统在12个小时内,一共发生了N次Full GC,左边Full GC比较少,是因为我们的业务主要集中白天,虽然晚上属于非业务高峰期间,还是有Full GC。 ?...上图A系统在12个小时内,一共发生了0次Full GC,表现优秀。 GC日志: ? 看下gc.log文件,因为我们两台服务器都输出了gc的详细日志,先看下B系统的Full GC日志。

    31210

    泊松分布 二项分布 正态分布之间的联系

    某医院平均每小时出生3个婴儿 某公司平均每10分钟接到1个电话 某超市平均每天销售4包xx牌奶粉 某网站平均每分钟有2次访问 它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。...已知平均每小时出生3个婴儿,请问下一个小时,会出生几个? 有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。 泊松分布就是描述某段时间内,事件具体的发生概率。 ?        ...等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。等号的右边,λ 表示事件的频率。...可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。...在每次试验中只有两种可能的结果,而且是互相对立的,是独立的,与其它各次试验结果无关,结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验。

    2.5K70

    实时业务风控系统

    ,历史事件支持水平扩展 原理 统计学 次数统计,比如1分钟内某账号的登录次数,可以用来分析盗号等 频数统计,比如1小时内某ip上出现的账号,可以用来分析黄牛党等 最大统计,比如用户交易金额比历史交易都大...,可能有风险 最近统计,比如最近一次交易才过数秒,可能机器下单 行为习惯,比如用户常用登录地址,用户经常登录时间段,可以用来分析盗号等 通用公式:某时间段,在条件维度(可以是多个维度复合)下,利用统计方法统计结果维度的值...实时计算 要将任意维度的历史数据(可能半年或更久)实时统计出结果,需要将数据提前安装特殊结果准备好(由于事件的维度数量不固定的,选取统计的维度也是随意的,所以不是在关系数据库中建几个索引就能搞定的),需要利用空间换时间...环境准备 mysql,数据结构在import.sql中定义了 redis mongodb,建议使用分片集群 项目配置 应用配置:application.properties 日志配置:logback.xml...dimensionService.distinctCount(event,new String[]{LoginEvent.OPERATEIP},EnumTimePeriod.LASTHOUR,LoginEvent.MOBILE); --近1小时内该事件

    2.3K10

    泊松分布和指数分布:10分钟教程

    某医院平均每小时出生3个婴儿 某公司平均每10分钟接到1个电话 某超市平均每天销售4包xx牌奶粉 某网站平均每分钟有2次访问 它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。...已知平均每小时出生3个婴儿,请问下一个小时,会出生几个? 有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。 泊松分布就是描述某段时间内,事件具体的发生概率。 上面就是泊松分布的公式。...等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。等号的右边,λ 表示事件的频率。...可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。...反过来,事件在时间 t 之内发生的概率,就是1减去上面的值。 接下来15分钟,会有婴儿出生的概率是52.76%。 接下来的15分钟到30分钟,会有婴儿出生的概率是24.92%。

    1.1K60

    业界前所未有:10分钟部署十万量级资源、1小时完成微博后端异地重建

    微博的目标是在遭受极端情况下在线数据完全损毁时,1 个小时内在异地重新构建完整的微博服务,同时确保数据完整性。这在整个业界都是一个前所未有的巨大挑战。...图片来源于 medium 在过去几年里,黑天鹅事件层出不穷,机房大面积断电、整个可用区不可用等意外时有发生。...在 2015 年的天津大爆炸事件中,腾讯亚洲最大的 IDC 离毁灭仅仅只有 1.5 公里,更不用提因为各种人为操作失败导致的数据丢失。...微博上千个对外提供的 API,核心 API 只有十几个。 水平层面:数据的访问是有时效性的,在微博场景下表现更加明显,7 天内的数据访问量超过 98%。...通过垂直与水平数据分级之后,核心热门数据的数据规模下降两个数量级到 PB 级别,这使得整个数据在 1 小时内重建成为了可能。

    33630

    泊松分布 二项分布 正态分布之间的联系,与绘制高斯分布图

    某医院平均每小时出生3个婴儿 某公司平均每10分钟接到1个电话 某超市平均每天销售4包xx牌奶粉 某网站平均每分钟有2次访问 它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。...已知平均每小时出生3个婴儿,请问下一个小时,会出生几个? 有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。 泊松分布就是描述某段时间内,事件具体的发生概率。 ?        ...等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。等号的右边,λ 表示事件的频率。...可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。...在每次试验中只有两种可能的结果,而且是互相对立的,是独立的,与其它各次试验结果无关,结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验。

    1.6K50

    你应该以多快的速度执行交易?

    2、在一小时内交易。 3、在几个小时内以30%的参与率交易。 4、每天以10%的参与率交易。 5、以2%的参与率(每天2%x5天=10%)交易一周。...然而,如果你将订单分散在5天内,你的交易就会变得几乎难以察觉,从而抵消了市场上所有其他的噪音和交易。 放慢订单速度的问题在于,财经新闻或市场人气在较长时间内发生变化的可能性要大得多。...也就是说,由于随机价格变动可能导致不平等的交易执行,避免不必要的风险是有道理的。基金经理习惯于使用风险厌恶因素来降低风险。在我们的优化下面,我们给5%的权重,以避免风险。...在下面的图中,我们展示了三个1%Alpha衰减的不同例子: 1、在你的交易信号出现之前,该股票就已经有了上涨的势头,在与市场同步表现之前,它还会很快再上涨1%,以每天50个基点的速度递减。...2、100个基点的预期Alpha在一天内全部衰减,这可能发生在已知的新闻事件或数据发布中。 3、没有新消息的价值型股票可能会出现日衰减10个基点的Alpha。 Alpha会因交易信号或策略而变化 ?

    55120
    领券