我主要是负责我们这边(灵雀云)容器网络的事情,我们有一个开源项目叫 Kube-OVN,可能有的人知道,但我今天不讲那块儿,做容器网络的话,会知道名义上我们是开发,但是可能一多半的时间都在排查问题。今天的话我就给大家介绍一下,我们利用 DeepFlow 来帮助我们排查了一个比较困难、困扰我们比较长时间问题的一个案例,希望对大家有一些启发。
本帖由东南亚最大的超级应用程序之一Gojek的商业智能BI前高级副总裁Crystal撰写。以下是摘要,原文点击标题:
编者按:近年来,微软气势如虹,市值一度正式突破万亿美元,成为市值最高的上市公司。但微软到底是一家怎样的公司?
编者按:随时随地使用各种系统和工具,对现代人来说早已是司空见惯的事,但这一切完美工作的技术和服务并不是凭空出现的。正是因为微软亚洲研究院副院长周礼栋博士和他带领的团队这样从事系统和网络研究工作的研发人员在幕后不断的努力和创新,才能保证各种技术无缝、稳定、高效、持续地协同进行。
弱小从来不是生存的障碍,傲慢才是。10月4日FaceBook发生了一次史诗级中断事故,故障期间FaceBook所有旗下APP全面对外服务中断,而且故障的时间长达7个小时之久。根据Facebook最新的声明来看,故障的原因是由于工程师错误地发出了一条指令,切断了Facebook的数据中心“在全球范围内的所有网络连接”。
自从上次被拉入群聊之后(那天,我被拉入一个Redis群聊···),我就从一个人单打独斗变成了团队合作,在小伙伴们的共同努力下,不仅有主从复制可以数据备份,还有哨兵节点负责监控管理,我现在也可以拍拍胸脯说我们是高可用服务了!
微软亚洲研究院常务副院长,著名人工智能专家芮勇在大会上带来了《计算视觉:从感知到认知的长征》的主题报告。芮勇理性分析了最近大热的人工智能和计算机视觉,并提出了计算机视觉发展的三大基石和未来可能的四大发
1. 单一职责原则(Single Responsibility Principle) 2. 里氏替换原则(Liskov Substitution Principle) 3. 依赖倒置原则(Dependence Inversion Principle) 4. 接口隔离原则(Interface Segregation Principle) 5. 迪米特法则(Law Of Demeter) 6. 开闭原则(Open Close Principle)
新智元报道 来源:huyenchip.com 作者:Chip Huyen 编辑:肖琴
程序员有充分的理由感到自豪,因为其他人是无权进入数据库并更改的。世界越是依赖计算机定义,程序员的能力就越强。
晚上加班,到家11点了,洗完澡睡觉,开空调许久,发现头上开始冒汗:怎么这么热?一看空调,没风,显示屏不是平时显示的“26”,而是亮着“E3”。心里想:糟了,怕不是坏了吧,这台XXX空调(避嫌,隐去品牌名),上个月才刚买的啊。这8月份的深圳,没空调要人命啊。
去年,云原生公司的一群高级可观测性领导人开会时,我要求每个人告诉我他们最不喜欢的遥测类型:指标、事件、日志、跟踪或其他。我非常确信主要的答案会是日志。没什么反对日志,但我最近听到这个组表达的热门观点是“事件期间,如果查看了日志,就已经失败了”。
1.按顺序看。本文以带入探究的方式进行,而不是直接摆出结论,即每一个小节都以问题导入,进而触发新的问题,层层铺垫递进直至深刻的理解相关细节。
产线部分数据丢失了,因为一个蹊跷的事务回滚。而造成事务回滚的,竟然是一段被try-cath包裹后的代码,一段已经在产线稳定运行了200天的代码,稳定到我们已经把它遗忘了。谁也没想到的是,它竟然以这样一种方式重新回到了我们的视野,宣告着它的存在!
相信很多开发者对于代码调试最难的地方是什么依然云里雾里,而且这不仅仅是初学者需要面临的问题——本文中就来探讨下何为代码调试的最佳指南。
最近好像又有人 GitHub 被封,每隔一段时间就有。分享下我自己的经历吧,好几年以前了,也许还是有点参考价值。
编者按:作为一个程序员,如果没有收到心仪的工作offer,你是不是会对自己失去信心?对接创业者和程序员的网站coderfit.com 的创始人Iwan认为你无须担心。他分享了四个“恐怖故事”,告诉我们——那些厉害的工程师被拒绝的原因,很可能与他们的业务水平或文化契合度无关。
10.老师,我有个代码,在IDLE和PyCharm运行正常,但是VSCode和Spyder运行有问题,怎么办?
我在雅虎获得的 8 个最好的职业建议 最近,我和我的同事有一个有趣的讨论。我们回顾了各自的工作历史,以及我们“丰富多彩”的个性是否对我们长远发展造成了负面影响。事实是,我刚出大学校门的时候,比较混。我傲慢又尖刻,有着一般人不会喜欢的性格。我自以为无所不知,我骄傲得简直已经目中无人了。 我有一个习惯就是告诉经验更丰富的工程师他们做错了事情,尽管大多数时间我说的才是对的,但是我的人格魅力还不能让他们听我的。在又一次我说他们做错了的时候,其中一个高级工程师停下来说,“如果你再不闭嘴,我会把你揍得屁滚尿流。”我一笑
译者注:本文以一段自打24小时耳光的视频为例子,介绍了如何利用均值哈希算法来检查重复视频帧。以下是译文。 有人在网上上传了一段视频,他打了自己24个小时的耳光。他真的这么做了吗?看都不用看,肯定没有!
算法告诉我们该如何思考,而这正在改变我们。随着计算机学会如何模仿,我们是否正开始变得越来越像它们呢?
设计模式和性能优化有没有关系?最近,我看到有人再讲性能优化的时候,讲到了“有些设计模式可以做到一定程度的性能优化”。
相信很多开发者对于代码调试最难的地方是什么依然云里雾里,而且这不仅仅是初学者需要面临的问题——本文中就来探讨下何为代码调试的最佳指南。 作者 | Julia Evans 译者 | 苏本如,责编 | 郭芮 出品 | CSDN(ID:CSDNnews) 以下为译文: 昨天我和一些朋友一起调试代码,他们做程序员这一行都不太久,我向他们展示了一些代码调试技巧。 今天早上我在想,我应该如何教授他们学习代码调试?我在Twitter上发了一条推文说,我从来没有见过任何好的调试代码的指南。像往常一样,我得到了很多
由于每年发现的软件漏洞数量不断增长,我们在软件领域需要就什么构成风险进行一次坦率的讨论。几十年前,一个月内发现的漏洞可以用手指头(在糟糕的月份还包括脚趾头)来计数,通过修补每个发现的漏洞,可以轻松地避免任何风险。那些日子早已过去。
CJ Desai:本次主题演讲中我将向你们介绍我们的平台核心、服务管理、员工体验、顾客服务以及生成式AI,并且请到了一位特殊嘉宾,他将为我们分享 AI 的未来走向。
过去的Kafka的一起故障,虽然这起规则没有引起业务上损失,但是故障后的复盘值得深思。故障表现出来的现象和真实原因相差甚远。(不要根据现象就轻易下结论)
今天在运行之前写的一个Python脚本时,发生了一个奇怪的现象(我怎么老遇到奇怪的现象~~)。当时的代码大概长这样:
这是我们在1990年开始iRobot时的第一个商业模式,我们以为这将是我们第一个改变世界的方式。当然,具有讽刺意味的是,通过这种模式来改变世界,意味着将一个接一个地机器人发送出去。但可悲的是,这种商业模式失败了。而且这不会是我们最后一个失败的商业模式,绝对不是。
在过去的六个月里,我的创业公司 Truss(gettruss.io)发布了多项倚重 LLM 的功能,而我在 Hacker News 上读到的关于 LLM 的故事现在已经和我的实际情况脱节了,所以我想在处理过 5 亿多(我估计)tokens 之后,分享一些更“令人惊讶”的经验教训。
过去一年中,我坐在一位资深的软件工程师旁边,可以仔细地观察他是怎么工作的。我们两人经常共同编程,使得这项观察更为容易。此外,在团队文化中,从背后窥探写代码的人并不令人反感。以下是我所学到的:
近日一篇名为 Excel界地震 微软宣布 跨4代人34岁的 VLOOKUP 退休 刷爆朋友圈,几小时就像病毒一样传播起来并很快得到了10W+的阅读,太香了。几乎所有和 Excel 有关的公众号都在发与 VLOOKUP 及 XLOOKUP 有关的文章,这还不够说明地震的嘛。一个小小的 VLOOKUP 其实可以洞悉到人们对 Excel 的依赖度之广之深。
译者注:本文以一段自打24小时耳光的视频为例子,介绍了如何利用均值哈希算法来检查重复视频帧。以下是译文。
在过去的一年里,他靠 GitHub 项目的打赏赚到了 10 万美元。在这篇自述文章中,他分享了自己靠 GitHub 项目赚钱的经历和技巧。
当网站出问题时分析日志,第一步一般都不会是看访问日志。但是也不能忽视它,在访问日志中记录了很多的客户信息,如果你有心,可以从这个日志中获得很多有用的信息! 访问日志access_log记录了所有对
作者 | Adam Hughes 译者 | Sambodhi 策划 | Tina 编辑|燕珊 “我是如何从每一次失败中成长起来的。” 身为程序员,我们往往都了解大神级程序员的故事。比如很小就开始编程,在 11 岁时就创建了第一家能盈利的网站,16 岁上大学、17 岁成立公司、23 岁成为亿万富翁。我们喜欢这些故事,喜欢这些英雄。他们以高产的编程项目和引领潮流的方式激励着我们。从解决复杂的 NP 问题到筹集数百万的 A 轮融资,他们似乎从来不会失误。 不过,事实是这样的:每一个开发者,甚至是这些超牛逼的大神级
在信息加速发展的互联网时代,越来越多的科技公司为了专注核心竞争力业务以及降低软件项目成本,开始将项目中的部分业务模块分发给第三方外包公司来完成。
要写出好代码,首先需要提升品位。 很多软件工程师写不好代码,在评审他人的代码时也看不出问题,就是因为缺乏对好代码标准的认识。 现在还有太多的软件工程师认为,代码只要可以正确执行就可以了。这是一种非常低的评价标准,很多重要的方面都被忽视了。 好代码的特性 好代码具有以下特性。 1. 鲁棒(Solid and Robust) 代码不仅要被正确执行,我们还要考虑对各种错误情况的处理,比如各种系统调用和函数调用的异常情况,系统相关组件的异常和错误。 对很多产品级的程序来说,异常和错误处理的逻辑占了很大比例。 2.
作者:Nada 摘自:元代码vrerse(微信ID: vrerse) 对与科技公司来说,关注 CEO 有时候不如关注 CTO 得到的干货多。而 Facebook 今年 F8 大会的第二天,开场就是 F
世界上,总是充满活力的人,热衷于创造新语言,并不遗余力地推介,开大会,开专栏,立项目,开论坛,只求开发者能注意到:“嗨,这儿有一玩杂耍的,看着飞刀嗖嗖嗖~~~喷火呼呼呼~~~挺有意思,走,过去瞧瞧。” 如果读完之后,您能在一两个还没涉足过的陌生语言,因为一辆车的图片,足够有冲击力,让您记住了,那就请好了您呐。
导语 | Serverless 环境给DevOps和开发团队带来了复杂性和可观察性方面的挑战。在分布式系统里,为这些现代环境建立可观察性策略是至关重要的,以便快速识别、排除故障和解决问题。本文由 Epsagon Director of Engineering Gal Bashan 在 Techo TVP 开发者峰会 ServerlessDays China 2021上的演讲《Observability in Serverless Environments》整理而成,带大家回顾可观察性、它的关键因素(指
现在,在理解、存储海量信息方面,机器似乎越来越高能了——但是它们和以前一样,在情感方面却没什么进展。不过,从 1990 年代以来,一小部分研究者致力于让计算机能够用人类方式去解读情感和反应。语音专家让计算机学会辨认音高、节奏和音强;他们研发的软件可以通过扫描一段女人和孩子间的对话,来判断这个女人是不是母亲,她是不是看着孩子的眼睛进行对话,以及她是生气、沮丧还是开心。其他计算机可以通过判断我们的语序,解读我们各种姿势来衡量情绪。还有其他计算机可以通过解读面部表情来实现这一点。
AI灭世主义者早就迷失在一种伪装成贝叶斯分析的宗教当中。这是Oxide公司CTO在接受TNS采访时说的。
“SPoF”或“单点故障”背后的思想是,如果系统的一部分发生故障,那么整个系统也会发生故障。
打了几把游戏,终于可以歇息一会了,准备继续看我的综艺,可是女朋友过来找我给他讲讲到底什么是二阶段提交。
花下猫语: Python 工匠系列的文章很棒,它很好地将实战经验与理论融合起来,它的诚意体现在了写作风格、每个话题关注点与代码用例中。今天,继续给大家分享最新的作品(系列之六):
一姑娘从程序猿身上学到了这些东西 📷 我曾经跟朋友开玩笑说,这个时代,有两种人的妻子应该要受人尊敬,第一种是军嫂,这是毫无争议的,第二种就是像我这样的,程序员的老婆。当然,这个玩笑半分自嘲半分真。我的本科是穿着大白褂在各种挂着植物、动物、有机化学、无机化学的门牌的实验室里度过的,在显微镜下给三段生的夹竹桃画过横切片图,在大头针和解剖剪子的辅助下找过蚯蚓的三条神经,闻过带有臭鸡蛋味的硫化氢气体…… 是的,你们都猜对了,我确实是相貌平平,不修边幅,素面朝天的理科女。见了人就开始习惯性地科普:蝴跟蝶,蜻跟
如果你用 Python 编程,那么你就无法避开异常,因为异常在这门语言里无处不在。打个比方,当你在脚本执行时按 ctrl+c 退出,解释器就会产生一个 KeyboardInterrupt 异常。而 KeyError、 ValueError、 TypeError 等更是日常编程里随处可见的老朋友。
这也是「技术支持」被视为一个可怕工作的原因。然而,并不是所有的 bug 报告都是让人不愉快的。我一直在没赚钱的时候维护开源软件,有时候会收到一些非常清晰的、有帮助的、内容丰富的 bug 报告。
你已经为一个有趣的问题工作了几个月,现在决定启动一个开源项目。你在 README.md 中编写了一些说明,并发布了1.0版。
领取专属 10元无门槛券
手把手带您无忧上云