首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏charlieroro

    Istio可观测

    Istio可观测 Istio的可观测包括metrics,日志,分布式链路跟踪以及可视化展示。 目录 Istio可观测 Prometheus 配置说明 Option 1:合并metrics Option 2:自定义抓取metrics配置 TLS设置 总结 Jaeger 概述 跟踪上下文的传递 使用 根据配置错误的严重,可以将Istio资源配置中检测到的任何问题标记为错误或警告。 下面将尝试对服务端口名称进行无效修改来查看Kiali如何报告错误: 将details服务的端口名称从http修改为foo # kubectl patch service details -n default 点击YAML查看Istio的destination rule规则,Kiali用颜色高亮除了未通过有效校验的行 ?

    3K20发布于 2020-09-07
  • 来自专栏charlieroro

    BCC(可观测)

    BCC(可观测) 目录 BCC(可观测) 简介 动机 安装 安装依赖 安装和编译LLVM 安装和编译BCC windows源码查看 BCC的基本使用 工具讲解 execsnoop opensnoop btrfs, xfs, zfs*) biolatency biosnoop cachestat tcpconnect+tcpaccept+tcpretrans runqlat profile BCC的开发 可观测 动机 BPF保证加载到内核中的程序不会导致内核崩溃,且不会永远运行,但BPF本身的通用又可以支持执行很多类型的计算。 p 185 # trace PID 185 only profile 推荐使用strace和perf trace命令 BCC的开发 本节介绍使用Python接口进行BCC的开发,包括两部分:可观测和网络 可观测 Lesson 1. Hello World 执行examples/hello_world.py,并在另一个会话中执行一些命令(如ls),此时会打印"Hello,World!". # .

    3.4K30发布于 2020-07-09
  • 来自专栏云云众生s

    涉及业务KPI的可观测还是非可观测吗?

    观测旨在让每一位工程师能够根据对所有系统和应用程序的数据分析,主动地对工作任务进行优先级排序。 当我们想到“可观测”时,我们大多数人将其定义为“指标、日志和跟踪”。并非如此。 换句话说,可观测不仅仅是收集和整理数据集。它不仅仅是关于警报、关联和正常运行时间。 可观测是关于理解各个用户体验的一切。 具体到可观测的当前形式,主动并不是基于我们的日志、指标和跟踪的前瞻指标。 我们的可观测供应商是否衡量了中断体验和收入损失的下游影响? 不幸的是,现在的答案是:他们没有。 我们知道可观测需要走向何方。了解我们系统的状态只是第一步。下一步是了解我们用户体验的状态。

    15010编辑于 2024-04-01
  • 来自专栏让技术和时代并行

    什么是可观测

    观测之所以昂贵,有两个原因: 可观测比被观测系统至少可靠一个数量级。否则,你将继续调试你的可观察堆栈,而不是使用它来保持你的应用程序运行。 在这篇文章中,让我们深入探讨一下可观测:它是什么,不同类型的可观测,以及实现可观测在技术上意味着什么。在这篇文章的最后,你会明白为什么你应该抵制住诱惑,然后在可观测上节省资金。 良好的可观测可以将凌晨2点被唤醒转换为日常检查。 真正的可观测是什么 当谈到可观测时,我们通常尝试回答三个问题: 我的用户满意吗? 我的应用是否令人满意? 我的服务令人高兴吗? 短期日志-例如,最近7天-应该是搜索的,也就是说,你应该能够在几秒钟内执行全文搜索。像Elasticsearch/Kibana和Loki这样的项目最适合这个目的。 总结 缺乏可观测就像闭着眼睛开车:你不知道离灾难有多近。你开得越快,路越忙,你就越要小心。 可观测也是一样:你越想让你的团队越快地添加功能,你就越应该在可观测上投资。

    66620编辑于 2023-03-18
  • 来自专栏CNCF

    观测是什么?

    可观察之所以昂贵,有两个原因: 可观测需要比被观测的系统至少可靠一个数量级。否则,你将继续调试你的可观察堆栈,而不是使用它来保持你的应用程序运行。 可观测是什么? 可观测有许多名称,如监测、审计、遥测、测仪。忽略这些细微差别,所有这些词本质上的意思都是一样的:度量你的基础设施、平台和应用程序,以了解它是如何运行的。 如果你熟悉精益思维——即构建-度量-学习——那么可观察是十分自然。可观测通过“测量”阶段闭合反馈回路。它允许你的团队对应用程序进行快速更改,快速适应其用户基础和环境,而不会产生不必要的意外。 良好的可观察可以将“凌晨2点被唤醒”转换为日常检查。 但是可观测究竟是什么呢? 当谈到可观察时,我们通常尝试回答三个问题: 我的用户满意吗? 我的应用令人满意? 我的服务器良好吗? 短期日志-例如,最近7天-应该是“谷歌的”,也就是说,你应该能够在几秒钟内执行全文搜索。像Elasticsearch/Kibana[3]和Loki[4]这样的项目最适合这个目的。

    3.2K20发布于 2021-03-15
  • 来自专栏Forrest随想录

    聊聊可观测Observability

    自打去年以来,可观测Observability这个概念又非常的火,按照我的感受,在运维领域,这个概念是近两年即AIOps之后,热度最高的一个了。 无论是国内还是海外的运维相关的公司,都给了自己一个新的定位,就是可观测平台,或者叫做可观测云,相对应的产品也是层出不穷。 通常我们在IT领域看到的关于可观测概念的介绍,都会提到它是Metrics, Traces以及Logs的结合,通常会以下图来呈现。 这里我找了一个Splunk的Demo,我们可以直观的感受一下,可观测的实际效果是怎样的。 大家看完这个示意,对可观测就有更直观的理解了,不做赘述。 可观测之业务架构的理解 如果SRE方法论和AIOps是落地Observability的两个核心,那对业务架构的理解,我对它的定位就是核心中的核心。

    1.1K30编辑于 2022-03-25
  • 来自专栏云云众生s

    重新思考可观测

    如今,“可观测”已经成为首选方法,可观测项目随处可见。 但是可观测并未实现其承诺。许多组织已经尝试了各种规模的环境。 在许多情况下,可观测项目产生了大量数据和认知过载,但没有对系统可靠带来明显改变。 此外,实现可观测需要进行大规模的集成工作: 开发人员必须检测他们的代码以发出正确的跟踪、指标和日志,使系统变得可观察。检测仍然是一个艺术。 与反应流量整形相比,这种主动方法有助于始终保持用户旅程 SLO,并提供无缝和吸引人的用户体验。 聪明的用户会知道这只是提供可观测的不同方式。 通过接受关键用户旅程和特定旅程 SLO 等概念,我们可以更好地将可观测实践与提供卓越用户体验的终极目标对齐。

    10410编辑于 2024-03-28
  • 来自专栏架构驿站

    eBPF ,让观测走向神坛

    在本篇博文中,笔者将试图解析基于 eBPF 的可观测是什么,以及 eBPF 可以增强网络可观测、Kubernetes 可观测、安全可观测以及性能可观测的一些方法。 Kubernetes 观测 其实,除了最基础的网络层面,eBPF 在 Kubernetes Cluster 观测层面也带来巨大优势。 性能观测 针对资源的性能可观测讨论较少,但随着应用程序变得更加多样化并转向微服务和容器化云原生环境,eBPF 所提供的增强可观测性功能变得尤为重要。 安全观测 针对安全观测,或许是 eBPF 天生所具备的优势。eBPF 能够为用户提供了对整个系统中通信流的内在、深入的可见性。 eBPF 是一个令人印象深刻的可观测工具,与更传统的可观测解决方案相比,它可以提供更深入的洞察力。

    1.8K170编辑于 2023-02-14
  • 来自专栏云云众生s

    OpenTelemetry:Go可观测指南

    OpenTelemetry 是一个开源的可观测框架,帮助从应用程序收集和导出追踪 (traces)、指标 (metrics) 和日志 (logs)。 这些是可观测的构建块,它们可以帮助我们了解应用程序中发生的事情。 导出器将数据转发到像 Grafana 这样的可观测后端。 遥测数据被发送到可观测后端,Grafana 的 grafana/docker-otel-lgtm 是一个一体化的 OpenTelemetry 后端,可以轻松上手。 在这篇文章中,我们分解了可观测的关键概念,探讨了 OpenTelemetry 的工作原理,并在 Go 中构建了一个重用的遥测包,以保持整个应用程序中日志记录、指标和跟踪的清晰和一致。

    33810编辑于 2025-02-09
  • 来自专栏腾讯云中间件的专栏

    Serverless可观测的价值

    Kubernetes环境下的可观测 OpenTelemetry 能够很好的解决云计算虚拟化时代的可观测性问题,但是Kubernetes环境下的可观测不同于虚拟机环境。 传统基础架构并不会这么“动态”,虚拟机不会频繁的重启,各种可观测数据都能够长期在一个稳定的节点上采集。这也使得Kubernetes环境下可观测更加困难。 Gartner最近发布了他们对于2022技术趋势的一个预测报告,其中有一个条目叫做Cloud-Native Platform,它所表达的这一类平台会向他的用户提供一种“扩展的弹性的”服务,也就是用户能够直接使用 Serverless环境下可观测的价值 面对这些困惑,各大厂商Serverless产品依然提供了可观测的支持,这里的原因与可观测的目的相关,正如前文介绍,可观测更像是一种白盒方式观察系统的手段, 这对于很多客户是一个比较新的事物,客户从自己熟悉的VM环境迁移到 Serverless 平台,碰到问题往往会怀疑是平台的问题,需要平台协助排查,这在客户数量比较少的时候,平台可以做到贴身服务客户,但一旦用户量上来,这不是一种持续的方式

    82940编辑于 2021-12-10
  • 来自专栏k8s技术圈

    Istio 可观测之指标

    这种遥测技术提供了服务行为的可观测,使运维人员能够排查故障、维护和优化应用程序,而不会给开发人员带来其他额外的负担。 Istio 生成以下类型的遥测数据,以提供对整个服务网格的可观测: Metrics(指标):Istio 基于 4 个监控的黄金标识(延迟、流量、错误、饱和)生成了一系列服务指标,Istio 还为网格控制平面提供了更详细的指标 当然这仅仅只能用于测试环境,在生产环境可以单独安装 Prometheus 进行有针对的配置优化。

    81610编辑于 2023-12-04
  • 来自专栏新技术

    观测之Micrometer Tracing

    关于为什么需要链路追踪系统和对于可观测的一些知识也可以参考前面的文章: 《可观测神器之Micrometer》 那下面就进入正文看一看Micrometer提供的Tracing门面是如何定义链路追踪系统的 低开销: 收集数据增加很少甚至没有开销,同时最大限度地提高跟踪工作的可移植扩展: 厂商无关的API, 内部包含一个带有仪器SPI的核心模块、一组包含各种示踪剂桥接的模块、一组包含专用跨度报告机制的模块和一个测试套件。 这样的老牌链路追踪门面,Micrometer Tracing并不是最成熟的,不过OpenTracing已经归档不再维护,OpenTracing和OpenCensus合并为OpenTelemetry之后统一了可观测门面 可以看到在未来Micrometer必定会在Java的可观测领域越来越火,从成熟的Meter埋点到 Tracing 链路追踪。感兴趣的话可以试一试。

    1.9K10编辑于 2022-12-12
  • 来自专栏新技术

    观测神器之 Micrometer

    观测 在了解Micrometer之前可以先来简单了解下云原生微服务时代下人人追捧的可观测概念,这会更有利于我们理解Micrometer的作用,在传统单体应用时代对于服务的检查和诊断可以借助于简单的报表 这时候就有人提出了可观测的概念,可观测是个比较大的概念就像是我们开发人员有了透视能力一样一眼可以看穿系统的内部运行状况,当然这是不现实的。 所以就有人进行了对它进行了具体的定义,广为流传又易于理解的说法是可观测的三大支柱说:Metrics、Tracing、Logging 。 可观测三大支柱说 可以看到中医有“望闻问切”的方式来诊断病人的病症,我们有了可观测三大支柱Metrics、Tracing、Logging来帮助我们了解和排查系统运行健康状况。 Gauge (仪表盘): 一般用来统计有上限减的数据,仪表是获取当前值的句柄。仪表的典型示例是集合或映射的大小或处于运行状态的线程数。

    2.2K60编辑于 2022-12-05
  • 来自专栏k8s技术圈

    Istio 可观测之日志

    Loki 接下来我们来将访问日志发送到 Grafana Loki 进行统一的日志管理,Loki 是一个水平扩展、高可用的多租户日志聚合系统。 OpenTelemetry OpenTelemetry(简称 OTel) 是一个开源的可观测框架,用于生成、收集和描述应用程序的观测数据。 和 Collector,用于捕获分布式跟踪和度量数据,并将其发送到分析软件、存储库或其他服务,OTel 的目标是提供一套标准化、与厂商无关的 SDK、API 和工具集,用于将数据摄取、转换和发送到可观测后端

    1K10编辑于 2023-12-05
  • 来自专栏架构驿站

    eBPF ,让观测走向神坛

    在本篇博文中,笔者将试图解析基于 eBPF 的可观测是什么,以及 eBPF 可以增强网络可观测、Kubernetes 可观测、安全可观测以及性能可观测的一些方法eBPF 基础功能     eBPF Kubernetes 观测     其实,除了最基础的网络层面,eBPF 在 Kubernetes Cluster 观测层面也带来巨大优势。     性能观测     针对资源的性能可观测讨论较少,但随着应用程序变得更加多样化并转向微服务和容器化云原生环境,eBPF 所提供的增强可观测性功能变得尤为重要。 安全观测     针对安全观测,或许是 eBPF 天生所具备的优势。eBPF 能够为用户提供了对整个系统中通信流的内在、深入的可见性。 eBPF 是一个令人印象深刻的可观测工具,与更传统的可观测解决方案相比,它可以提供更深入的洞察力。

    4.6K191编辑于 2023-02-08
  • 来自专栏云云众生s

    观测的新构件

    观测领域是一个动态且异质的领域。 可观测性周期表中的三个新元素是: OpenTelemetry eBPF ClickHouse 这些元素各自独立,具有完全不同的特征和功能,但一种新型的可观测竞争者正在将它们组装成强大的框架。 能够利用这些存储库并构建零仪器产品赋予了可观测供应商改变游戏规则的能力。 ClickHouse 第三个元素是ClickHouse,是我们勇敢的新可观测架构中的外星技术。 这更可能表明,可观测是一个快速发展的领域和一个不断增长的市场。可观测处于不断变化的状态 - 面临着越来越大的需求 - 它正在应用于更多的技术、架构和领域。它还被要求提供更丰富的见解和更低的成本。 这是因为可观测不是一个零和游戏 - 它是一个不断增长的生态系统,许多范式和技术可以共存、整合和相互补充。

    22310编辑于 2024-03-28
  • 来自专栏云云众生s

    超越可观测三大支柱

    观测通常在三个支柱的背景下定义 - 日志,指标和跟踪。现代云原生应用程序复杂而动态。为了避免意外和性能问题,您需要一个强大的可观测堆栈。但是,可观测是否仅限于收集日志,指标和跟踪呢? 类似 Flamegraphs 和 Gantt 图的跟踪轻松可视化整个请求,因为它在复杂的分布式设置中穿越不同组件。 上下文可以被称为可观测的第四支柱 - 关联不同的信号,并为可观测的三大支柱提供更多信息。 上下文在可观测中的作用 在故障排除中,上下文至关重要。它连接了指标、日志和跟踪中的不同信息片段。 可观测的未来趋势是利用人工智能进行基于学习模式的快速数据解释,以优先处理关键信息,站点可靠工程(SRE)和可观测团队,同时过滤掉不太重要的数据。这种方法简化了对最具影响力问题的关注。 可观测的未来被视为越来越依赖人工智能和有效的数据可视化,以使复杂的数据变得可理解且可操作。 对于希望增强数字体验和系统可靠的组织来说,拥抱可观测的这些不断发展的方面至关重要。

    29510编辑于 2024-03-28
  • 来自专栏云云众生s

    通往自主可观测的道路

    如今,在关于云可观测的讨论中,话题往往从“什么是可能的”转向“什么是实用的”。这些讨论往往会突出当前可观测流程、工具和财务模型的不足。 然而,人工智能驱动的可观测的潜力远远超出了当前的实现。 自主可观测是系统监控和管理未来的前瞻愿景,旨在利用生成式人工智能和机器学习来自动检测、诊断并最终解决问题,无需人工干预。 随着我们逐步进入这些级别,重要的是不仅要关注技术进步,还要确保 AI 驱动的可观测系统是可信的、透明的、适应的和安全的。为了促进采用,这些系统必须与业务需求、监管要求和行业标准保持一致。 确保 AI 决策的透明度并保证关键任务应用程序的安全将对于使这些系统有效和持续至关重要。 通过尽早解决技术和信任方面的挑战,组织将能够更好地克服障碍,并继续朝着完全自主的可观测迈进。 行业现状 遵循自主可观测的这一框架,我们目前正在从手动时代过渡到辅助可观测,并迅速向部分可观测自动化的早期阶段迈进。

    12710编辑于 2024-09-30
  • 来自专栏架构驿站

    为什么更倾向“可观测”?

    观测帮助我们的团队在新的云原生世界中捕捉和修复所谓的“未知+未知”。 作为用于管理和分析复杂系统的两种方法,监控和可观测的对比分析主要体现在如下: 1. 扩展性:监控不容易扩展到大型和复杂的系统,而可观测是为处理复杂系统而设计的,可以水平扩展。 7. 通常而言,基于实际的业务场景,评估可观测平台时,我们需要关注的四个关键因素,具体参考如下所示: 1. 用于定制搜索和分析的可编程工具 首先,重要的是要了解,任何可观测策略的关键是设置适当的成功指标并建立关键绩效指标(KPI),以告知我们的团队何时达到这些成功指标。 可编程的可观测平台帮助我们的团队了解数据、系统和客户,从而有助于我们将正确的数据提供给正确的人,以确保任何支持我们基础设施的业务顺利运行。 4.

    87630编辑于 2023-07-08
  • 来自专栏媒矿工厂

    RTC @scale 2024 | RTC 可观测

    post_type=video&p=521422 内容整理:陈梓煜 简介:Meta的RTC观测团队旨在创建一个高度可靠的分析平台,该平台能够提供对通话性能的可见性,支持顶层仪表板和指标,并使得对RTC平台进行调试的关键日志可用 我们的首要任务是确保用户数据的隐私,并平衡日志记录的可靠与效率,以及使合作伙伴的接入过程更加顺畅。通话调试是高效、有效运营RTC平台的一个特别重要的需求。 特别是,由于客户端带宽/网络问题,客户端日志的可靠和延迟经常会降低。 为了确保可靠,我们必须持续监控日志到达的延迟,并确保这些假设不被违反。 虽然有点棘手,但我们已经能够可靠且成本效益地做到这一点。 总结 Meta的RTC可观测依托于标准的日志基础设施。一个单独的通话会产生来自各种客户端和服务器的数十个日志。标准基础设施是一个很好的构建块和起点,但它有局限性。

    31310编辑于 2024-04-12
领券