概述 近期碰到了一个 Linux Systemd 服务 Crash, Crash 后需要人工介入重启. 那么, 有没有办法如何实现 Linux 服务 Crash 后自动重启?
在工作中经常会遇到一些内核crash的情况,本文就是根据内核出现crash后的打印信息,对其进行了分析,使用的内核版本为:Linux2.6.32。...对每一个进程来说,Linux内核都会把两个不同的数据结构紧凑的存放在一个单独为进程分配的存储空间中:一个是内核态的进程堆栈,另一个是紧挨进程描述符的数据结构thread_info,叫线程描述符。...在Linux-2.6.32内核中thread_info.h文件中有对内核堆栈的定义: #define THREAD_SIZE 8192 在Linux内核中使用下面的联合结构体表示一个进程的线程描述符和内核栈...,在内核中文件include/linux/sched.h。
我们平时开发过程中不可避免的会遇到内存泄漏问题,你是如何排查的呢?估计你是使用下面这几个工具吧?...ccmalloc memwatch debug_new 这里程序喵向大家推荐新的一个排查内存泄漏的工具:AddressSanitizer(ASan),该工具为gcc自带,4.8以上版本都可以使用,支持Linux...byte(s) in 1 object(s) allocated from: #0 0x7f95b231eb40 in __interceptor_malloc (/usr/lib/x86_64-linux-gnu...main /home/wangzhiqiang/test/test_leak.cc:8 #3 0x7f95b1e61b96 in __libc_start_main (/lib/x86_64-linux-gnu...main /home/wangzhiqiang/test/test_leak.cc:9 #3 0x7f95b1e61b96 in __libc_start_main (/lib/x86_64-linux-gnu
,包括:如何安装kdump,如何设置系统参数来捕获崩溃前的内存;如何使用crash做简单的分析;并且介绍如何使用更加简便的工具PyKdump来做crash文件的分析.通过了解这些知识, 可以帮助Linux...运维人员更快更方便地排查问题.2 基本步骤要捕捉到Linux在崩溃前一刻的内存,我们需要安装kdump工具在生产系统上,并进行相应的参数配置.这样当生产系统上发生crash的时候, 操作系统控制权将会转换到...并由其将崩溃前一刻的内存镜像保存到本地或者远程文件中(根据设置的不同).我们拿到这个文件后,可以将其拷贝到分析机上.分析机的环境包括操作系统的版本,可以与生产系统不同.但是在分析机上,我们要安装上与vmcore所对应的OS版本相同的调试信息文件...工具分析4.1 安装crash工具为了不影响生产系统的运行,通常我们会将生成的vmcore文件拷贝到用于分析的Linux系统上去分析.分析工具通常采用crash工具.CentOS下可以通过如下命令安装:...Linux 7 Kernel Crash Dump Guidehttps://access.redhat.com/documentation/en-us/red_hat_enterprise_linux
本文主要介绍如何利用OC Runtime的特性,让OC野指针对象主动抛出自己的信息,秒杀某些全系统栈Crash。 ?...第一部分、第二部分)里曾经介绍过在内存释放后填充0x55使野指针出现后数据不能访问,从而使野指针变成了必现的方法,那这里会有一个比较奇怪的问题:我们在释放的内存上填上了0x55,但为什么大部分时候野指针Crash...为了解答这个问题,我们可以先看看Crash栈,就会发现这些Crash都是在objc_msgSend上。...当然,我们无法预料野指针对象会在调用哪个函数时发生Crash,好在我们可以利用runtime的重定向特性了转到我们自己的代码里面去。 2.怎么覆盖isa?...再看看下面这几个让人头疼的传说中的全系统栈Crash,你是否熟悉? 栈1: ? 栈2: ? 上面这两个Crash如果不能重现几乎是无解!
2011年底,鹅厂内部出现一个“Crash监控”的服务后,开发某App的企鹅们发现了一个真相:原来自以为很稳定的版本,结果上线后竟然……。后来,这些企鹅们就开始默默地修Crash了。...再后来,鹅厂的所有App都接入了Crash监控服务。 一般的产品开发过程,都会历经几大阶段。经过多年的经验积累,企鹅们已经将Crash监控充分融入到研发流程的各个阶段。...在每个研发阶段充分利用Crash监控服务,让企鹅们的研发效率和质量得到大大的提升。 开发阶段 对于开发哥,发生Crash不是难题,发生Crash又无法分析才是问题。...好吧,你没遇到过机型导致的Crash?你没遇到过会有网络原因导致的Crash?用户实际场景比测试环境复杂的多,怎么破?...因为通过Crash监控平台的实时监控,可以快速了解灰度过程的Crash问题,项目组同时可以评估Crash的影响程度,确定产品是否可以正常上线。”
Coredump 调试 Coredump是什么?...Linux环境下,当程序异常退出(发生段错误)时,会产生一个core文件,该文件记录了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息还有各种函数调用堆栈信息等,我们可以理解为是程序工作当前状态存储生成的一个文件...---- 如何调试 编译的时候添加-g选项,增加调试信息。 gdb program core_file **示例:**一个会产生异常退出的程序,非法指针访问。...执行调试命令,结果如下图所示。
GDB调试 GDB是GUN发布的一个强大的程序调试工具,也是Linux程序员不可或缺的一大利器。 安装GDB 注意安装你所需要的版本。...gcc -g hello.c -o hello 启动GDB调试。 gdb hello GDB和Shell一样支持命令补全。。...s ---- 监视变量 print 调试程序最基本的需求就是监视变量的值,可以使用print命令,缩写为p,显示指定变量的值。...bt ---- 退出GDB quit 调试完毕后,使用quit命令,缩写为q,退出gdb程序。 q
以前在IDE调试的话,就很容易设置断点,查看参数值,到了 linux 下就变得比较麻烦了。 目前觉得比较重要的就是: 1.设置断点: gdb命令 break,也可以用 b 。...取消的话 undisplay 编号 4.列出信息 gdb命令 info,info break, info display 5.调试 单步调试 n,进入函数的单步调试 s,跳到下一个断点 c 6.读取文件
如何分析Native Crash?...Native Crash调试方法 6.1 gdb调试 新版的Android Studio支持直接创建带有Native代码的工程,并使用cmake编译jni代码,内部使用llvm+lldb进行编译和调试。...完整的调试架构大致如下: ? 下面我们看看如何让gdb连接上的native代码。步骤分为以下4部分: 1....so依赖关系通过arm-linux-androideabi-readelf及arm-linux-androideabi-nm分析so文件信息,再通过graphviz+dot绘制依赖图,如下: ?...总结 Android上的Native Crash总的来说还是有章可循,通过分析有效的日志和调用栈以及使用正确的工具进行调试,也可以达到和Java Crash差不多的分析效率。
这篇文章只是为了阐述Spark Streaming 意外Crash掉后,如何保证Exactly Once Semantics。本来这个是可以直接给出答案的,但是我还是啰嗦的讲了一些东西。...因为SS是7*24小时运行的问题,我想知道如果它Crash了,会不会丢数据。...需要了解的是,基本上Receiver Based Approach 已经被我否决掉了,所以这篇文章会以 Direct Approach 为基准点,详细分析应用Crash后,数据的安全情况。...只要任务运行完成后没能顺利执行完DoCheckpoint前crash,都会导致这次Batch被重新调度。...那现在会产生一个问题,假设我们的业务逻辑会对每一条数据都处理,则 我们没有处理一条数据 我们可能只处理了部分数据 我们处理了全部数据 根据我们上面的分析,无论如何,这次失败了,都会被重新调度,那么我们可能会重复处理数据
李真旭(Roger) ACOUG 核心专家,Oracle ACE,云和恩墨技术专家 编辑手记:linux 文件系统的cache分为2种:page cache和 buffer cache.在RAC环境中,...) 的描述来看,此次故障跟文档描述基本上一致,如下: 其中地址[0x679000020] 后面的内容也均为0,跟文档描述一样,其次,文章中提到使用了linux 内存释放机制以及同时启用了hugepage...根据文档描述,这应该是Linux bug。...而实际上该数据库实例的内存分配一共也就40G,且使用的是linux raw。...) 关于linux cache的一些知识请参考: http://www.ibm.com/developerworks/cn/linux/l-cache/ File System’s Buffer Cache
利用KGDB双机调试内核 1.1. 环境 1.2. 配置内核编译环境 2. 参考 双机调试Linux内核环境配置。...利用KGDB双机调试内核 环境 centos 7 VMware 全程使用root用户 配置内核编译环境 这种方式调试内核需要两台机器,一台用来运行Linux内核,另一台对内核进行调试。...可以开两个Linux系统的虚拟机;也可以在物理机系统是linux上面装虚拟机,然后虚拟机运行一个linux;再就是买开发板来调试内核。以下是在windows上开两个虚拟机的流程描述。...在https://www.kernel.org/ 下载想调试版本的内核代码(可以下载tarball格式)。...(我测试ttyS0不行,改成ttyS1可以了) 参考 http://blog.nsfocus.net/gdb-kgdb-debug-application/ 在VMware中用Kgdb调试linux内核
欲让其灭亡先让其疯狂,我们当然不是人为制造Crash,准确地说,是使隐藏的随机性Crash暴露出来,提高测试时的Crash率,从而降低版本发布后的Crash率。...这两种Crash都带随机性,而且这两种Crash有相当一部分都很难区分,甚至大量的Crash只有系统栈,如果不能根据日志重现,几乎是无解,让人非常蛋疼。 本文主要讨论的方向是Obj-C的野指针。...当然也有相当多的Obj-C野指针不是这种表现,所以野指针的Crash体量非常惊人。 为什么Obj-C野指针的Crash那么多?...对象释放后内存没被改动过,但是它自己析构的时候已经删掉某些必要的东西,可能不Crash、Crash在访问依赖的对象比如类成员上、出现逻辑错误(随机Crash)。...3、如果释放后访问野指针的是系统代码,虽然提前发现了Crash,但是离解决问题还是很远。 4、如果野指针指向的数据没有被当成指针使用,还是可能不立即Crash。 欲知后续问题如何解决,请听下回分解。
在Linux上通常使用gdb命令行调试,但该方式调试不太直观,且命令行长时间不用,容易忘记,不如GUI直观和容易上手,下面介绍基于GUI的方式调试Linux。...一.Linux调试GUI方案简介 1) Visual studio 远程调试Linux 在VS2015版本以后Visual studio就支持Linux的编译和调试。...使用熟悉的windows界面开发和调试Linux,极大的提高了开发效率,可以广泛应用的Linux服务器开发和嵌入式Linux开发。 ...2) 基于eclipse 本地调试Linux 因为eclipse是跨平台的,安装一个带GUI的linux系统,就可以像VS一样开发和调试Linux 3) 基于QtCreator...本地调试Linux 因为QtCreator是跨平台的,安装一个带GUI的linux系统,就可以像VS一样开发和调试 4) 基于eclipse 远程调试Linux
This GDB was configured as "--host=x86_64-linux-gnu --target=arm-linux-android"....(gdb) rockchip rk3399调试vmlinux ..../prebuilts/gcc/linux-x86/aarch64/aarch64-linux-android-4.9/bin/aarch64-linux-android-addr2line -f -e.../prebuilts/gcc/linux-x86/aarch64/aarch64-linux-android-4.9/bin/aarch64-linux-android-addr2line -f -e...kernel/drivers/iommu/rockchip-iommu.c:1005 (discriminator 2) weiqifa@dev:~/rk3399_7in1$ RK平台tombstone调试
ld-linux 现在加载ELF可执行文件的工作,已经落到ld-linux.so.2头上了。你可能会问,这与有调试程序有关系吗?有的。...Linux 平台上的C语言调试工具!...从事Linux应用开发一年多了,感觉很不规范很山寨,准备系统地学习一下下linux开发,首先从调试工具的学习开始,以下是从网上看到的一篇linux调试工具介绍,准备好好学习这些工具的使用。...更多Managed Spy信息 Linux程序调试工具 XBuildStudio 您还在使用gdb缓慢地调试UNIX/LINUX的程序吗?...更多ltrace信息 最近更新: ltrace 0.7.1 发布,程序调试工具 发布于 1年前 Linux 调试器 和 跟踪器 KGTP KGTP 是一个 实时 轻量级 Linux
客户端调试方法 可以添加 -o log-level=DEBUG参数,查看详细调试信息。 ...用法示例: mount -t glusterfs -o log-level=DEBUG 192.168.1.120:/tank /mnt 服务器端调试方法 可以更改日志级别:...diagnostics.brick-log-level DEBUG glusterd服务默认启动进程为: /usr/sbin/glusterd -p /var/run/glusterd.pid 调试时
前言 在前面的博客【Linux】编译器-gcc/g++使用已经分享了关于编译器的使用,而编译器的使用离不开调试,这次就来分享一下Linux调试器-gdb使用。 2....调试前准备 要调试就得先有代码,先用C语言写一段简单的代码myprocess.c,再写好Makefile: myprocess.c代码: 1 #include 2 3...测试用的是debug,可以被跳绳,而开发出来的release版本,是不可以调试的。 在debug版本中,编译器形成可执行程序的时候,会给可执行程序添加调试信息。...使用 3.1 进入gdb 默认系统中会安装gdb,使用方法就是gdb后面直接加上调试的可执行程序名: gdb myprocess-debug 就会默认进入到调试模式 想要退出就直接输入quit或者...这个run的功能就类似于VS里面的F5,直接运行不调试。
使用node-inspector来调试node 安装 npm install -g node-inspector 启动 启动要调试的项目: node --debug 文件名 启动node-inspector
领取专属 10元无门槛券
手把手带您无忧上云