对于一个大型网站系统而言,日志是后端应用程序必须要引入的模块,日志有利于追查Bug和记录用户操作。每个编程语言都有很多现成的日志框架,而Java的日志框架也有很多,如log4j2、Logback、SLF4J等,这些日志框架都可以让后端应用程序按照一定的规则输出日志文件。
在大型网站系统当中,仅仅把日志记录下来是远远不够的。大型网站系统需要一个完整的日志系统,日志系统除了需要收集日志并将其记录下来以外,还需要做日志筛选、用户行为记录追溯及风险预警等工作。
不过,在项目中前期,或者单独调试某个后端应用程序时,仍然需要使用日志模块。这里以log4j2为例,通过日志模块引入和规范化日志记录两个方面对日志模块的使用进行介绍。
1、日志模块引入
引入日志模块的具体操作步骤如下:
(1)引入log4j2依赖包。需要在工程配置文件(build.gradle)中添加log4j2依赖包,如代码4.32所示。需要注意的是,如果不去除Spring Boot中原有日志模块的话,那么新引入的日志模块与原有日志模块会产生冲突。
代码4.32 build.gradle中添加log4j2依赖包
(2)同步工程配置。修改完build.gradle文件后,log4j2的依赖包在同步工程配置后才会被下载和引入。在IntelliJ IDEA中单击“同步”按钮即可同步工程配置,如图4.59所示。
图4.59 在IntelliJ IDEA中同步build.gradle配置
(3)创建log4j2的配置文件log4j2.xml,其内容及设置说明如代码4.33所示,更详细的说明请参考官方说明(
https://logging.apache.org/log4j/2.x/manual/index.html)。另外,日志配置文件一般与后端应用程序的配置文件放在一起,如图4.60所示。
图4.60 日志配置文件存放位置
说明:图4.60中的“配置文件目录位置”和“后端应用程序配置文件名”都不是默认设置。关于“配置文件目录位置”和“后端应用程序配置文件名”的设置可参考前面小节中的讲解。
代码4.33 log4j2.xml文件的内容及其配置
fileName:日志文件名,使用properties中设置的FILE_PATH变量。在此例中,输出文件名为D:/logs/backend/demo/web-info.log。
immediateFlush:接收到日志后,是否立即输出到文件中。这个一般设置为false,设置为true会严重影响接口的并发能力。
filePattern:存档文件名,在此例中,归档文件名为(以2020-2-23为例)
在此例子中,ERROR日志的日志文件名为D:/logs/backend/demo/web-error.log,归档文件名为(以2020-2-23为例)
在此例中,只输出FATAL、ERROR、WARN、INFO的日志。
日志级别以及优先级排序为OFF > FATAL > ERROR > WARN > INFO > DEBUG >
(4)引入日志配置文件。在后端应用程序配置文件中指定日志配置文件路径后,才能生效。在如图4.60所示的工程目录结构中,需要在demo.properties文件中添加日志配置文件的路径,如代码4.34所示,其中,classpath:log4j2.xml为具体的路径。
代码4.34 在后端应用程序的配置文件中添加日志配置文件的路径
(5)程序中记录日志,如代码4.35所示。对应的日志输出结果如代码4.36所示,其中,由于log4j2.xml(日志配置文件)设置的日志输出等级为INFO,所以DEBUG等级的日志没有被记录下来。
说明:日志配置文件的相关说明请参照代码4.33,其中,设置输出日志等级的位置为…。
代码4.35 代码中记录日志
代码4.36 日志输出结果
(6)如果实现了4.3.3小节中的后端应用程序与配置文件分离,那么日志配置文件也应该从后端应用程序中分离出来。按常理来说,只要在配置文件中设置日志配置文件路径就可以了(如logging.config=/home/tomcat/appconfig/log4j2.xml),但是由于某种冲突,这样的配置是不起作用的。
因此,要想实现后端应用程序引用外部的日志配置文件,需要通过“添加启动参数”和“修改代码(ServletInitializer.java)”才能实现。具体做法是,“添加启动参数”需要在Tomcat目录下的/conf/catalina.properties文件中添加如代码4.37所示的设置,修改后的代码如代码4.38所示,其中,xxx_log4j2.xml为日志配置文件名。最终,配置文件和日志配置文件集中管理的效果如图4.61所示。
图4.61 配置文件和日志配置文件集中管理
代码4.37 设置日志配置文件所在目录
2、规范化日志记录
日志记录是一个十分开放的行为,原则上,只要记录的日志能“定位问题发生的位置”和“记录某些重要的用户操作”就可以了。但是,在实际项目当中,由于日志对功能的实现是不产生影响的,所以日志通常都是通过一次次问题修复而得到补充的。而这种“补丁型”日志,通常是混乱的。混乱的日志对于“定位问题发生的位置”和“追查某些重要的用户操作”都不能起到很好的作用,因此,日志记录需要规范化。
注意:日志记录的规则需要在项目前期定好,在开发过程中吸收规整化日志的工作量。项目后期再整理日志是很不理智的行为,因为后期整理日志需要花费大量的时间去梳理和理解业务代码,而这部分工作量是很难预估且十分枯燥的,最后整理日志的结果往往也是不尽人意的。
规范化日志记录可以从限制日志等级、明确日志记录位置、添加日志跟踪码等方面进行考虑。
(1)限制日志等级。日志模块一般都有等级划分,以log4j2为例,其日志等级有6种,分别为TRACE(追踪调试)、DEBUG(调试)、INFO(信息)、WARNING(警告)、ERROR(错误)和FATAL(致命错误)。每个日志等级看上去都有相对明确的分工和含义,但是在实际应用当中,这些日志等级的具体用途其实相当模糊,很多时候,都很难界定一个日志应该归类为哪一个等级。一旦出现这种模糊规则,就会出现一人一个样的做法,最后导致“五花八门”的日志等级划分原则。
因此,规整化日志需要限制日志等级。一般情况下,后端应用程序使用DEBUG、INFO和ERROR三个日志等级就足够了,这三个日志等级的分工和协助如图4.62所示。
图4.62 DEBUG、INFO和ERROR日志等级的分工和协助
其中,DEBUG日志在运行时不生效,需要打开调试模式(修改日志输出等级)后,才能记录DEBUG日志。
(2)明确日志记录位置。在限制了日志等级后,需要解决“补丁式日志”的问题,避免日志不够全面的情况。而解决“补丁式日志”的关键,是明确日志记录位置。但是,明确日志记录位置是一件很难实现的事情,因为接口程序与接口程序之间很难找到共性。
不过,如果实现了4.3.2小节中介绍的“限制函数调用层级”“公共模块”和“错误机制”,那么接口程序会变成流水线式的处理方式。在流水线式的接口程序中明确日志记录位置是相对容易的,如图4.63所示。
图4.63 明确日志位置
其中,每个接口只需要在“接收请求”“数据库操作”和“返回结果”这三部分添加日志就可以了,其余日志都在公共模块里,而且公共模块里的日志是一次添加全局有效的。
说明:Dao层(数据库操作)其实也可以做成一个公共模块,这样可以省掉一些日志工作量。另外,虽然数据库本身可以自动记录日志,但是数据库自身的日志不能包含用户身份信息,即不能追溯用户操作,所以Dao层(数据库操作)的日志是有必要记录的。
(3)添加日志跟踪码。即使日志被记录得十分详细,分析日志也是一件很麻烦的事情。同一时刻,后端应用程序可能会同时处理多个请求,以至于多个请求的日志是混合在一起的,在不经过特殊处理的情况下,根本没法分辨哪几条日志是属于同一个请求的。像这种无法区分请求的日志,被记录下来也是浪费资源。
因此,需要在每条日志中添加日志跟踪码,标记同一请求的日志。跟踪码的本质,就是同一请求输出日志时,都多加一个相同的字符串。如果使用的是log4j2日志模块,可以在不改变原有日志输出代码的前提下,添加日志跟踪码。
首先,需要修改日志配置文件中的日志输出格式,如代码4.39所示,其中[%X]为新增的跟踪码格式。
代码4.39 修改日志输出格式
修改完日志配置文件之后,需要在每个接口程序中添加“生成跟踪码”的代码,如代码4.40所示,其中,代码中的函数为Controller层中的接口的入口函数,requestId对应代码4.39中的跟踪码标识。
代码4.40 添加“生成跟踪码”的代码
代码4.41 添加“日志跟踪码”后的日志输出结果
本文给大家讲解的内容是大型网站架构的技术细节:后端架构规整化java日志框架
下篇文章给大家讲解的内容是大型网站架构的技术细节:后端架构规整化自研框架Once
感谢大家的支持!
领取专属 10元无门槛券
私享最新 技术干货