Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >该如何接手别人遗留下的代码?

该如何接手别人遗留下的代码?

作者头像
我就是马云飞
发布于 2018-10-25 02:46:07
发布于 2018-10-25 02:46:07
6070
举报
文章被收录于专栏:我就是马云飞我就是马云飞

如果你在软件行业工作足够长的时间,迟早你都将面临一个棘手的问题:修复遗留的代码库。本文所提出的并不是唯一可行的方法,且遗憾的是,这种方法并不是众所周知的。不过以下内容保证风险最小化。假设你遇到了修复遗留应用程序的问题,已经存在风险,并且不需要添加更多应用程序。采用本文方法的风险和成本将会比从头开始重写系统更低。

为什么不要重写代码

在我们开始之前,你应该先了解一些事项。首先,请阅读这篇 Joel Spolsky 的著名文章,了解为什么永远不应该重写代码(https://www.joelonsoftware.com/2000/04/06/things-you-should-never-do-part-i/)。在这篇文章中,Spolsky 强调了为什么要重构代码库而不是重写代码库。所谓重构,即在不改变行为的情况下对代码质量进行一系列逐步改进的过程。当你尝试修复代码时,同时更改其结构和行为是自寻麻烦。

话虽如此,但我觉得“永远”一词有些言重。假设你的代码是用 UniBasic 编写的,而如今你已找不到该语言的开发人员(包括愿意学习它的人),那么重写是你唯一的选择。或者,如果你使用的是一个影响较小的小软件,重写可能并不那么危险。

但是,假设你可以轻松找到或者培训开发人员使用当前软件的编程语言,并且该软件的意义举足轻重,而且它的代码库非常庞大,那么重写就不是那么有意义了。重构意味着你的代码一直都在,你不会丢弃业务知识,而你的开发人员不必从头开始写代码,可以快速出成果。换句话说,你可以将风险降至最低。

理虽如此,但是依然有很多公司和开发者选择重写。新代码令人兴奋,有望带来新的机遇。新代码很有趣,但修复旧代码通常被视为苦差事。但是,如果你有一个庞大的遗留代码库,并且你编写的新代码是一个大型项目,而大型项目的风险很高:

IT 权威机构 Standish Group 在1995年的一项研究表明,只有大约17%的 IT 项目被认为是“完全成功的”,52%属于“勉强合格”(没有达到预算、质量或时间目标),30%是“失败的”。最近,Standish 对2003年至2012年期间的3555个 IT 项目进行了调研,这些项目的总成本至少为1000万美元,而仅有6.4%的 IT 项目成功。

尽管这项调研时间有些久远,但它仍然适用于当今 IT 世界。项目越大,风险也越大。事实上,在我参与的各种公司的大型项目中,很少有人能够在预算范围内按时完成项目。有些项目会被彻底取消,由于没人愿意承担失败的责任,因此他们将项目拖延很久,这完全就是一场灾难。比如,原本计划一年完成的项目已经四年都未能完成,目前仍然充满了漏洞和设计缺陷,并且该软件向后兼容,因此只能硬着头皮继续做。该公司能够继续运转的唯一原因在于,他们收购了另一家具有盈利能力的公司。

这个例子暗示了一个行业中没有公开的小秘密:大规模的重写通常会将一堆乱糟糟的代码换成另一堆。这些公司并未真正解决潜在的问题,而是用一系列已知的问题替换了一系列未知的问题。如果你需要修复遗留代码,那是因为你需要将风险降至最低;为什么你会故意采用无法量化的风险?

如何重构遗留代码

假设你不想面对大规模重写带来的成本和风险,那么如何重构代码呢?

首先,你需要对当前项目进行评估,至少包含以下方面:

  • 代码的功能需求是什么?
  • 如果有文档的话,具体有哪些?
  • 通过跟踪 bug,了解哪部分代码更脆弱。
  • 依赖的外部资源有哪些?
  • 如果已做了测试的话,具体包含哪些测试。

所有这些都需要写下来,以便任何人都可以一目了然地查阅这些信息。假如你要雇用专家来收拾这个烂摊子,这些信息则是重要的必需品。如果上面的列表看起来过于简单,那是因为我们正在重构,而不是重写。

是的,你可能会聘请一位外部专家。如果当前项目的开发人员无法制定修复遗留代码库的可靠计划,同时最大限度地降低风险,那么你需要聘请一位在该领域有丰富经验的人,他们不仅会看到你无法看到的问题,还可以让目前的开发人员变得更好。以下内容无法做到完全直观,但专家的经验能够帮助你摆脱困境。你的专家至少需要满足以下条件:

  • 你的代码库使用的主要编程语言的专家
  • 强大的自动化测试背景
  • 熟练使用代码覆盖率工具
  • 熟知数据库
  • 系统设计和架构专家
  • 能够自责自省
  • 了解业务需求
  • 能够说服别人

最后几点似乎很奇怪,但的确非常重要。一流的开发人员很难兼具以上能力,因此很值得花钱去寻找这样的专家。

开始

首先,你得大致清楚如何规划你的应用程序。也就是所谓的架构路线图,但请记住,该路线图比较灵活,它会随着时间的推移而发生变化。这也正是需要架构专家介入的原因。应用程序的各个功能应当被拆分为单独的部分,以确保应用程序的各个部分都具有其专注的领域。当应用程序的每个部分都有其专注领域时,它就更容易维护、扩展和重用,这也是我们想要修复遗留代码库的主要原因。但是,这一阶段最好不要制定太过详细的计划;相反,只需确保你对大方向有一个粗略的认识即可。

接下来,你将像吃大象一样一点一点重构你的应用程序。你将选择一个小的初始目标来熟悉新工具。随着时间的推移,它会变得更容易,但是当你最开始使用时,切不要操之过急。

重构一个大型应用程序意味着需要编写测试,但除非你非常清楚知道自己在做什么,否则你很可能会出错。通常很少使用 TDD,代码已经写好了,你很难为所有代码都编写测试。相反,你应当采用集成测试

你需要做的第一件事是了解应用程序中不会改变的东西。也就是应用程序的输出,无论是通过 JSON API、网站、SOAP 接口还是其它什么方式输出结果都不会改变。由于某些东西必须使用该软件,因此它可以使一切运转起来。你需要为其编写集成测试。假设我们正在重构 Web 应用程序,你已决定首先编写测试以验证是否可以在管理页面上列出用户。

在该测试中,你将创建一个浏览器对象,以管理员用户身份登录,获取用户页面,并编写测试把预期的用户显示在该页面上。想要实现这些功能通常需要你做大量的工作。例如,如何获取连接到测试数据库的代码?如何确保测试之间的数据隔离(换句话说,运行测试的顺序无关紧要)?如何创建浏览器对象?当你真正动手时,你需要回答这些问题,以及更多其它的问题。

如果你已经进行了一些测试,那么可能会更容易实现这一点,如果你没有进行其它测试那就会非常困难,但这是重构非常重要的第一步。

一旦你针对接口的一个相对较小的不变部分进行了第一次集成测试,就可以在测试中运行代码覆盖率工具,以查看这些高级集成测试所涵盖的代码。涵盖的代码通常是可以安全重构的代码。

现在,你可以查看应用程序的哪些功能部分嵌入到经过测试的代码中,并制定计划将这些部分移到你的架构路线图中。此时,我们要避免把一切分散开来。相反,我们应该每次只专注一个点。例如,如果你在整个代码中分散了 SQL,请将其提取到你的架构路线图中,以便拥有一个干净的 API 来处理你需要的数据。又或者你有一个 Web 应用程序,而你一直采用直接打印 HTML 的方式,请尝试使用模板系统并开始将 HTML 整合到模板中。不要一次修复所有东西,否则你会不堪重负。相反,你应当关注一个领域并充分理解。

不做单元测试

请注意,我们一直在讨论集成测试,而不是单元测试。这有一个很好的理由:对于遗留系统的大规模重构,当你刚开始重构时单元模块会发生很大的变化,但集中在静态接口上的集成测试则不会。你想花时间重构你的应用程序,而不是你的测试,所以在你稳定代码内部工作之前,单元测试可能会分散你的注意力。集成测试的优势在于,你可以一次覆盖大部分代码,如果正确完成,可以非常快速地编写。此外,对于结构不良的应用程序,单元测试可能很难执行。集成测试还有助于发现单元测试无法发现的错误:不同组件具有不同期望的错误。但是,集成测试也存在一些缺点:

  • 集成测试比单元测试运行得慢
  • 很难追查 bug
  • 如果没有很好地隔离代码,那么集成测试更容易造成破坏

话虽如此,在这个阶段集成测试的优势很明显:当你有一些基本的测试来防止最坏的错误时,重构会容易得多。同样值得注意的是,如果你在此之前很少甚至没有做测试,如果你有一些可靠的测试,就不会那么糟糕。

如果你还没有实现持续集成(CI)系统,那么现在是时候开始了。即使你的开发人员忘记运行测试,你的 CI 系统也不应该。如果测试失败,你需要快速找到答案。

进阶

在你开始重构了系统的一小部分功能之后,你可能很快会发现原始计划中的一些错误。没关系,你已经开始小规模重构,以尽量减少风险。纠正这些错误,然后开始使用代码覆盖率工具对系统的其它小部分进行集成测试,以及你已经在处理的功能部分(数据库调用、HTML 或者其它部分)。如果你觉得自己已经摆脱了一些最糟糕的问题,那么请开始查看系统的另一个功能,即当前测试的代码共享,看看是否可以解决这个问题。

请注意,这正是专家的架构技能将会发挥作用的地方。他们将理解解耦应用程序采用不同功能部分的重要性。他们将了解如何编写健壮且灵活的界面。他们将学会识别业务逻辑中可以抽象出来的模式。不要把这个责任交给现有的程序员,除非你绝对相信他们拥有完成这项工作所需的技能和经验。

接下来就是重复这些方法,在最坏的情况下可能需要数年才能完成。这需要很长时间,但它有着显着的优点:

  • 代码始终能够正常工作
  • 你无需为同时维护两个系统而付费
  • 业务知识不会丢失
  • 仍然可以添加新功能
  • 可以轻松编写针对现有 bug 的测试(即使你尚未重构该代码)
  • 一旦发现你的代码库“足够好”了,随时都可以收工

为什么这种方法有效?任何大型项目看起来都令人生畏,但通过将其分解为更小且更易于管理的部分,你至少可以知道从哪里开始并了解目标,而不必担心大型项目的失败。

当我以前使用这种技术时,我经常发现自己能够更清楚地了解代码是如何发展的,而且当前经验丰富的团队并没有面对看到他们的工作消失的令人沮丧的前景。这种技术的缺点是,虽然代码质量大大提高,但总有一种感觉,它不够好。然而,正如我之前提到的,许多重写系统仅仅会产生新的设计缺陷以取代旧的系统缺陷。这太常见了,它意味着将已知问题换成未知问题。

总结

上述策略并不能得到所有人的认可,对于那些崇尚新事物的人来说很难接受。事实上,在许多方面它可以被视为无聊(虽然我喜欢重构代码),但我已经成功地在多个遗留代码库中使用了这种方法。但是,如果你仍在尝试从重写与重构之间做出决定,请记住,这种方法是一种成本相对较低且风险也较低的方法。如果它被证明是行不通的,你可能会冒很小的风险。如果改写证明不可行,那么你可能会花费公司一大笔钱。

因此,你应当明白何时应该考虑修复遗留代码库。我建议你未雨绸缪。修复遗留代码库虽不如送火箭上天一般高难度,但它确实需要一定程度的专业知识来转换现有的代码库。遗憾的是,大多数开发人员似乎对此技能并不感兴趣,他们似乎也并不想处理遗留代码库。

原文:https://ovid.github.io/articles/a-simple-way-to-fix-legacy-code.html 作者简介:Curtis“Ovid”Poe,拥有二十年的软件开发经验。主要开发 COBOL 金融应用程序、制药 ETL 系统以及用 Perl 编写大型网站等系统。 译者:安翔,责编:屠敏


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我就是马云飞 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【C++】语言深处的“精灵”:探索内存的奥妙
C语言内存管理方式在C++中可以继续使用,但有些地方就无能为力,而且使用起来比较麻烦,因 此C++又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理。
用户11456817
2025/05/13
660
【C++】语言深处的“精灵”:探索内存的奥妙
C++ 内存管理(一)
在编程时可以通过上图的几种方法直接或间接地操作内存。下面将介绍四种C++内存操作方法:
公众号guangcity
2019/09/20
1.6K0
C++ 内存管理(一)
C++第七弹 -- C/C++内存管理
在C/C++编程中,内存管理是至关重要的一个环节。程序员需要合理地分配和释放内存,以确保程序能够正常运行,避免内存泄漏和崩溃。本文将深入探讨C/C++内存管理机制,从内存分布、动态内存管理方式、new和delete的实现原理到定位new表达式,以及malloc/free和new/delete的区别,全面解析C/C++内存管理的方方面面。
用户11317877
2024/10/16
1230
C++第七弹 -- C/C++内存管理
【C++内存管理】—— 策略、陷阱及应对之道
在前面的学习中,我们已经掌握了C语言的动态内存管理,包括 malloc,realloc,calloc,free 等用于动态开辟和释放内存的函数,忘记了?没关系,点击一键复习 C语言动态内存管理
换一颗红豆
2025/02/16
1060
【C++内存管理】—— 策略、陷阱及应对之道
【C++】Chapter02 内存管理
在以往的C语言中,我们一般使用malloc、calloc、realloc来进行内存管理;在C++中,虽然也可以继续兼容使用,但是难免会觉得用起来过于复杂和繁琐,所以C++中一般使用以下的两个操作符进行动态内存管理。
Skrrapper
2025/03/25
660
【C++】Chapter02 内存管理
C++内存管理深度总结(近万字详解!)
在C语言中,动态内存管理主要通过malloc、calloc、realloc和free这四个函数进行。以下是一个简化的代码示例,展示了如何在C语言中使用这些函数来动态分配、使用和释放内存:
suye
2024/10/16
2420
C++从入门到精通——C++动态内存管理
C++动态内存管理涉及使用new和delete操作符来动态分配和释放堆内存。new用于在堆上分配内存并初始化对象,delete用于释放先前分配的内存。此外,C++还提供了智能指针如std::unique_ptr和std::shared_ptr来自动管理内存,以避免内存泄漏和悬挂指针。这些智能指针在超出作用域时会自动删除其所指向的对象。
鲜于言悠
2024/04/22
2720
C++从入门到精通——C++动态内存管理
【C++】C/C++内存管理
程序的运行本质上就是存储一些指令,存储一些数据,对于数据,由于的需求的不同,有的可能使用一下就行了,有的需要长期使用,有的不能修改,因此内存中划分成不同的区域存放相关的一些数据(本文主要目的在于介绍C++相关内存管理方式,对于内存浅浅介绍一些知识,具体相关内存底层知识请移步其他文章。)
ZLRRLZ
2024/12/13
1710
【C++】C/C++内存管理
C++ 内存管理和模板与STL
内存管理方式有 malloc/calloc/realloc/free
2024/12/10
1490
C++ 内存管理和模板与STL
【C++】C/C++内存管理
好的,并没有初始化。 那这样看的话,C++搞出new这些东西和C语言的malloc这些对于内置类型的操作好像除了用法之外也没有什么很大的区别。 那所以呢? C++搞出这些东西更多的是为了自定义类型,那new和delete操作自定义类型我们后面也会专门讲解,先不急。
YIN_尹
2024/01/23
2110
【C++】C/C++内存管理
【C++指南】C++内存管理 深度解析
在 C++ 中,内存管理是程序开发中至关重要的一环。由于 C++ 允许程序员直接操作内存,这既赋予了极大的灵活性,也带来了一定的复杂性和风险。高效且正确的内存管理对于编写高性能、稳定可靠的 C++ 程序起着关键作用。
倔强的石头
2024/12/06
1840
【C++指南】C++内存管理 深度解析
C++:C/C++的内存管理
C语言主要是用malloc/calloc/realloc/free来管理动态内存的。
HZzzzzLu
2024/11/26
1070
C++:C/C++的内存管理
C++ 中 malloc 和 new 的区别
C++ 中 malloc 和 new 都能开辟内存,这篇文章介绍了 C++ 中 malloc 和 new 开辟新内存的区别。
zayyo
2023/11/30
4080
[C++] 深度剖析C_C++内存管理机制
定位new表达式语法:void* operator new(size_t, void* place) noexcept { return place; }
DevKevin
2024/07/25
1110
[C++] 深度剖析C_C++内存管理机制
【C++内存管理】:new与delete,operator new与operator delete
📝前言: 上篇文章【C++高潮:类与对象】我们对C++的类与对象的知识点进行了讲解。 这篇文章我们在C语言内存管理的基础上探讨一下C++内存的管理: 1,C/C++内存分布 2,C语言内存管理 3,C++内存管理方式 4,operator new与operator delete 5,new和delete的实现原理 6,定位new表达式 7,malloc/free和new/delete的区别
用户11029137
2025/03/12
1940
C++之new/delete/malloc/free详解
主要内容: 1.  C语言中的函数malloc和free 2.  C++中的运算符new和delete 3.  new/delete与malloc/free之间的联系和区别 4.  C/C++程序的内存分配介绍 详细介绍:   C语言的函数malloc和free  (1) 函数malloc和free在头文件<stdlib.h>中的原型及参数 void * malloc(size_t size) 动态配置内存,大小有size决定,返回值成功时为任意类型指针,失败时为NULL。   void free
互联网金融打杂
2018/04/03
1.6K0
【C/C++内存管理】——我与C++的不解之缘(六)
对于以上代码,这些创建的全局变量,局部变量以及静态变量等都分别存放在内存的哪些区域?
星辰与你
2024/10/17
1040
【C/C++内存管理】——我与C++的不解之缘(六)
c/c++内存管理
不需要。在代码中,p2指向的内存已经被realloc重新分配或调整,p2指向的内存块可能已经被移动或大小被调整。
用户11039545
2024/08/16
870
c/c++内存管理
C++:27---new delete malloc free
上一节我讲了new和delete,有人问这不是和C语言的malloc/free为C的标准库函数差不多么
用户3479834
2021/02/03
6400
C++:27---new delete malloc free
【C++指南】内存管理完全手册:new/delete
在上图中,各部分变量分配在 A.栈 B.堆 C.数据段(静态区) D.代码段(常量区) 哪个区域呢?
egoist祈
2025/03/19
1000
【C++指南】内存管理完全手册:new/delete
相关推荐
【C++】语言深处的“精灵”:探索内存的奥妙
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档