Code Review:提升代码质量与团队能力的利器
mhr18 2025-05-21 15:06 31 浏览 0 评论
作者:京东物流 韩旭
1. 引言
Code Review(下文简称CR),即代码审查,是一种通过评审代码以发现并修正错误的实践。它不是一个新概念,但在软件开发中,它的重要性毋庸置疑。首先,它可以显著降低软件中的缺陷比例;其次,它促进了知识共享,通过评审的过程,团队成员可以相互学习,增强对系统的整体理解;最后,CR是一种预防措施,它有助于维护代码的清晰和统一,减轻技术债务,提升系统的稳定性。
尽管CR有诸多好处,实际操作中却面临不少挑战。例如,交付压力可能导致CR被忽视或流于形式;另一方面,缺乏有效技巧和工具支持,可能会使CR变得低效,甚至引发团队内的冲突;此外,一些团队可能会遇到参与度不足的问题,团队成员不愿意投入必要的时间和精力。
在接下来的内容中,我们将探讨如何克服这些挑战,优化流程,并分享一些实战经验,以帮助读者在自己团队中实施有效的CR。
在此特别感谢JDL平台技术部王鑫、刘建设、刘风、杨宏强、鞠万奎等对本文撰写的帮助。
2. Code Review的核心目标和基本原则
2.1 核心目标
首先,CR并不是走马观花,也并不需要面面俱到,我们先要明确以下几个核心目标。
2.1.1 提高代码质量
CR的首要目标是提高代码质量。这包括识别缺陷、识别性能问题、确保代码遵循一致的设计原则、提高代码的可读性和可维护性。
2.1.2 风险管理
CR的次要目标是发现潜在风险。通过CR尽早发现并解决潜在的代码问题,以降低未来的修复成本,降低大型项目返工及上线失败的风险。
2.1.3 促进知识共享
最后,通过CR促进团队知识共享。CR过程鼓励团队成员之间的交流和协作,让团队成员相互学习对方的代码和设计思路。这种交流有助于提高团队的整体技能水平,同时减少代码库中知识的单点问题。
2.2 基本原则
对应CR的核心目标,遵循以下几个基本原则有助于做好CR。
2.2.1 专注于代码质量
CR的核心目的是提升代码质量。这包括但不限于代码的清晰性、可维护性、性能、安全性和可测试性等,在评审过程中应时刻专注于这些方面。
2.2.2 保持一致性的标准
遵循团队或项目的编码标准、风格指南和最佳实践。CR应该确保代码更改都符合这些标准,以便于团队成员理解和维护代码,保持一致性还有助于减少错误和提高代码质量。
2.2.3 保持尊重/建设性沟通
沟通是CR过程中的核心元素。所有的反馈都应该是建设性的,目的是改进代码而不是批评个人。作为评审者应针对代码给出具体、有用的反馈,并在表达时考虑代码作者的感受。
3. Code Review的实践步骤与技巧
3.1 实践步骤
CR的实践步骤总体分为三步:准备、评审、修改及完成。
3.1.1 准备
在提交CR之前,应该先自行检查代码,以确保基本的代码质量且遵循代码规范。可以通过单元测试、静态分析插件(例如SonarLint、JD EOS)、借助AI分析插件(例如Copilot、JD JoyCoder)等来完成。
如果更改较大,考虑将其分割成几个小的、逻辑上独立的commit。这样不仅能使每次评审过程更高效,也便于追踪和管理更改。
提交评审的时机,越早进行CR则修改的代价越小,至少应保证在提测前提交CR及完成修改。
最后,确定适合的评审者,建议选择具有业务经验及较为资深的研发人员。
3.1.2 执行评审
在评审过程中,聚焦在代码质量方面(可参考下文提供的checklist)。控制好每次的时长,如果一次评审时间过长,则考虑是否应在准备阶段就拆分成多次commit,进行多次评审,而不是在提测前进行一次大型评审。
3.1.3 修改及完成
开发者根据收到的反馈进行代码调整,改动较大时可能会进行多次反复评审,当修改完成后,由具有权限的负责人将代码合并至相应分支。
3.2 CR的最佳实践技巧
遵循以下的最佳实践技巧,有助于解决CR中遇到的各种问题,并保持高效。
3.2.1 有一份明确的checklist
每次评审时,评审者应该检查哪些内容?对照一份明确的checklist,有助于我们专注于代码质量,并保持一致性的标准。以下是一份可供参考的checklist。
o设计:主要评审整体设计,例如,API设计简单清晰,代码交互、系统交互恰当,技术组件、中间件使用得当等。
o功能性/非功能性:评审代码的行为是否符合预期?大多数时候,仅靠评审并不能发现每一行代码是否如期运行,我们应特别关注一些异常的极端情况,例如,边界处理、异常死循环、非法的输入输出、大报文处理、兼容性问题、线程安全/并发问题、Exception处理等。
o性能/稳定性:对于一些高吞吐量的系统,响应性能尤其重要。例如,确保依赖服务SLA符合预期,超时和重试配置得当,避免产生慢SQL、大量锁等待、线程阻塞/耗尽等。
o可观测性:是否在上线后可观测代码运行的行为,发生异常时可及时感知?例如,确保方法添加了必要的监控埋点、有正确的日志级别及日志内容。
o复杂度:代码实现足够简单吗?是否有过度设计?作为评审者应让代码尽量保持简洁,以便让其他的开发者可以快速理解,降低未来修改时引入新错误的风险。
o命名:是否为变量、类、方法等选择了清晰的名称?命名应遵守代码规范,且能够准确表达代码的意图,而又不至于过长难以阅读。
o注释:注释清晰无歧义,应解释代码“为什么”,而不是“是什么”。注释更应解释一些代码外的隐含信息,例如,设计的取舍、业务背景、某些看起来很tricky的实现,以及解释正则表达式、特定算法等内容。
o测试:是否有适当的单元测试?需要修改已有的单元测试?
o风格:是否遵循一致的代码风格?风格无所谓好坏,但保持一致性的风格,会让其他团队成员更容易理解。
o文档:是否需要更新相关API说明、Readme等文档?
3.2.2 避免完美主义
在评审中发现问题固然重要,但也应结合实际约束及现状进行权衡,并非所有代码均要达到理论上的最优解及最佳实践。只要这次修改让代码有所改善,或是向着正确的方向前进,那么代码就是可以接受的。(调研报告显示61%的CR没有发现缺陷)
3.2.3 拆分为小型MR/PR/Commit
小型的changelist,拥有降低评审难度、缩短评审时间、减少引入错误的可能性、易于合并等诸多好处。通常认为将changelist控制在只解决一件事(可以只是feature的一部分),视作合适的大小。我们可以按层进行水平拆分、按功能进行垂直拆分,亦或是结合两者,有兴趣的读者可以阅读文章最后引用的google关于CR工程实践文章。
3.2.4 一次不要评审过多的代码
建议将每次评审的代码控制在100~300行,最多不超过500行,每次评审时间不超过1.5小时(调研报告显示超过这些阈值会导致CR质量及效率大幅降低)。不过根据实际场景不同,读者可以根据代码实际的复杂度进行调整。
3.2.5 尽早进行小而频繁的评审
尽早评审有助于提前发现问题,减少后期修正的成本。编码阶段,在IDE环境安装静态代码检查工具,提前预先检查代码风格、格式等基本错误,可减少人工评审的工作量。面对大型代码变更,将代码分为更小而独立的多次commit,尽早进行多次评审,也可提升评审质量,减少返工成本。
3.2.6 保持尊重
保持开放的心态,抛开自负,不要将个人偏好带入到CR中。作为代码审查者,应意识到代码作者更了解其编写的代码,并不是每次评审都需要进行代码调整。基于事实及代码规范来提出改进建议,会使代码作者更容易接受。作为代码提交者,提交高质量的代码,是对评审者和团队最基本的尊重。保持开放的心态,将评审当做自我学习和提升的过程。
3.2.7 度量和改进
设定一些度量指标,并持续追踪趋势,有助于我们持续不断改进CR过程。以下是一些可以用作度量的指标,例如,审查时长、缺陷密度、CR率等。
4. 案例分享
以下是身边真实发生的一些CR案例,与3.2.1章节中的checklist都有相应的对照,供大家参考。为了便于阅读,部分代码进行了删除简化。
4.1 案例1-异常及并发情况处理不周
问题:静态缓存先clear,再进行加载,如果解析过程异常会导致配置丢失、在高并发访问时读取到错误的配置。
改善:应使用覆盖更新的方式。
public class ReverseSwitch {
private static Map<String, Boolean> multiConfigAddress = new HashMap<>();
public void setMultiConfigAddress(String multiConfigAddress){
ReverseSwitch.multiConfigAddress.clear();
// 以下是解析字符串配置映射到Map配置中,省略具体过程
for (/*.....*/) {
ReverseSwitch.multiConfigAddress.put(/*.....*/);
}
}
public static boolean isMultiConfigSwitch() {
// .....
}
}
CR修改后:
public void setMultiConfigAddress(String multiConfigAddress){
log.info("ReverseSwitch.setMultiConfigAddress {}", multiConfigAddress);
Map<String, Boolean> newAddress = new HashMap<>();
// 省略解析过程
for () {
newAddress.put();
}
// 使用覆盖更新的方式
ReverseSwitch.multiConfigAddress = newAddress;
}
4.2 案例2-设计问题、可观测性不足
问题:1. 本地缓存每小时失效一次,会集中产生大量RPC请求加载数据(容器数量*外部请求数),当依赖的RPC服务抖动时有可能导致雪崩;2. do while语句在远程数据异常时,可能循环次数超出预期或产生死循环,导致tp99超时、阻塞或OOM;3. 缺少必要的日志及监控埋点。
改善:1. 使用redis缓存并预加载;2. while内设置最大分页次数进行break;3. 上层调用增加监控埋点及日志。(由于修改不止一处文件,未一一列出修改后的代码)
@CacheMethod(key = "vrs.SpareQueryProxyCache.getAllSpareInfo",
cacheBean = "localGuavaCacheBean60m",
timeout = Constants.REDIS_KEY_TIMEOUT_MINUTES_60)
public List<BaseStoreInfoDto> getAllSpareInfo() {
int pageNum = 0;
PageDto<List<BaseStoreInfoDto>> page;
List<BaseStoreInfoDto> returnList = new LinkedList<>();
do {
page = basicPrimaryWS.getBaseStoreInfoByPage(++pageNum);
if (page != null && CollectionUtils.isNotEmpty(page.getData())) {
// 省略对page内容进行筛选等逻辑处理代码
// ......
returnList.addAll(page.getData());
}
}
while (page != null && page.getCurPage() < page.getTotalPage());
return returnList;
}
4.3 案例3-代码复杂度
问题:代码不够内聚,可读性不好,开发追加需求时将多个校验的逻辑写到了校验方法外。
改善:将校验逻辑放到对应的校验方法内,保持代码整洁,降低理解难度。
public void buildWaybillCodeList(AfterSaleOrderReceiveContext afterSaleOrderContext) {
boolean useServiceCode = true;
// 条件1
if (condition_1) {
useServiceCode = false;
}
// 其他条件
if (!canUseServiceCode(afterSaleOrderContext)) {
useServiceCode = false;
}
// 条件2
if (condition_2) {
useServiceCode = false;
}
List<String> waybillCodeList = new ArrayList<>();
if (useServiceCode) {
// 场景1:单号规则
waybillCodeList.add(WAYBILLCODE_PREFIX + afterSaleOrderContext.getAfterSaleOrderReceiveDTO().getServiceCode());
} else {
// 场景2:单号规则
waybillCodeList.add(this.preDeliveryId(afterSaleOrderContext));
}
// ......
}
private boolean canUseServiceCode(AfterSaleOrderReceiveContext afterSaleOrderContext) {
List<ProductDetailDTO> productDetailDTOList = buildMainGiftProductList(afterSaleOrderContext);
// 只针对一单一品一个数量的返回true
return productDetailDTOList.size() == 1 && Objects.equals(productDetailDTOList.get(0).getProductCount(), 1);
}
CR修改后:
public void buildWaybillCodeList(AfterSaleOrderReceiveContext afterSaleOrderContext) {
List<String> waybillCodeList = new ArrayList<>();
// 将多次需求变更的逻辑点聚合到职责明确的方法内
if (canUseServiceCode(afterSaleOrderContext)) {
// 场景1:单号规则
waybillCodeList.add(WAYBILLCODE_PREFIX + afterSaleOrderContext.getAfterSaleOrderReceiveDTO().getServiceCode());
} else {
// 场景2:单号规则
waybillCodeList.add(this.preDeliveryId(afterSaleOrderContext));
}
// ......
}
private boolean canUseServiceCode(AfterSaleOrderReceiveContext afterSaleOrderContext) {
// 条件1
if (condition_1) {
return false;
}
// 条件2
if (condition_2) {
return false;
}
// 条件3
List<ProductDetailDTO> productDetailDTOList = buildMainGiftProductList(afterSaleOrderContext);
// 只针对一单一品一个数量的返回true
return productDetailDTOList.size() == 1 && Objects.equals(productDetailDTOList.get(0).getProductCount(), 1);
}
4.4 案例4-增加灰度策略控制
问题:CR过程中发现无法评估改动影响的业务范围,如有问题可能会影响100%的流量。
改善:增加灰度策略开关。
public void setConsigneeAddress(WaybillAddress targetAddress) {
// 100%修改至新逻辑:A
// ......
}
CR修改后:
public void setConsigneeAddress(WaybillAddress targetAddress) {
// 选取可控的特征属性,例如按流量比例或商家切量
if (ThreadLocalRandom.current().nextInt(1000) < ducc.getAddressMontageSwitchRate()) {
// 新逻辑:A,使用灰度策略,控制本次改动影响范围
// ......
} else {
// 原逻辑:B
// ......
}
}
4.5 案例5-善用工具
在提交人工CR前,善用工具进行代码扫描,可能有意想不到的收获。
对如下代码使用JD JoyCoder进行自动评审建议。
if (response != null
&& response.getCode() != 0
&& String.valueOf(response.getCode()).length() > 2
&& (KK_PARAM_PREFIX_CODE.equals(String.valueOf(response.getCode()).substring(0, 2)))
|| KK_BIZ_PREFIX_CODE.equals(String.valueOf(response.getCode()).substring(0, 2))) {
throw new BusinessException(StringUtils.isNotBlank(response.getSubMsg()) ? response.getSubMsg() : response.getMsg());
}
JD JoyCoder给出的评审意见:“代码中存在一个潜在的逻辑错误,这是由于条件判断中的逻辑运算符&&和||的优先级没有被明确区分。在Java中,&&操作符的优先级高于||,这意味着在没有适当的括号的情况下,&&绑定的条件会先被评估,然后才是||绑定的条件。”
修改后:
if (response != null
&& response.getCode() != 0
&& String.valueOf(response.getCode()).length() > 2
&& ((KK_PARAM_PREFIX_CODE.equals(String.valueOf(response.getCode()).substring(0, 2))
|| KK_BIZ_PREFIX_CODE.equals(String.valueOf(response.getCode()).substring(0, 2)))) {
throw new BusinessException(StringUtils.isNotBlank(response.getSubMsg()) ? response.getSubMsg() : response.getMsg());
}
// 此段代码可以进一步优化,将if里面的条件提前抽取到有明确业务语义的变量中,提升可读性
除目前流行的基于LLM实现的AI扫描工具外,使用传统代码扫描也可以发现潜在问题。
以下代码通过静态扫描工具发现问题:直接使用“==”进行包装类型Integer的比较,当遇到[-128, 127]范围外时比较结果会不符合预期。
if (!(request.getSkuList().stream().allMatch(
sku -> sku.getPreProduce() != null &&
sku.getPreProduce() == request.getSkuList().get(0).getPreProduce()
))) {
throw new DOSException(ResultEnum.PRE_PRODUCE_UN_SAME.getCode(), ResultEnum.PRE_PRODUCE_UN_SAME.getMessage());
}
修改后:
if (!(request.getSkuList().stream().allMatch(
sku -> sku.getPreProduce() != null &&
sku.getPreProduce().equals(request.getSkuList().get(0).getPreProduce())
))) {
throw new DOSException(ResultEnum.PRE_PRODUCE_UN_SAME.getCode(), ResultEnum.PRE_PRODUCE_UN_SAME.getMessage());
}
5. Code Review的成果收益
笔者所在团队没有单独统计数据来佐证CR与线上缺陷的直接关联。线上质量与CR、单元测试、质量测试、SRE等各方面息息相关,CR并非银弹,但是做好CR非常有助于降低缺陷数量。
通过搜索公开数据显示,行业中使用CR的项目,潜在缺陷发现率约在50%~60%之间,大部分的测试,潜在缺陷发现率约在30%左右。同时,数据显示约75%的CR评审意见影响着软件的可维护性/可演化性,这表明CR利于软件系统的长期演化。
6. 总结与展望
本文探讨了CR的重要性,它可以提前发现缺陷,有助于知识共享及团队能力提升,同时分享了CR实践步骤、技巧、案例等内容。当然,本文仅是一份参考指南,每个团队根据其所处现状的不同,可以根据本文调整优化各自的实践流程。
如今,软件开发的格局在不断变化,围绕CR的实践也在不断发展。随着技术的进步,更智能的工具和 AI 辅助平台在不断涌现,这些工具能够提供更高级的静态分析、模式识别,甚至预测分析,在潜在问题出现之前识别它们。这种AI上下文感知的能力,将能够根据项目特定的编码风格、功能模块以及依赖关系,提供针对性的CR反馈,甚至不再需要人工评审的介入。
未来,CR将继续发挥其关键作用,我们期待AI+CR成为一个更加强大和智能的伙伴,使团队将能够保持竞争力,持续提升软件质量和交付速度。
7. 参考资料
《Google Engineering Practices Documentation》:
https://google.github.io/eng-practices/review/
《Code Review at Cisco Systems》:
https://static1.smartbear.co/support/media/resources/cc/book/code-review-cisco-case-study.pdf
Wikipeida:https://en.wikipedia.org/wiki/Code_review
相关推荐
- Java培训机构,你选对了吗?(java培训机构官网)
-
如今IT行业发展迅速,不仅是大学生,甚至有些在职的员工都想学习java开发,需求量的扩大,薪资必定增长,这也是更多人选择java开发的主要原因。不过对于没有基础的学员来说,java技术不是一两天就能...
- 产品经理MacBook软件清单-20个实用软件
-
三年前开始使用MacBookPro,从此再也不想用Windows电脑了,作为生产工具,MacBook可以说是非常胜任。作为产品经理,值得拥有一台MacBook。MacBook是工作平台,要发挥更大作...
- RAD Studio(Delphi) 本月隆重推出新的版本12.3
-
#在头条记录我的2025#自2024年9月,推出Delphi12.2版本后,本月隆重推出新的版本12.3,RADStudio12.3,包含了Delphi12.3和C++builder12.3最...
- 图解Java垃圾回收机制,写得非常好
-
什么是自动垃圾回收?自动垃圾回收是一种在堆内存中找出哪些对象在被使用,还有哪些对象没被使用,并且将后者删掉的机制。所谓使用中的对象(已引用对象),指的是程序中有指针指向的对象;而未使用中的对象(未引用...
- Centos7 初始化硬盘分区、挂载(针对2T以上)添加磁盘到卷
-
1、通过命令fdisk-l查看硬盘信息:#fdisk-l,发现硬盘为/dev/sdb大小4T。2、如果此硬盘以前有过分区,则先对磁盘格式化。命令:mkfs.文件系统格式-f/dev/sdb...
- 半虚拟化如何提高服务器性能(虚拟化 半虚拟化)
-
半虚拟化是一种重新编译客户机操作系统(OS)将其安装在虚拟机(VM)上的一种虚拟化类型,并在主机操作系统(OS)运行的管理程序上运行。与传统的完全虚拟化相比,半虚拟化可以减少开销,并提高系统性能。虚...
- HashMap底层实现原理以及线程安全实现
-
HashMap底层实现原理数据结构:HashMap的底层实现原理主要依赖于数组+链表+红黑树的结构。1、数组:HashMap最底层是一个数组,称为table,它存放着键值对。2、链...
- long和double类型操作的非原子性探究
-
前言“深入java虚拟机”中提到,int等不大于32位的基本类型的操作都是原子操作,但是某些jvm对long和double类型的操作并不是原子操作,这样就会造成错误数据的出现。其实这里的某些jvm是指...
- 数据库DELETE 语句,还保存原有的磁盘空间
-
MySQL和Oracle的DELETE语句与数据存储MySQL的DELETE操作当你在MySQL中执行DELETE语句时:逻辑删除:数据从表中标记为删除,不再可见于查询结果物理...
- 线程池—ThreadPoolExecutor详解(线程池实战)
-
一、ThreadPoolExecutor简介在juc-executors框架概述的章节中,我们已经简要介绍过ThreadPoolExecutor了,通过Executors工厂,用户可以创建自己需要的执...
- navicat如何使用orcale(详细步骤)
-
前言:看过我昨天文章的同鞋都知道最近接手另一个国企项目,数据库用的是orcale。实话实说,也有快三年没用过orcale数据库了。这期间问题不断,因为orcale日渐消沉,网上资料也是真真假假,难辨虚...
- 你的程序是不是慢吞吞?GraalVM来帮你飞起来性能提升秘籍大公开
-
各位IT圈内外的朋友们,大家好!我是你们的老朋友,头条上的IT技术博主。不知道你们有没有这样的经历:打开一个软件,半天没反应;点开一个网站,图片刷不出来;或者玩个游戏,卡顿得想砸电脑?是不是特别上火?...
- 大数据正当时,理解这几个术语很重要
-
目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并...
- 秒懂列式数据库和行式数据库(列式数据库的特点)
-
行式数据库(Row-Based)数据按行存储,常见的行式数据库有Mysql,DB2,Oracle,Sql-server等;列数据库(Column-Based)数据存储方式按列存储,常见的列数据库有Hb...
- AMD发布ROCm 6.4更新:带来了多项底层改进,但仍不支持RDNA 4
-
AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm6.4。这一新版本里,AMD带来了多项底层改进,包括更新改进了ROCm的用户空间库和AMDKFD内核驱动程序之间的兼容性,使其更容易...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle 空为0 (51)
- oracle主从同步 (56)
- oracle 乐观锁 (53)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)