近年来,锂离子电池因具有功率/能量密度高、循环寿命长、自放电率低等优点,受到学术界和产业界的广泛关注,已应用于电子消费品、电动汽车、分布式储能、大规模储能等不同场景。作为一类典型的涉及复杂电化学反应/传递机理的能量储存装置,锂离子电池本身存在较高安全隐患,需要采用系统工程的理论和方法,在电池材料体系研发、电池管理系统设计、储能系统结构优化等各个层面予以关注,确保其在实际使用中的安全、稳定、可靠运行。但是,一方面,锂离子电池在实际运行过程中,受当前电、热和安全管理系统技术发展水平的限制,在某些情况下会发生机、电、热滥用,如过充、过放、过热等,容易引起电池性能的快速衰退,甚至发生内短路而引发安全问题。另一方面,在电动汽车、分布式储能、大规模储能领域应用时,为满足电流、电压、功率、能量的需求,常需要通过串并联手段将大量单体组成电池组、电池包乃至电池簇,会存在大量的连接组件,极大地增加了系统的复杂程度,将导致发生各类故障的概率增大,并增加了安全隐患。因此,在认清电池系统故障引发机制的基础上,至少需要在锂离子电池单体和系统两个层面实施故障诊断,确保能有效识别出渐变性、突发性等各类故障,实现提前预警,提高电池系统实际运行的安全性、稳定性和可靠性。
本文首先对锂离子电池的常见故障进行了分类,并简要分析了电池本体故障引发机制;其次简要总结了现有故障诊断方法,并对其进行了分类;之后,针对不同类型故障,全面综述了现有故障诊断技术解决方案;最后,总结了电池故障诊断技术的挑战与未来发展方向。
1 锂离子电池常见故障
1.1 锂离子电池系统常见故障分类
常见的锂离子电池系统主要包括电池本体、电池管理系统、传感器、连接组件等,在实际运行过程中,由于引发故障的原因各不相同,不仅电池本体会发生各种类型故障,而且电池管理系统、传感器、连接组件等也会发生故障。目前,大部分故障诊断方法研究主要针对电池本体,对其他电池系统故障研究相对较少。
1.1.1 电池本体故障
锂离子电池在实际运行过程中,会因其内部结构或特性发生变化而引发故障。根据电池本体故障的发生/发展历程不同,主要可分为渐变性故障和突发性故障两大类:① 渐变性故障主要由电池老化导致,电池随着充放电循环,会发生活性物质损失与内阻增大,导致容量衰减与功率衰退,对其健康状态进行精准诊断,对剩余使用寿命评估有重要作用;② 突发性故障是指无明显征兆或短时征兆,便造成电池系统突然失效或性能明显下降的故障,包括内短路、热失控、容量跳水、漏液等,例如锂离子电池在使用过程中,因机械滥用导致内短路,会在短时间内产生大量热,进而引发热失控,发生冒烟、起火甚至爆炸。由于锂离子电池的老化机理复杂,实现电流、电压、温度多种操作工况对老化程度定量评价还未有突破性进展,实施渐变性故障的精准诊断难度较高,是目前的研究热点。但是,相比渐变性故障,突发性故障预警时间更短,诊断难度更高,潜在危害更大,是锂离子电池本体故障诊断亟需解决的难点问题。
1.1.2 其他类型电池系统故障
其他类型的电池系统故障主要包括如下三个 部分。
(1) 电池管理系统(battery management system, BMS)部件故障
BMS的主要作用是对电池系统的工作状态进行监测和管理,是系统的核心控制单元,对保障电池安全、稳定、可靠运行有重要意义。若BMS部件发生故障,会发布错误指令,干扰电池系统的正常运行,严重时会对电池产生不可逆破坏,进而引发一系列连锁故障。例如BMS的均衡部件发生故障,会导致电池系统不一致性加剧,影响系统性能发挥;若BMS的充放电控制部件发生故障,会引起过充过放风险,降低电池使用寿命,严重时会引发安全事故;若BMS的温控部件发生故障,会导致电池系统温度过高或过低,可能引发电池系统的热滥用,严重时会引发热失控。目前,研发符合高等级功能安全的BMS是工业界重点关注的热点问题,需要从设计开发流程、软/硬件等不同方面综合考虑予以解决。
(2) 传感器故障
为实现电池系统工作状态的有效监控,需要精确、可靠地测量电流、电压和温度信息,以便实施电池状态估计、充放电控制、故障诊断、均衡控制、温度控制等功能。但是,传感器在使用过程中,会不可避免地出现偏差、漂移、精度等级降低、甚至停止工作等故障,会导致电流、电压和温度数据无法测量或测量数据不精确,难以对电池当前工作状态进行精确、合理地判断,将诱发BMS系统停止工作或发布错误指令,干扰电池系统的正常运行,甚至引发安全问题。一般地,相比传感器停止工作故障,偏差、漂移、精度等级降低等传感器故障隐蔽性更高,诊断难度更大,是目前传感器故障诊断研究的重点和难点。
(3) 连接组件故障
在电池系统实际运行过程中,由于震动、部件腐蚀、电池产气膨胀等原因,可能引发电池系统内连接组件的故障,如螺母/焊点松动或接触不良。发生此类故障时,电池接触内阻增加,导致动态压差大、静态压差小,将会影响电池系统在高倍率下的功率性能;若此类故障长期未被有效检测并排除,过高的内阻将导致局部热量持续累积,会引发电池容量快速衰减甚至热失控[13]。
1.2 电池本体故障引发机制
对电池系统实施故障诊断,一般需要先诊断BMS、传感器、连接组件等其他类型电池系统故障,以排除外部干扰,确保用于电池本体工作状态估计的信息是精确、可靠的,以此实施电池本体故障诊断才更具合理性。相比其他电池系统故障,电池本体故障由于其引发原因众多,诊断难度更大,是电池系统故障诊断的关键核心环节。因此,需要在认清电池本体故障的引发机制基础上,研发合理、可靠的多方位、多层次电池本体故障诊断技术,实现电池本体的全面防护,对降低失效风险、提高安全性、延长使用寿命有重要意义。
对上述电池本体渐变性和突发性两类故障,虽然对其实施故障诊断是在电池实际运行阶段,但在电池制造和成组阶段的技术水平会直接影响电池性能,进而影响实际运行中的故障发生概率。目前,受到现有制造工艺技术水平和成本的限制,电池在制造过程中,会引入故障隐患,例如在涂布过程中,若有粉尘吸附在隔膜或正负极表面,易导致局部隔膜结构被破坏,造成电池局部微短路;在极片切割过程中,正负极集流体边缘产生的毛刺可能发生部分接触而导致电池微短路;在卷绕、叠片过程中,正负极若因故障发生错位,将导致正负极直接接触,会引起内短路。在电池筛选成组阶段,对同批次电池常采用抽检策略,难以保证串并联电池系统中各单体间具有优良的一致性,即使辅以性能优良的均衡控制技术,电池系统不一致性也会随着实际运行的充放电循环逐渐增大,导致个别单体会发生异常,影响系统性能发挥和使用寿命。
在电池系统实际运行阶段,一方面,即使电池运行于电流、电压和温度的安全窗口中,在全生命周期内电池会不断老化,SEI膜会不断分解与再生,负极表面往往难以避免地发生析锂现象等,造成容量衰减;并可能诱发锂枝晶,且随着锂枝晶不断生长,隔膜有可能被刺破,形成微/内短路,存在热失控的突发性故障隐患。另一方面,当电池系统运行于异常工况,即超出了电流、电压和温度的安全操作窗口,其渐变性和突变性两类故障引发概率会大大增加,以下简要描述了过充、过放、大倍率充放电、过冷、过热和不一致性这6类常见异常运行工况对电池本体故障的引发机制。
(1) 过充
因存在电池组不一致、充电控制技术未能精确调控等问题,不可避免地会出现部分单体发生过充现象。一般地,电池发生过充,会在其负极表面发生析锂现象,对存在长期轻微过充情况,会因活性锂损失而导致电池容量过快衰减的渐变性故障,同时析锂可能诱发锂枝晶,增大隔膜刺破引发微/内短路的安全隐患。在某些极端情况下,例如发生BMS失效时,会发生电池长时间深度过充可能,导致电池温度持续升高,触发如SEI膜分解、电解液分解、隔膜熔融、电解液分解、正极材料分解等一系列放热副反应,最终引发电池内短路、热失控等突发性故障。
(2) 过放
与过充现象类似,在电池系统实际运行过程中,会不可避免地出现部分单体发生过放现象。针对存在长期轻微过放情况,由于负极表面和SEI膜的锂离子全部脱嵌,易引起负极结构和SEI膜破坏,导致活性物质不可逆损失,引发电池容量过快衰减的渐变性故障。若发生长时间深度过放,会造成负极集流体铜箔被氧化溶解后沉积在负极表面,一方面,影响负极集流体的电子传输能力和阻碍锂离子的脱嵌,造成电池容量过快衰减和内阻过快增大的渐变性故障;另一方面,沉积在负极表面的铜可能刺破隔膜,引发电池内短路、热失控的突发性故障风险。此外,深度过放会使正极材料过度嵌锂,引发正极材料晶体结构的不可逆破坏,导致电池性能恶化。
(3) 大倍率充放电
随着电池充放电倍率的增大,产热速率也会相应增大,容易引发电池内部的放热副反应,增大内短路风险,会引起电池热失控的突发性故障。尤其针对大倍率充电过程,由于受固相扩散速率限制,容易发生负极析锂现象,引发容量过快衰减的渐变性故障,并容易诱发锂枝晶而引发内短路的安全隐患。
(4) 过冷
当电池处于低温工作环境时,可能会引起电解液中部分溶剂凝固化,锂离子迁移/扩散速率明显变小,尤其针对低温充电情况,会出现电化学反应与固相扩散速率的不匹配,在负极表面出现析锂现象,易形成锂枝晶而引发隔膜刺破、内短路等一系列突发性故障。
(5) 过热
当电池处于较高工作环境温度时,会加大电池内部副反应速率,如SEI膜分解与再生速率,导致活性物质不可逆损失速率加快,引发电池容量过快衰减的渐变性故障。在充放电过程中,若电池工作环境过高且产热速率明显高于散热速率,会触发如SEI膜分解、电解液分解、隔膜熔融、电解液分解、正极材料分解等一系列放热副反应,最终引发电池内短路、热失控等突发性故障。
(6) 不一致性
在电池制造、筛选成组和使用各个阶段,电池系统内各单体间在可用容量、内阻、开路电压、自放电率、荷电状态等内部/外部参数均会存在一定程度的不一致性,会对系统效率、安全性、使用寿命造成影响。一般地,随着充放电循环,由于各单体的老化历程不同,单体间不一致性往往会逐渐增大,影响系统整体容量的发挥。例如,在筛选成组阶段,低可用容量单体会在实际运行过程中,可能长时间满充满放,甚至过充过放,会加速其老化过程,最终导致电池提前失效,整个电池系统也会在此过程中表现出容量过快衰减的渐变性故障。因此,通过实时、精准的评估电池系统不一致性,提前识别并定位故障单体,并实施针对性的运营维护,是电池本体故障诊断的又一个重要内容。
由于电池本体故障的引发机理复杂,需要在电
池制造、筛选成组和使用各个阶段实施优化设计与调控,切实降低故障隐患,提高电池系统安全性和可靠性,并延长使用寿命。在电池实际运行阶段,通过优化设计电、热管理策略,尽可能避免过充、过放、过冷、过热和大倍率充放电等异常操作,以延缓容量衰减和内阻增大速率,降低析锂、微/内短路、热失控等风险;通过设计合理的电池本体故障诊断技术,实现故障单体的精准提前识别,可为针对性的运行维护提供技术支撑,对电池系统的安全、稳定、可靠运行有重要意义。
2 锂离子电池故障诊断方法分类
根据实时采集的电流、电压、温度等信息,通过设计合理的故障诊断系统,实现故障预警,并能将故障信息反馈至电池管理系统,以采取必要保护措施,保障电池系统的安全、稳定、可靠运行,故障诊断系统的流程示意如图1所示。
图1 故障诊断系统流程图
目前,锂离子电池故障诊断诊断方法大致可分为两大类:其一是基于电池模型的故障诊断方法,其二是无电池模型的故障诊断方法。
2.1 基于电池模型的故障诊断方法
基于电池模型的故障诊断,其关键是建立精确、可靠的电池模型,通过比较模型预测值与实测值的差异,实现故障预警。目前,电池模型主要包括电化学机理模型、等效电路模型和数据驱动模型三大类。电化学机理模型计算复杂度高,往往难以适用于实时在线计算,需要实施模型简化后应用,其合理简化方法有待发展;数据驱动模型是一种纯经验模型,其性能依赖于样本质量,外推性能往往难以保证;等效电路模型是一种半经验半机理模型,计算复杂度较低,且具有优良的预测性能,已广泛地应用于电池管理系统。目前,基于电池模型的故障诊断方法,基本采用等效电路模型,常有两种策略。
(1) 融合电池模型与参数估计方法即可建立正常电池模型
如图2(a)的一阶等效电路模型,通过在线数据对模型参数进行估计后,根据模型参数对电池故障进行诊断;也可建立电池故障模型,通过比较实测值与故障模型预测值是否匹配,实现此类故障的诊断,如通过建立如图2(b)所示的包含微/内短路故障的等效电路模型,若实测电压值与此故障模型电压预测值基本吻合,则可实现对微/内短路故障的有效诊断,并可结合参数估计策略实现对微/内短路故障的定量诊断。
图2 电池系统故障诊断方法分类
(2) 融合电池模型与状态估计方法
如图3所 示,以电流作为模型输入,电压、温度作为模型输出,结合电压、温度的实测值,通过滤波算法获取电池端电压、温度的估计值,通过计算电压/温度估计值与其实测值的残差,对系统故障进行诊断,
图3 (a)锂离子电池等效电路模型;(b)锂离子电池内短路模型
图4 基于电池模型与状态估计的故障诊断流程图
也可利用估计得到的电池内部状态,如SOC、内部温度,对电池故障进行诊断。基于状态估计的故障诊断,其关键是开发精确、可靠的状态空间模型和高效的状态估计方法。
2.2 无电池模型的故障诊断方法
无电池模型的故障诊断方法无需针对单体电池的动态特性进行建模,在线实施可避免单体电池模型的参数更新迭代,效率较高;但是,相比基于模型的故障诊断方法,此类方法依赖于样本数据质量,外推能力相对较差,且往往难以给出定量化的诊断结果。现有关于无电池模型的电池故障诊断方法大致可分为如下三类。
(1) 基于统计分析的故障诊断方法
直接依据信号采集系统得到的电流、电压和温度数据,利用信息熵、正态分布等统计方法进行分析,通过设置合理的异常系数或阈值,实现电池故障诊断。此类方法计算复杂度低,执行效率高,但往往仅能实现故障检测,难以对故障类型进行识别。
(2) 基于数据驱动建模的故障诊断方法
将电池可测数据作为输入,电池故障作为输出,通过构建诸如人工神经网络[47]、径向基神经网络、多模型融合策略等数据驱动模型,实现电池系统故障的在线诊断。此类方法的诊断精度往往依赖于训练数据的质量和数量,合理利用电池系统大数据平台,有望获得较为可靠的训练数据。另外,由于离线数据往往难以完全覆盖各种类型的故障,需要融合自适应在线学习策略,以提高故障诊断适应性。
(3) 基于专家系统的故障诊断方法
专家系统主要由知识库、推理机、实时数据库和人机接口组成,可用于多种故障的检测和隔离。知识库是专家系统的核心关键,其质量好坏直接决定专家系统的诊断性能。一般地,构建知识库的信息来源主要包括两方面:其一是基于电池系统故障特征分析的专家领域知识/规则;其二是历史运行数据和故障检修记录信息。同时,为保障知识库的适应性,在电池系统实际运行过程中,需要合理利用运行数据、检修记录等信息,实施在线更新与优化,具备自学习能力。推理机是实现故障类型、发生时间/位置预测的关键,目前研究大多采用模糊逻辑方法,但由于知识库中的规则/模型可能会相互冲突,需要开发具有自学习能力、强鲁棒性的决策方法。
3 锂离子电池系统故障诊断应用案例
针对锂离子电池系统故障诊断,现有研究主要集中在不一致性、短路、热失控、传感器和连接组件5个方面的单一故障诊断,仅有少量研究涉及多种故障的联合诊断。
3.1 不一致性故障诊断
针对由大量单体串并联组成的电池系统,在实际使用中,往往需要设计开发性能优良的主/被动均衡控制技术与热管理系统,以提高各单体间电压和温度的一致性,对提升电池系统的效率、安全性和使用寿命均有重要意义。但是,受限于目前技术发展水平,难以保障电池系统一致性的精确调控,且在实际运行过程中,不可避免地会出现某个/部分单体发生渐变性或突变性的故障,体现在异常单体与其他正常单体间的电压、温度不一致性增大,会导致电池系统性能的下降。现有关于不一致性故障诊断研究主要基于电池系统实际历史运行数据,采用统计分析和数据建模方法,识别电压/温度故障 单体。
WANG等提出了一种融合香农熵与Z分数策略的电池系统电压/温度故障诊断方法,通过电动汽车储能系统实际运行数据验证,表明该方法不仅能有效识别出异常电压/温度的发生时间,而且能对电压/温度异常单体进行精确定位。针对实测电压数据存在受到噪声污染的问题,SUN等提出了基于小波分析与香农熵的串联电池组电压故障诊断方法,通过电池组充放电实验数据验证,表明该方法能在较短时间内实现对电压异常单体的有效识别。基于电动汽车储能系统历史运行数据,ZHAO等提出了基于3Σ多层次筛选与反向传播神经网络的电池系统电压故障诊断方法,其中3Σ多层次筛选方法用于建立无电压故障指标,而反向传播神经网络用于构建故障分布模型,通过与局部异常因子和聚类异常因子分析两类方法进行比较,验证了该方法的有效性。
需要指出的是,上述各类方法仅能识别出系统运行过程中单体出现电压/温度异常,实现对故障单体快速定位,但是难以对引发电压/温度故障的原因进行诊断。由于电池本体的电压/温度数据是由传感器实测得到,对其分析前首先需要排除传感器故障影响;同时,还需要判断是否由于连接组件故障导致,提前实施排除。以此为基础,针对电池本体的电压故障,其有可能是与电池组内其他单体的可用容量、内阻、开路电压、自放电率、荷电状态等存在明显差异而导致,往往需要结合电池内/外参数辨识技术,才能实现对引发电压故障的原因实施合理诊断。与此类似,对电池本体的温度故障,其可能由高内阻、内短路等原因导致,也需要结合电池内特性的精准表征技术,以实现对引发温度故障的原因诊断。
3.2 短路故障诊断
锂离子电池发生短路是引发热失控的主要诱因,危害性大,亟需解决短路的提前预警难题,以提高电池运行的安全性。造成电池本体内短路的原因很多,在电池制造阶段,引入的微量金属杂质、毛刺等会引发隔膜刺破而造成内短路;在电池使用阶段,机、电、热滥用会引发隔膜撕裂、刺破、收缩坍塌等导致内短路。除电池内短路外,电池组也会发生外部短路,两者的电流-电压响应具有一定的相似性,实现两者的提前区分有一定难度。对电池短路故障实施合理诊断,需要在不同层面解决如下问题:① 定性判断电池是否存在短路;② 定量计算短路程度,即漏电流/短路电阻的大小;③ 定位短路发生位置,并区分内/外短路;④ 判断引发电池短路的内在原因;⑤ 认清由短路引发热失控的演化规律,实现提前预警,保障安全运行。
目前,针对短路故障研究,主要采用基于电池组模型或单体短路模型的诊断方法。OUYANG等提出了一种基于均值-差异模型的电池组内单体短路诊断方法,采用递归最小二乘法对模型参数实施估计,综合考虑电压差和内阻特征参数变化,实现对内短路故障的诊断。GAO等提出了一种基于均值-差异模型与扩展卡尔曼滤波的电池短路定量诊断方法,通过离线建立包括SOC与内阻差异的电池模型,在扩展卡尔曼滤波算法实施电池组内SOC差异估计基础上,采用递归最小二乘方法得到短路电阻,通过外接电阻的串联电池组实验数据进行了性能验证,结果表明所提方法能对短路电阻实施精确估计。CHEN等提出了一种基于一阶等效电路模型的电池外短路故障诊断方法,通过比较实测端电压值与离线构建的外短路电池模型端电压值,若两者吻合良好,表明电池存在外短路故障。YANG等提出了一种基于分数阶模型的电池外短路故障诊断方法,通过与文献[37]方法的性能比较,结果表明基于分数阶模型的方法具有更高故障诊断精度;还通过建立随机森林模型,对外短路电池是否伴随漏液进行了诊断。FENG等提出了一种基于电池模型和参数/状态估计的电池短路诊断方法,基于实测电压和温度数据,识别出表征各单体过度容量损失的SOC值和异常产热的内阻,并基于电池组SOC和内阻信息,设计了不同失效层级的短路故障诊断策略,实验结果表明该方法能够准确估计短路电阻,并实现热失控的提前预警。
部分研究采用了基于非模型的电池短路故障诊断方法。KONG等提出了一种基于充电电压曲线变换的电池短路定量诊断方法,通过将电池充电曲线与基准曲线实施匹配,得到不同单体间剩余充电量的差异,进而获得各单体的漏电流与微短路电阻大小;利用外接短路电阻实验进行了性能验证,结果表明该方法在电池组出现老化以及不同充电模式下,均能较为精准估计出微短路电阻。XIA等提出了一种基于电压曲线相关性的电池短路故障诊断方法,采用递归移动窗口相关系数计算方法,实现了短路故障的在线检测,结果表明该方法对存在电池组SOC和SOH不一致性的情况,仍能对初始阶段的短路进行有效识别。
需要指出的是,针对电池内/外短路的故障诊断,现有研究还未能够有效地定位出短路发生位置,对如何区分内短路和外短路两类故障还有待进一步研究。对内短路和外短路,两者体现出一定程度相似的电压响应特性,但两者在产热特性会有明显差异,基于现有方法,结合精准的热模型,综合利用电压、温度响应信息,有望解决电池短路故障类型的精确识别。同时,需要在认识电池本体内短路的演化机制基础上,进一步提升微/内短路的识别精度和效率,实现提前预警,切实保障电池的高安全 运行。
3.3 热故障诊断
操作温度对电池性能影响显著,若电池处于高温操作,易引起可用容量的快速衰减;受限于现有热管理系统技术,往往难以保证电池组内各单体温度的均一化,其中的高温单体老化速率加快,会加剧不一致性。在极端情况下,高温操作会导致电池内部放热副反应加剧,显著影响电池使用寿命,甚至引起隔膜收缩坍塌,导致内短路,最终可能引发热失控,并伴随电池泄露、燃烧、爆炸、冒烟、胀气等现象发生。因此,在认清温度对电池性能影响规律基础上,发展高效的电池热故障诊断技术,对实现热失控提前预警有重要作用,以保证电池系统的高安全、长寿命运行。近年来,大容量电池单体在电动汽车和储能领域的应用越来越多,但是随着单体容量增大,电池实际运行过程中的内芯温度和表面温度差异也会增大,尤其对高倍率充放电过程,其内芯和表面的温度差异更为显著。一般地,对商用锂离子电池,受成本和技术限制,往往难以通过预埋热电偶等技术实现电池内芯温度的实时测量。因此,发展精确、可靠的电池内芯温度实时估计方法,对实现电池热故障的合理诊断有重要意义。
目前针对电池内芯温度估计方法开展的研究,前期主要面向圆柱形锂离子电池。LIN等在建立电池径向集总热模型基础上,采用了基于最小二乘法的模型参数辨识策略,实现了模型参数与内芯温度的在线估计;并在考虑内阻与温度影响关系基础上,还提出采用了一种融合非均匀遗忘因子的最小二乘法,以保证方法长期运行的可靠性。RICHARDSON等提出了一种基于电化学阻抗谱和表面温度测量数据的内芯温度估计方法,不依赖于电池热特性、产热速率和热边界条件等机理知识,具有计算效率高和鲁棒性强的特点,通过内置热电偶实验验证了该方法有效性。KIM等采用双卡尔曼滤波方法,基于表面温度、环境温度、电流和电压实测数据,可合理地估算出电池内芯温度和对流系数,并可得到在未知冷却条件下圆柱形电池的径向温度分布。基于圆柱形电池内芯温度估计,可实施不同类型的热故障诊断。DEY等在建立考虑内部导热的电-热耦合模型基础上,提出采用LUENBERGER观测器,实现了对流冷却内阻、内部热阻和热失控三类典型热故障的有效诊断。在此基础上,DEY等融入了内阻与温度的耦合关系,提出采用非线性观测器,并设计了考虑不确定性的自适应阈值设定策略,提升了所提方法的鲁棒性和适用性,通过商业锂离子电池试验,验证了热故障诊断方法的有效性。
近年来,由于大容量方形电池逐渐开始大量应用,在实际运行中其温度分布往往更不均匀,且内/外温差更大,亟需发展其内芯温度估计方法。与圆柱形锂离子电池研究类似,SUN等和ZHANG 等通过构建与文献相似的热模型,采用卡尔曼滤波方法,实现了方形电池内芯温度的在线估计。考虑到方形电池内部不同方向的导热系数差异与外部不同表面的散热系数差异,DAI等提出了一种基于等效电路模型与等效热阻网络模型相耦合的建模策略,结合自适应卡尔曼滤波,实现了内芯温度估计,并通过内置热电偶实验,验证了所提方法的有效性。但是,基于内芯温度估计的方形电池不同类型热故障诊断研究,未见相关报导,有待进一步研究。
需要指出的是,引发热故障的内在成因很多,既有电池本体的微/内短路形成、内阻过快增大、内部导热系数降低等故障引发,也有外部冷却系统故障引发。引发热故障后的外在表现为电池温度不正常升高,甚至触发热失控导致安全问题。因此,要实现合理的热故障诊断,需要对热故障引发机制有深入的认识,结合短路、一致性等其他类型故障诊断结果,并开发精准电-热模型和高效状态估计/故障诊断方法,有望实现热故障的提前预警和类型诊断,为电池高安全、长寿命运行提供保障。
3.4 传感器故障诊断
精确、可靠的电压、电流和温度实时测量数据是实现BMS中状态估计、充放电控制、均衡控制等功能的基础,若发生传感器故障,会影响BMS的正常工作,甚至发生失效,导致系统性能恶化,甚至引发安全问题。
目前,针对传感器故障诊断,大部分面向电流和电压传感器开展故障诊断研究。MARCICKI等提出采用非线性奇偶方程法构建诊断模型,通过结合滑模观测器与离线电池模型,实现了单体电流或电压传感器故障的检测与隔离。CHEN等提出了一种融合降阶LUENBERGER观测器和学习观测器的传感器故障诊断策略,可同时实现故障检测、分离与估计,通过三单体串联电池组仿真实验,验证了所提方法在电流传感器故障诊断的有效性。HE等提出了一种基于一阶等效电路模型与自适应扩展卡尔曼滤波的串联电池组故障诊断技术,将自适应卡尔曼滤波所得电压估计值与电压实测值对比,实现了电流和电压传感器故障的诊断。LIU等[66]提出一种基于二阶等效电路模型与扩展卡尔曼滤波的传感器故障诊断方法,利用估计电压与实测电压间的残差信息,采用统计推断方法,实现了对电流或电压传感器故障的诊断。在此基础上,为解决电池组内电流/电压传感器故障诊断计算复杂度高的难题,LIU等提出了对最高和最低电压两个单体进行实时诊断,而对其他单体进行长时间离线诊断的策略,通过串联电池组试验,验证了所提方法能对电池组中的电流、电压传感器故障实现快速定位。此外,针对电流、电压和温度三类传感器实施同时故障诊断,DEY等基于一阶等效电路—集总热耦合模型,采用滑模观测器技术,实现了电流、电压和温度传感器故障的同时检测、分离与估计,通过设定传感器偏置试验,对所提方法的有效性进行了验证。
需要指出的是,目前大部分研究仅针对单体的单个传感器故障诊断开展研究,对电池组/电池系统中大量传感器的故障诊断研究涉及较少,会大大增加计算复杂度,需要开发更加高效的传感器故障诊断策略。同时,根据传感器故障程度不同,可能出现传感器漂移、偏差、精度等级降低、完全失效等多种类型,发展传感器故障的定量评价技术意义重大。此外,由于电流、电压和温度三类传感器的信息会相互耦合,将增大同时诊断的难度,有待研究。
3.5 连接组件故障诊断
电池连接组件故障,如螺母、焊点松动会导致接触内阻增加,影响电池系统在高倍率下的功率性能,且会导致局部产热量增大,老化速率加快,会减少剩余使用寿命,并在极端情况下可能会引发热安全事故。
徐等提出了一种基于等效电路建模与参数估计的连接组件接触故障诊断方法,基于电流、电压实测数据实施模型内阻参数在线估计,结果表明对存在接触故障的单体,其内阻呈现出较大的波动,而对无接触故障的单体,其内阻变化较为平稳,但该方法未给出定量判定电池出现接触故障的指标。YAO等提出了采用信息熵分析方法,并系统比较了集成香农熵、局部香农熵和样本熵三种类型信息熵计算方式,可实现电池连接组件故障发生时间和位置的诊断,结果表明采用集成香农熵策略效果最优。电池内阻与接触内阻的增加均会导致电池功率性能的衰退,针对电池组功率失效的故障诊断问题,ZHENG等提出一种基于等效电路模型与香农熵的故障诊断方法,采用总体最小二乘法实现模型中内阻参数的在线估计,通过对三个月内阻数据的香农熵分析,表明所提方法可对电池内阻和接触内阻两类故障进行识别。
需要指出的是,现有大部分研究是基于电流和电压信息实现电池连接组件故障诊断,一般地,电池接触内阻的增加会增大局部产热,导致局部温度升高,利用温度信息,可能有助于提高连接组件故障的诊断效果。
3.6 多故障联合诊断
电池本体、电池管理系统、传感器、连接组件等均存在发生故障的隐患,而且多种故障可能会同时发生且相互耦合,会大大增加故障诊断难度。目前,大部分研究基本针对某种特定故障开发合适的故障诊断方法,还难以满足多类型故障的同时诊断需求,例如两个串联单体间发生连接故障,测量电压发生异常,前述单一故障诊断方法往往无法有效判别故障来源,即是否来自电池内部滥用或是电池连接故障,难以实现故障类型和位置的准确诊断。
KANG等提出了一种考虑接触电阻和电压传感器可靠性影响的交错连接电压测量方法,可适用于串联电池组的多故障在线诊断,结果表明可对电池系统中的连接组件故障、传感器故障和电池滥用故障实现有效诊断。针对带有冷却系统的电池系统,LIU等通过构建等效电路-热耦合模型,并提出了一种基于结构分析与序贯残差发生器的多故障诊断方法,可实现电流/电压/温度传感器故障、连接组件故障、冷却系统故障的检测与分离。刘文杰等提出了一种基于模糊数学和模糊诊断理论的电池故障诊断专家系统,可实现对内阻过大、电池开路、电池老化、电池连接不正常、电池容量偏小和电池充电不足6类故障的诊断。
需要指出的是,针对多种故障的诊断,无论是基于等效电路模型或电热耦合模型的模型化方法,还是基于专家系统的非模型化方法,目前均只能实现少量特定几种常见故障检测、分离与估计,针对不常见故障和未在知识库范围内的故障,各种方法的诊断效果仍需要进一步验证。
4 挑 战
针对锂离子电池系统的故障诊断,由于故障种类繁多,每种故障的引发机制类型各异,且各种故障相互耦合,即触发某种故障后可能会引发其他故障,经全面文献调研,相关研究主要存在如下挑战。
(1) 故障诊断系统的顶层设计
现有大部分研究仅针对特定应用场景、特定故障类型开展,在多故障联合诊断方法研究方面相对较少,并且在涉及大量单体串并联组成的模组或系统开展在线故障诊断时,计算量将急剧增大,现有方法能否满足实际应用需求,有待验证。因此,需要从系统工程的角度出发,加强对故障诊断系统整体框架设计研究,以提升对实际应用场景的适应性。一方面,需要在认清发生不同类型故障引发机制与危害基础上,实施分层分级,合理设置故障诊断顺序;另一方面,针对大规模电池系统,需要在单体、模组和系统三个层次,开展合理的简化策略研究,降低故障诊断方法的计算量,确保故障诊断系统的高效运行。
(2) 故障引发机制的深层次诊断
同种故障多引发原因、多种故障相互耦合是制约实施精准、可靠故障诊断的难题,现有大部分研究仅实施故障检测,对故障分离与故障程度估计研究相对较少,尤其缺乏对故障引发原因的相关诊断研究。因此,需要在认清各类故障引发机制与多种故障相互耦合关系的基础上,在一定程度上实现故障类型/引发原因的解耦后,一方面有助于从源头上采取相应防护措施,避免故障发生或对潜在故障实施提前防护;另一方面需要结合发展故障分离、故障程度评估方法,最终实现对故障引发机制的深层次诊断。
(3) 热失控的精准、提前预警
电池热失控因其破坏力大,是学术界和工业届持续关注的热点问题。由于热失控演化规律复杂,在其发生前隐蔽性强,如何实现热失控的精准、提前预警,挑战很大。因此,在认清热失控引发机制及演化规律基础上,尤其是针对机、电、热滥用情况,认清微/内短路的演化规律,开发在多种滥用情况下包含电、热、机械等多物理场耦合建模方法,实现不同热失控触发机制的特性模型,基此发展相应的热失控提前预警方法,以实现安全事故预防。
(4) 全生命周期内精准、可靠的故障诊断
在电池制造、成组筛选和使用各个阶段,诸多因素均可能引入电池系统故障隐患或引发故障;且在电池系统使用阶段,随着单体逐渐老化后,离散度逐渐增大,一致性逐渐变差,各种故障隐患也会明显增大。现有大部分研究提出的各类电池系统故障诊断方法,基本未在电池全生命周期内的故障诊断性能实施验证,实际效果及适应性有待进一步验证。因此,需要在电池使用阶段全生命周期内的故障诊断试验设计方法研究基础上,评价现有电池故障诊断方法的适用性和效果,并需要引入自适应学习机制,提高全生命周期内故障诊断方法的精准性和可 靠性。