首页 > 工信部电子五所罗道军:国产车规芯片应用可靠性面临的挑战与系统解决方案

工信部电子五所罗道军:国产车规芯片应用可靠性面临的挑战与系统解决方案

近年来,新一代汽车形成了电动化、智能化、网联化三条新供应链,带动主控芯片、存储芯片、通信与接口芯片、传感器芯片、功率芯片等汽车芯片快速发展。随之而来的是芯片单位价值提升,整车芯片总价值不断攀升。2024年11月14日,在第四届汽车芯片产业大会上,工信部电子五..

近年来,新一代汽车形成了电动化、智能化、网联化三条新供应链,带动主控芯片、存储芯片、通信与接口芯片、传感器芯片、功率芯片等汽车芯片快速发展。随之而来的是芯片单位价值提升,整车芯片总价值不断攀升。

2024年11月14日,在第四届汽车芯片产业大会上,工信部电子五所元器件与材料研究院高级副院长罗道军表示,为了确保供应链安全以及低成本的优势,芯片国产化已经是大势所趋。本土芯片产品的研制可靠性成熟度与国外品牌相比,在质量一致性、工艺稳定性、工艺适应性和可靠性方面仍然有较大差距,因此,大批量高可靠要求的汽车如果要导入国产化产品,必然面临较大风险。

他强调,国产车规芯片开发过程中,应按照车规芯片的标准进行设计生产制造,需要加强研制阶段的可靠性设计、验证、分析及管理工作,以保障芯片的固有可靠性;同时,应用方也应该严格按照车规标准开展芯片的认证选用,实现车规芯片产品的可靠应用。

罗道军 | 工信部电子五所元器件与材料研究院高级副院长

以下为演讲内容整理:

背景

当前,车规芯片产业链已经成为了现代汽车产业发展的重要一环。从整车到一级供应商、板机、到芯片,甚至芯片更上游,材料、基板等,都是服务于整车的要求,它的可靠性都源于最原始的整车的应用剖面和环境剖面。

图源:演讲嘉宾素材

环境剖上,汽车的应用场景极为丰富,环境条件也比较复杂。以往我们在开发普通电子产品时,主要关注室内环境或没有那么苛刻的适应环境,如手机等移动设备的使用环境,但汽车则大不相同,其应用场景极为宽泛,同时还需考虑车内不同部位的环境。在进行可靠性设计时,我们更应聚焦于芯片应用的微环境,即芯片所处的具体环境,而不仅仅是汽车整体的外部环境,不同位置对芯片的要求都是不同。除温度、湿度、振动外,特殊的环境、场景都会对芯片可靠性提出特殊的要求。

芯片产品在可靠性符合AEC-Q100系列标准的同时,研制质量管理需要符合 IATF16949标准,功能安全需要符合 ISO26262标准的要求,这三个标准是车规芯片必须达到的底线要求。

车规芯片可以分为0级、1级、2级到3级,各个等级在使用温度上存在差异,涵盖-40℃至150℃的范围。此外,这些等级的选用还与不同的应用位置、使用寿命、使用环境、失效率以及供货周期等有关。随着芯片使用量的增加,失效率也会相应上升,这会导致质量成本的提升。同时车规芯片研发周期十分长,一款进入国际通用汽车供应链的车规级芯片认证通常需要2-4年。

在当前技术背景下,一辆配置较高的汽车内包含上千个芯片已成为常态。这一现状孕育了巨大的发展机遇,尤其对于我国这样的新能源汽车大国而言。国内汽车行业的快速发展实际上是在一个不同的新赛道上取得了突破,打破了国际汽车行业原有的统治与领先地位。

2023年中国累计进口集成电路4795亿个,较2022年下降10.8%;进口金额3494亿美元,同比下降15.4%。中国本土芯片自给率约为23.3%-25.61%。2024年,中国本土芯片自给率有望提高到30%-35%。而目前汽车芯片自给率不足10%,是本土芯片发展的重要机遇,以及拥有较大的发展空间。

模拟芯片、功率器件和传感器是2024年中国本土芯片自给率提升的主力。本土汽车芯片制造大多采用的成熟制程工艺,采用先进制程工艺的产品主要为智能汽车主控类芯片且均在台湾地区和国外流片。此外,中国本土晶圆厂建设也如火如荼,2024年产能有望同比增加13%。成熟制程快速增长,但先进制程的规模量产短板在短时间内依然难以解决。

国产车规芯片应用面临的可靠性问题

鉴于当前国际环境的变化,国产芯片发展已成为大势所趋。部分原本依赖进口的芯片,未来可能面临供应链中断的风险,这凸显了供应链安全的重要性。但是,我国国产芯片的发展仍面临诸多挑战。总体而言,集中在以下几个方面:在质量一致性方面,国产芯片在连续供应多批次时,可能会突然出现各种问题。这反映出在工艺稳定性、适应性和可靠性方面,国产芯片与国际先进水平相比存在较大差距。特别是在大批量导入时,必须持谨慎态度。尽管如此,推动国产芯片的应用是必要之举,但需谨慎行事,并非因存在风险就放弃,而是应充分认识到其中蕴含的风险并采取积极的措施。

国产芯片的研制时间相对较短,基础相对薄弱,这是客观事实。根据我们统计的数据,国内真正大规模做汽车芯片也就这几年的事,缺乏实际应用经验和足够的市场考验。因此,许多关键技术细节和经验教训尚未被充分掌握。在实际应用中,即使某些芯片看似合格,但其可靠性仍需进一步验证。

可靠性主要由两大要素构成,一是固有可靠性,即元器件本身的可靠性,它需满足一定的基要求;二是使用可靠性,这关乎优秀的芯片能否得到恰当应用,包括其应用场景的选择、设计的保护电路以及各方面因素,同时也要求深入理解其应用场景以及可能面临的风险。因此应用端需确保应用可靠性的完善,研制方则需致力于提升固有可靠性,这涉及设计、材料、工艺、结构等方面。

根据我们单位截至2022年的近十年检验检测数据统计,国产集成电路产品质量不合格率达7.87%,其中存储器不合格率为3.9%。质量问题主要体现在:电性能、封装工艺、流片工艺、引线键合工艺、适装性等方面缺陷或不良。

图源:演讲嘉宾素材

存在大量的固有可靠性问题主要源自器件本身的制造工艺,这些潜在的缺陷在实验条件下有时难以被完全激发出来。即便执行了如ACQ100这样的严格测试,仍有可能无法完全暴露出所有的潜在故障。

此外,还有部分未经车规认证的芯片已被应用于汽车之中,这一现象尤其在疫情期间显得尤为突出。由于芯片供应短缺,价格上涨,一些厂商在面临缺芯困境时,不得不采取权宜之计,使用了未经认证的芯片进行生产。

我们调研了61家国内主流芯片公司,由于AEC-Q属于非强制认证,在200余款汽车芯片产品中,其中通过AEC-Q检测的产品有164款。尽管有些单位有认证流程,但这些认证往往并不全面,对标准的理解和应用之间存在着较大的解释空间。出于节省时间和成本的目的,一些制造商可能会选择简化认证流程。

按产品类型来看,计算类产品通过率最高,13项计算类产品中仅1项没有通过,同样通过率较高的还有安全类和电源类产品,而存储类、控制类、传感器以及通信类产品通过率较低,未达平均通过水平。

2023年,我们调研了22家企业,以第一款推出产品情况来看,多数企业集中在2016-2020的五年间,仅有2家企业的首款产品推出时间早于2010年,另外39家都在21年后才推出汽车芯片。

这意味着汽车芯片起步晚,处于后发地位,新手较多,这是好事,也是风险。大家都来做,意味着将来这个行业是欣欣向荣的,大家有机会。但也是因为新手多,锻炼空间较大,犯错的机会就比较多。此外,从企业营收来看,我国芯片企业仍处于发展期,体量普遍偏小,与国外巨头差距明显,同时缺乏可靠性工程经验和投入。

我们访问了众多单位,发现许多规模较小(四五十人至一百人左右)的设计公司纷纷涉足车规芯片领域。然而,时至今日,这些公司要么未能推出成熟产品,要么其迭代产品难以吸引投资。原因在于,投资方往往要求企业完成一定阶段的认证后,才会考虑投资,以确保项目的成熟度。因此,这类小型设计公司面临较大的挑战。此外,从工程质量的角度来看,可靠性专业人才稀缺,甚至一些公司缺乏专门的可靠性工程部门,这无疑增加了做好可靠性工作的难度。

在应用层面,即便提供了优质或合格的芯片,如果应用不当,同样可能引发问题。对于应用方而言,需要开展一系列工作来确保芯片的正确使用。这包括物料需求分析、选型、应用控制以及生产过程中的可靠性工程应用等。大型Tier1企业在这些方面通常表现出色,但小型企业或国产芯片用户在导入新产品时,可能因缺乏相关能力而面临挑战。以往,一些企业可能习惯于跟随行业头部企业的选择,以降低风险和成本。然而,在当前的市场环境下,这种做法已不再适用。

图源:演讲嘉宾素材

这是一款7815三段稳压器的国产替代案例。该替代产品的制造商仅进行了功能测试和板级功能测试,便认为可以替代进口产品。然而,在实际应用中,该替代产品的故障率却比进口产品高出很多甚至1000倍以上,导致产品下线急剧增加。

我们随后进行了一系列分析,发现该稳压器中的一个关键电容(C2位置)经常烧毁。分析发现,进口产品与国产产品在介质层厚度上存在显著差异。进口产品的介质层厚度为100纳米,而国产产品的介质层厚度仅为60纳米。

基于此,国产产品的静电击穿电压仅为3000伏,而现代SMT生产线上的静电电压很容易达到这一水平。相比之下,进口产品的静电击穿电压高达8000伏,因此更加稳定可靠。尽管所有测试指标在表面上看起来都是合格的,但介质层厚度的这一微小差异却在实际应用中导致了显著的可靠性差异。

因此,即便是性能参数看似相同的元器件,其可靠性也可能存在巨大差异。这也解释了为何在外观上相似,如我们常用的陶瓷电容,国际市场上仍由少数几家厂商主导,而国产产品尽管产量庞大,却难以打入高端市场。这主要归因于可靠性及失效率方面的差距。以华为采用国产某公司的MLCC为例,要求我们在进行大规模测试(每次超过1万片)时,发现任何一颗不合格都会导致整批产品停止使用。

此外,在电源模块领域,我们也遇到了诸多问题。尽管所有标准测试均已完成且未发现问题,但在实际应用场景中却频繁出现硫化现象。这主要是由于汽车尾气及周围环境中存在的硫化物,如二氧化硫、硫化氢等对模块内部的陶瓷电阻产生了影响。

电阻端电极中含有银元素,而银易与硫发生反应,导致硫化。这要求我们在选择器件时,必须评估其耐硫化能力,并在使用过程中采取相应的防护措施。然而,这涉及到复杂的应用能力问题。

实际上,众多案例揭示了产品在实际应用中的不足,主要体现在“不好用”、“用不好”以及“不敢用”三个方面。我们致力于解决“不好用”的问题,这主要涉及工艺和可靠性的提升;对于“用不好”,我们需增加产品信息量,即芯片厂商需向用户提供全面的应用需求支持,包括热设计、可靠性设计的数据以及失效模式分析,以便用户在设计阶段能够做出更合理的决策;而“不敢用”则源于应用履历的缺乏,用户因厂家此前没太多应用履历而持谨慎态度。因此,我们需要从较小的应用范围开始,通过不断迭代和适用,逐步积累经验,使产品逐渐成熟。

国产车规芯片应用可靠性系统解决方案

解决方案上,我们强调可靠性工作应从源头抓起,即在设计阶段就融入可靠性考虑,“产品的可靠性是设计进去、生产出来的,并且靠管理来维系”,而非仅仅依赖后端的测试和认证。如果设计本身就存在大量缺陷,那么后续的努力将难以弥补。因此,我们需按照车规的要求进行设计,包括满足特定的环境要求、可靠性要求以及寿命要求。同时,在制造过程中,我们也需遵循严格的制造可靠性管理要求。

图源:演讲嘉宾素材

其次,建立一个基准线是至关重要的,至少包括一些必要的产品认证。许多人误以为产品通过认证便无后顾之忧,实则不然,认证只是入门门槛,相当于60分的及格线。若连此标准都未达到,产品显然存在更多风险或质量问题。

此外,还需关注可靠应用方面。从车辆系统传递下来的可靠性要求,需经过半导体、芯片等各个层级进行验证。为此,我们现在有一套很好的系统工程可靠性设计工具,不仅涵盖可靠性,还涉及安全性、测试性等多个维度,以及环境适应性的要求。这些工具均基于相关的软件平台进行应用。

在进行设计、研发时,应以认证为基础,并严格按照相关要求进行。包括实施零缺陷管理,从设计过程到制造过程、生产流程,乃至整个体系,均需遵循16949等车规管理要求。车规生产线与普通生产线之间的差异,正是体现在这些细节上,包括车规级的流片、封装,以及后续的测试,均需严格按照车规要求进行。

此外,按照车规标准开展认证和选用工作也是至关重要的。这通常涉及到AECQ100和AQG324等认证体系。从AECQ100的验证要求来看,其完整性和系统性甚至超过了当前某些航天器件的认证标准。实际上,在一些大型工程项目中,如飞机、导弹、大型船舶等所使用的部分芯片,在功能安全性和可靠性完整性方面往往不如车规芯片。

对于非空封、非陶瓷封装或非金属封装的器件,至少需要选取6组器件进行实验。这6组实验涵盖了器件的各个方面,总计需要投入约3000多只芯片样品。在正常情况下,整个实验流程需要6个月的时间才能完成。即使通过增加试验夹具和并行实验来缩短时间,也至少需要4个月的时间才能确保所有流程得以完成。完成这一整套流程后,如果在中间阶段发现任何问题或缺陷,还需进行迭代改进,这也会延长整个流程的时间。

正常情况下,为了缩短验证周期,我们有时会在初步阶段对每个单项进行摸底测试。然而,即便采取这样的措施,最终的验证时间仍然需要大约一年左右。如果你想很快做完,和用户说这个芯片是去年研发的,很好用,没人敢信你。

关于应用可靠性的保障,关键在于风险的识别与验证,并据此采取针对性的措施,包括风险的识别、评估、验证以及测试结果的改善。我们需要明确固有可靠性与应用可靠性分别需要做哪些工作。如果是器件本身,我要做哪些工作?应用环节要做哪些?板级上和系统要做哪些?倒回来才能发现器件本身的故障或如何预防。

风险的识别始于需求分析阶段,需综合考虑器件的规格参数、设计评审结果以及历史上常见的故障模式,以识别出该类器件可能存在的问题。尤其对于从未接触过的新型器件,还需特别关注其自主可控水平以及供应链可靠性。

在验证阶段,我们需要对器件的结构、工艺、功能、性能、可靠性以及一致性进行全面评估,这涉及一套完善的评估流程。我们还需要将芯片安装到电路板上,这一过程可能会遇到工艺问题和兼容性问题。

从结构层面分析,可以观察到工艺缺陷或材料缺陷的存在。下图是FCBGA的一个图片,计算型芯片大多采用此类封装方式。通过结构分析,我们能够评估流片及封装的质量,并识别出芯片可能存在的风险,如金属化不良和裂纹等。这些潜在问题的识别其实并不复杂,通过结构分析技术即可有效发现。

图源 :演讲嘉宾素材

在试验证阶段,以汽车中广泛使用的MCU及功率器件为例,每个器件的评估和实验方案均基于其潜在的失效模式来制定,根据器件可能出现的故障模式,施加相应的应力以激发故障。如果在一定条件下无法激发故障,则认为该器件在此方面具备较好的可靠性。

当芯片被安装到电路板上后,它将在各种电路条件下运行,包括电气应力、静电应力以及浪涌等环境变化。这些应力在相互作用和迭加过程中,可能会导致难以预料的故障模式出现。为了应对这些潜在的故障模式,我们需要进行所谓的“白盒测试”。这种测试通常由电路设计人员进行,但他们的关注点往往在于电路设计的合理性,而非芯片本身。然而,在我们的测试中,我们将重点关注芯片在各种应力下的表现,通过加载各种应力来评估元器件的性能。

板级故障激发是一种有效的测试策略,用于提前揭示那些潜在且不易直接观察到的故障。通过采用特定的技术手段,我们能够将这些潜在故障提前暴露出来,包括电路的故障激发、器件的故障激发、板级连接的故障激发,以及装联和极限条件下的故障激发等。

作为应用方,我们更为关注的是用户在实际应用中可能会遇到的操作问题。我们需要建立一套完善的体系,涵盖物料的选择、评估和控制等多个环节。这一体系从问题的识别阶段开始,一直延伸至立项设计开发的全过程。在这一体系中,我们需要对芯片进行工艺上的认知、评审以及生产控制,确保每一步骤都遵循系统的工作流程,并始终以保障产品的可靠性为目标。

有了这套流程,无论是是从A厂家变到B厂家,从国外大牌换到国内民族品牌,怎么换核心都只是物料变更问题,不会有大问题,有这个流程可以降低成本,实现供应链更安全,有很多备选,可用的供应商更多,成本也会降下来。

典型案例分享

2021-2022年,受新冠疫情影响,全球芯片产业链长期处于“一芯难求”局面。一个汽车电子厂家需要紧急替代130多款元器件,所有替代料均是车规级器件,已通过AEC-Q相关标准认证。

然而,即便供应商为用户提供了相应的解决方案,用户仍对这样的操作持有疑虑,担心更换产品或部件会引发新的问题。尤其是对于那些规模庞大、市值较高的企业而言,一旦出现问题,其影响将十分严重。因此,用户委托我们为用户补充进行风险识别的工作,并制定相应的风险控制措施。

我们设计了一套风险控制方案和流程,主要关注结构、一致性和可靠性等敏感参数。在完成了这一流程后,我们发现,在所计划选用并测试的115款芯片及元器件中,有67个规格存在潜在风险。其中,95款产品成功通过了我们的验证,而20款产品则因存在重大缺陷而被拦截。这些缺陷涉及CPK值异常、焊接适装性问题以及封装工艺缺陷等多个方面。我们通过右侧的表格,清晰地告知用户哪些产品已经通过认证,哪些产品存在风险并需要进一步的工作。

图源:演讲嘉宾素材

我们在实验室中进行了时长为两千小时、一千小时的应力实验,但鉴于芯片在外厂的实际工作寿命可能长达15年甚至更久,实验室中的实验结果与实际使用情况的关联性有时会存在不足,无法直接对应。在国产化的评估过程中,我们利用柱状图展示了风险模式的高低分布情况,并列出了我们发现的典型潜在问题。

汽车行业的迅猛发展给芯片行业带来了前所未有的发展机遇。然而,导入新的芯片或元器件,会给汽车的可靠性带来诸多风险与挑战。针对汽车的全生命周期,构建一个可靠性保障体系对于车规芯片的可靠应用具有至关重要的作用,同时也对该行业的健康可持续发展具有深远影响。

汽车产品要求可靠性高环境适应性好,服役寿命长等特点,面对这样的行业应用我们不应追求短期的经济利益,而应着眼于长远,将基础工作做得扎实可靠,以确保我们的发展既稳健又可持续。有大厂在我们这里进行可靠性工作时,我们发现他们表现出了极高的认真态度和严谨精神,即便是最微小的问题也会进行深入探究,以最终确定改善方案。如果我们急于求成,往往难以实现快速发展目标,因为可靠性工作通常需要更多时间和耐心来验证和保证。

(以上内容来自工信部电子五所元器件与材料研究院高级副院长罗道军于2024年11月14日-15日在第四届汽车芯片产业大会发表的《国产车规芯片应用可靠性面临的挑战与系统解决方案》主题演讲。)

来源:盖世汽车