近 10 年来,对汽车电子零部件的需求量呈爆炸式增长。 例如 2016 年,一辆顶配宾利需要 110 磅电缆线束与 90 台计算机进行连接。 到了 2020 年,消费者购买的大多数汽车都已满足了类似的布线和连接要求。 汽车行业是对前沿供应链技术依赖程度最低的行业之一,选择使用在传统节点上制造且可靠性得到验证的零部件。 大多数传统节点晶圆厂采用半自动到自动化生产方式,且已在过去 15 到 30 年间都在用这种方式进行生产。 尽管这种生产方式预计在未来 5 年内不会发生变化,但是推动使用 150mm 和 200mm 生产设施的这一决定的经济因素也在发生变化。 汽车电子委员会 (AEC) 和国际标准化组织 (ISO) 最近发布了关于提高安全性、可测性设计 (DFT) 和可制造性设计 (DFM) 的公告,其体现了 L4 级和 L5 级自动驾驶汽车、汽车原始设备制造商 (OEM) 和 1 级供应商兴起的必然性。 上述公告理所当然地加倍坚持了“零缺陷”的思维模式,以降低质量生产以外的成本。
现场退货剖析
国际汽车工作组 (IATF) 的标准在本质上要求我们努力实现零缺陷。 纵观目前的行业状况,数据表明汽车供应链的缺陷零部件数约为百万分之一 (PPM) 或以上。 在了解构成保修退货或零公里故障(图 2)的现场退货的情况时,现场预估表明,大约 25% 的故障来自前道晶圆厂。 在上述的数据中,出厂后的 50% 的故障均已接受了参数测试,但是依然无法检测到问题。 另有 30% 未接受测试,因此无法检测出故障。 另外 15% 为未定义项,也就是说我们无法找到故障的特定原因。 第三类本质上是未知项。 在上述这些情况下,无法部署真正的纠正措施,检测误差依然存在。 最后,业界人士对大约 5% 的故障根源是来自供应链内部的这个结论无法达成统一的意见。
供应链的疑难杂症
晶圆厂、封装和电气测试构成了当前的供应链,三者在评估时的作用相当于质量门禁,随着检测越来越细致,成本也会越来越高。
从晶圆厂角度来看,汽车零部件可分为以下几类:安全/高级驾驶辅助系统 (ADAS)、推进系统和信息娱乐系统。 首先,安全/ADAS 部分包括在较大节点上制造的传感器(微机电系统 [MEMS]、光学、温度),或专业晶圆厂(GaAs、GaN、SiGe 等)生产的射频 (RF) 组件,后者的生产自动化和可检测性低于平均水平。 第二,随着电动汽车 (EV) 的出现,带来了越来越多的产品需要推进系统,他们的工艺制程在 180nm 至 32nm 范围之间。 这个部分包含动力组件和发动机控制装置 (ECU)。 在某种程度上,上述零部件应被视为任务关键型组件,对可靠性的要求更高。 最后,信息娱乐系统无需相同水平的可靠性,在对最新、最大晶圆节点抽样时具有一定的灵活性。
鉴于汽车供应链中抽样的晶圆节点范围广泛,因此我们要遵守多种质量等级规定。 降低每个组件的成本以实现利润最大化,还意味着将可接受的质量水平降至最低可接受限度。 每一个检测步骤都不会为零部件增值,因此相应的成本会被进一步传递到下游。 这意味着,即使业内最好的晶圆厂也不提供 PPM 等级检测,亦不为批量生产的零部件考虑相应的检测。 随着使用较旧的节点或专业技术,这种情况会进一步恶化。
电气测试是检测零部件缺陷的最佳机会;这种测试需要对封装的零部件进行晶圆探针或终极自动测试设备 (ATE) 等测试。 理论上,如果零部件特征已被完整界定,并采用已知的低缺陷率技术生产,电气测试步骤中就可测出剩余的 PPM 等级故障。 表征的界定取决于: 1) 可模拟所有故障模式的设计失效模式及后果分析 (DFMEA); 2) 产品工程师可测试涵盖所有客户任务配置文件; 3) 随着零部件中软件组件数量的增加,确保始终保持数据保真度。
大多数零部件没有晶圆级可追溯性,这进一步降低了将故障与晶圆厂工艺关联的能力。 面对紧迫的客户时间表和成本压力,我们再次看到此阶段的可接受质量水平降至最低限度,因此出厂产品在电气测试时无法获得检测的全部益处。 这导致多数客户质量问题与测试问题相关,还会导致非质量成本的增加,进一步激励我们采用整体性方法处理进度和安全的问题。
拟定问题
如果我们考虑采取一种策略以更有针对性地实现零缺陷概念,那就必须改变当前的工厂运营方式。 大多数传统设施采用半自动或手动生产流程。 这意味着他们从根本上拥有大量的单点解决方案和准则来管理质量标准。 也就是说,他们既没有捕获有效流程管理所需的所有数据,也无
法以快速有效的反馈方式分析这些数据。 根据现场退货和内部故障,我们已经能够了解这个策略对我们有多大作用。 如果不完全重新考虑流程,我们不太可能稳定地突破 1PPM 障碍。
换句话说,我们无法扩展检测范围,加上无法确保我们的测试覆盖率;更甚者,我们有太多的案例无法完全确定根本原因。 所有这些问题都源于对质量管理采用了拼凑的方法以及对无法统筹质量数据的管理。 采用一套整体化方法就可以简化信息共享,并促进一次性正确决策(图 3)。 那为什么各个系统还未采用整体化的方法呢?
采纳必要更改
单点解决方案的根本缺陷在于,它们无法解决在晶圆厂层面观察到的、具有挑战性的问题,包括封装和表面贴装线。 这个问题的解决方案必须采用整体化的方法。 在这种情况下,整体化的方法是指洞察整条生产线的能力。 在单一生产设施之外,整体化的方法还意味着将整个供应链作为一个实体。 此外,我们必须引入新的信号检测准则才 可成功管理图表缩放。 当控制图根据已知参数完成了正确的设置,它就可以相应地检测到各种异常;如今许多系统都基于此类理念而开发。 尽管这在原则上是正确的,但在一个只有骨干人员的生产设施中管理 100,000 张图表,这样的工作量令人生畏。 无论控制措施和规格限制如何,每个测量值都被赋予与设备整体质量相关的含义。 换言之,它是审查总体变异对零部件性能和可靠性影响的能力。 该方法目前未在行业中实施。
实施和培训的成本
半导体晶圆厂适应新自动化解决方案的速度始终伴随有各种问题,进而阻碍了晶圆厂快速改变质量生产的能力。 如今的多数自动化系统基本上仍然沿用过去 20 年所见的相同范式构建 – 由 Western Electric 规则驱动的图表和基于错误图表的失控行动计划 (OCAP)。 当行业采用简化的自动化解决方案时,传统制造设施早已摊销了其建筑成本和折旧制度,仅靠运营要素来维持业务的营运。 这种情况就导致可以投入新开发的资源少之又少,原因是这些工厂的盈利能力无法支持解决任何单一问题所需的投资。
整体自动化解决方案解决系统性问题,而非单一差距的问题。 各家工厂的设施不同,50 万美元很有可能代表着 0.5% 的利润,这会大量侵蚀薄弱的利润。 此外,投资回报要么太小,不足以证明冒风险的合理性,要么需要很长时间才能实现。 单点解决方案投资范围则为 15 万美元至 75 万美元,这是难以突破的障碍。 了解它们的要求、所处领域的复杂性以及支持它所需的信息技术 (IT) 基础设施需要大量的投资。 定义和测试那些“可取代大量当前自动化举措的”破坏性系统需要大量成本。 除非解决方案能够为质量生产提供系统性解决方案(即实现多个高价值目标),否则无法对这些设施进行投资。 这些范式需要跨越整个供应链。
这些工厂中多数人的工作重点并非开发新的自动化解决方案,而是以具有成本效益的方式生产可靠的零部件。 因此,通过技术构建整体化和简化的质量体系等相关的期望在这些工厂中并不现实。 这将需要改变财务和生产制造的思维方式。 强大的整体化质量计划需要针对操作人员建立自动化和学习系统。 尽管有很多机会可以将过去的手动任务和决策自动化,但是人们对理解信号和质量指标的含义的期望仍然很高。
走向零缺陷
传统工厂必定存在不同程度的自动化需求。 自动数据采集是很好的起点,然后在集中警报管理系统中连接信号,并防止将材料移动到不应运行产品的工艺设备中。 加工过程中,减少人为失误的需求也很明显。 配方管理系统与集中配置管理系统一样发挥着关键作用。 自动化层到位后,扩展能力得以增强。 例如,当晶圆厂通过统计制程控制 (SPC) 方法访问原始晶圆测量数据,工程人员就可以将其用于隔离晶圆内的变化问题。 新产品认证非常耗时,生产准备过程可能很慢,并且可能无法确定所需的测试类型。 对生产设施中变异来源了解得越多,快速验证新产品的机会就越多。 这个理论将直接影响测试覆盖率差距,使 30% 的现场故障持续存在。
将这些传统的良好标准转为整体化的方法,需要部分集成基础设施。 第一步是定义在此情况下的“整体”的意义。 整体是理解制程步骤相互依赖行为的能力。 控制计划说明了与任何产品相关的已知测量值。 自动化系统将需要为用户提供“定义不同制程步骤相互依赖关系”的能力,如控制计划和制程故障模式和影响分析 (FMEA) 中所述。 在运行时,系统将使用控制计划中定义的、来自多个制程步骤的数据,并概述哪些数据与我们预期的 特定制程中不相符。 这需要通过实时数据工具完成,原因是单个决策中,每位用户需要通过 12 至 20 个站点访问 15 个参数。 每个站点都需要通过各自的统计数据进行细分,以揭示晶圆内的差异概况、同一制程中晶圆间的差异,以及来自上游步骤中的差异。 这个方法将减少最终测试前的变化,减少故障零部件出厂的机会。 最重要的是这个方法为最终测试带来了有效性的变化。 更严格的变异验证,将更有效地捕获更大程度的不合格。
另一个关键区别是,整体化系统不仅是根据错误驱动的,而且对规格限制内的变化也很敏感。 数据表明,这种情况发生在良率 88% 到 92% 的工厂中。 前道晶圆厂与封装操作相结合,故障率约为 0.76PPM。 符合规格限制的设备最终将可以运作,但性能或寿命各异。 晶须和桥接等制程问题将避开上述众多测试,从而导致在现场发生短路的故障。 因此,自动化系统可以让用户叠加各个生产步骤的定性,以此来度量特定质量问题的可接
受范围。
确实,其他因素对整体故障率有一定影响,包括可能在整个供应链多处发生的静电损坏和其他形式错误处理。 因此,突出的质量问题需要进行快速的谱系分析,其中包括设计问题。 比如已经生产和使用了很长时间的零部件,在超出了最初设计的范围下被使用。 这对现场故障构成了大约 0.15PPM 的贡献。 “未知”的案例代表了大约 0.21PPM 的故障贡献,并且是供应商的主要责任。 在无法确定原因的情况下,小型供应商将承担故障责任,并将从与大型汽车制造商的协议中扣除成本。 如果这种能力可以自动化跨越前道和后道,并最终纳入表面贴装技术 (SMT) 生产线,那么就能为任何特定设备和原因快速识别问题。 在这种情况下,解决速度将影响责任成本,更重要的是影响安全性。 除非新自动化系统的设计采用这些指导原则,否则任何供应链都将无法有效地趋向零缺陷(图 4)。
原始设备供应商协会
Automotive defect recall report2019