第二章— 第 B 节选择/开发试验程序
“如果理解和遵守技术的极限,则任何技术都可能是有用的。”28
有许多适当的程序可用于评估测量系统。选择使用哪些程序取决于许多因素,其中许多因素需要其于被评估的每个测量系统的个案来逐一确定。在某些情况下,为确定一个程序对一特定的测量系统是否合适,可能需要预先的试验。这种预先试验要上一章节讨论中的第一阶段试验的一个完整的部分。
当选择或开发一个评估程序时,一般要考虑的问题包括:
●试验中是否应使用诸如那些可追溯至 NIST 的标准?如果是,什么等级的标准是合适的?标准经常是评估一个测量系统的准确度所必要的。如果不使用标准,该测量系统的变差性仍有可能被评估,但不大可能按合理的可信度去评估该系统的准确度。缺乏这样的可信度可能是一个问题,例如,试图解决一个生产者的测量系统和一个顾客测量系统之间明显的差别;
●对于第 2 阶段持续的试验,应考虑使用盲测。盲测法是指在实际测量环境下,由一事先不知正在对该测量系统进行评估的操作者所获得的测量结果;通过适当的管理,根据得到的试验结果通常不受众所周知的霍桑效应所干扰;29
●试验成本;
●试验所需要的时间;
●任何没有被普遍接受的术语应被可操作的定义。这些术语如准确度、精确度、重复性和再现性等;
●是否由这个测量系统取得的测量结果要与另外一个测量系统得到的测量结果对比?如果对比,应考虑使用依赖于使用诸如前面第 1 阶段中所讨论的标准。如果不使用标准,仍有可能确定两个测量系统是否可以同时正常工作。然而,如果两个系统一起工作不正常,那么不用标准,就不可能确定哪个系统需要改进;
●第 2 阶段试验应每隔多久进行一次?这个问题可能基于个别测量系统的统计特性及其对设施后续结果来决定;以及以该设施进行制造过程,但事实由于一个测量系统没有正常工作而未受监控的制造过程顾客来决定。
除了这些一般性的问题外,正被试验的特殊测量系统的其它特定问题也可能是重要的。发现特殊测量系统的具体问题是第 1 阶段试验的两个重要目的之一。
28 爱德华 戴明,评价的逻辑,评价研究手册,第一卷,编者:Elmer L.Struening 和 Marcia Guttentag.
29”霍桑效应”是指 1924 年 11 月到 1932 年 8 月间,在西部电气公司的霍桑工厂(the Hawthone Works of Western Electric)完成的一系列工业试验的结果.在试验中,研究人员系统地变更了五个装配工的工作条件,并监视结果。由于条件的改善,产量上升,然而,当工作条件下降时,产量继续增长,这仅仅是因为这些工人是这项研究工作的一部分,由此而使他们产生了更积极的工作态度的结果,而不是改变了工作条件的结果。更详细的信息,参见由 Richard Gillespie 编写的〈〈霍桑实验史〉〉,剑桥大学出版社,纽约 1991。