Как SPC?

(авторы: Британская Ассоциация Деминга, перевод: Светлана Ильина и Георгий Лейбович, редакция Рубаник Ю.Т.)


Предисловие

Как SPC? дает полную и подробную вводную информацию о практических аспектах построения и использования контрольных карт. Но выражение «практические аспекты» не предполагает некоего лишенного осмысленности перечня инструкций. Правильный подход к контрольным картам требует знания ответов на множество Почему?, а не просто Как?. Как можно было бы предположить из заглавия, назначение "Как SPC?" - быть продолжением ранее выпущенной брошюры Почему SPC?,[1] и читателям рекомендуется перейти к нынешней брошюре только после изучения предыдущей. Тем не менее, первый раздел брошюры Как SPC? вводит некоторые концепции предыдущей брошюры, хотя и с совершенно других позиций. В частности, в ходе изучения многочисленных примеров становится ясно, почему интерпретации данных и принятые соответствующие действия по улучшению сильно различаются в зависимости от того, являются ли процессы статистически управляемыми или нет. Основная цель контрольных карт состоит в том, чтобы помогать нам решать, которая из этих двух ситуаций имеет место, и таким образом направлять нас в наших усилиях по совершенствованию.

Хотя настоящая брошюра стремится раскрыть тайны, окружающие понятие «стандартного отклонения» (обычно представляемого греческой буквой , в произношении «сигма»), читатели, знакомые с SPC из других источников, могут быть удивлены, если не обнаружат здесь некоторой другой математически-статистической жвачки (как, например, упоминаемой в самом последнем абзаце основного текста). И причина не в том, что такие вопросы слишком «трудны» для нашей брошюры. Истинная причина состоит в том, как поясняют и Уолтер Шухарт, и д-р Деминг, что они «вводят в заблуждение и срывают эффективное изучение и применение контрольных карт».* А поскольку Шухарт был родоначальником данного вопроса, а д-р Деминг несомненно являлся его самым блестящим учеником, то уж они-то знают!

 


 

Содержание

Почему SPC?

Некоторые базовые расчёты

Контрольные границы Шухарта

контрольная карта

Х - Карта

Альтернативные данные

Заключительные замечания

Приложение 1: Переводные коэффициенты и Контрольные границы

Приложение 2: Карта принятия решения для выбора типа контрольной карты

Ссылки


Почему SPC?

Карта временной последовательности – это график, отображающий численные значения некоторой измеряемой величины, зарегистрированные последовательно за какой-то отрезок времени. На карте время течет слева направо, а численные значения измеряемой величины отмечаются на вертикальной оси.*

На Рисунке 1 показаны шесть временных последовательностей. Поразмышляйте над этими изображениями в течение некоторого времени (обращая внимание на то, как они выглядят, а не на детали, нанесенные на их вертикальные оси). Итак, какие выводы вы смогли сделать относительно этих шести процессов, представленных в виде карт?

Рисунок 1. Шесть карт временных последовательностей (Устойчивые процессы)

 

Скорей всего, не так уж много! Карты, представленные на Рисунке 1, выглядят довольно скучно. Конечно же, каждая из них проявляет некоторую вариабельность (в противном случае, у нас просто были бы горизонтальные линии) и отличается тонкими деталями, но их общий характер почти один и тот же. Может быть, одна или две из них кажутся несколько более сглаженными, чем другие, а в остальном нет никаких особенностей, которые стоило бы обсуждать. Действительно, не только поведение каждого отдельного графика выглядит довольно похожим на поведение всех других, но и общее поведение каждого из них, вероятно, со временем не меняется. Возможно, если бы я не проставил на картах вертикальные шкалы, то вы могли бы даже заподозрить, что все шесть карт относятся к одному процессу.

Если бы я попросил вас предсказать поведение этих процессов в будущем (что, как я считаю, и неправильно, и весьма опасно, если вы ничего не знаете о сущности этих процессов), то можно предположить, что ваш ответ был бы практически одинаков в каждом из этих шести случаев. Если бы вы отважились на рискованную оценку, то, вероятно, заложили бы некоторый умеренный запас надёжности отражающих возможность появления более высоких и более низкий значений, и предположили, что дальнейшие наблюдения, как и текущие данные, скорей всего будут все (или почти все) находиться между этими двумя границами, и при этом будут отсутствовать какие-либо заметные паттерны или тренды. Если вы человек достаточно умудренный, то, вероятно, уточнили бы ваш прогноз чем-то вроде «если обстоятельства не изменятся» или «если не случится чего-то, что спутает все карты»! На Рисунке 2 представлены временные карты из Рисунка 1 с такими нанесенными границами. Принято также проводить «центральную линию» (на каждом графике на Рисунке 2 она показана пунктиром), представляющую собой среднюю величину численных значений, на основе которых были рассчитаны эти границы. При условии, что эти границы рассчитываются по имеющимся данным в соответствии с методами, которые будут описаны позднее, карты на Рисунке 2 будут называться контрольными картами, а границы будут называться контрольными границами. На самом деле оказывается, что эти численные значения просто произвольно изменяются в пределах ограниченных контрольными границами. Такие процессы называют устойчивыми или статистически управляемыми, или проявляющими контролируемую вариабельность.


Рисунок 2. Шесть контрольных карт (Устойчивые процессы)

 

Но если бы вместо этого мы сталкивались с картами временных последовательностей, представленных на Рисунке 3, а не с такими, как на Рисунке 1, то думаю, что даже самый амбициозный прогнозист пришел бы в полное замешательство. Нет сомнения, что карты на Рисунке 3 более «интересны», но именно сам факт их интересности обычно и вызывает проблемы. Мы только что смогли высказать некоторые вполне разумные прогнозы относительно процессов на Рисунке 1.

Но вряд ли кто-то смог бы даже начать высказывать предположения о том, что будет происходить в будущем с процессами на Рисунке 3. Процессы на Рисунке 3 называют неустойчивыми или статистически неуправляемыми, или проявляющими неконтролируемую вариабельность.

Рисунок 3. Шесть карт временных последовательностей
(Неустойчивые процессы)

Если приведенные на этих картах данные окажутся величинами, представляющими интерес для нашего бизнеса, имеют ли они дело с производственными, административными, управленческими, финансовыми, социальными процессами, или процессами сферы обслуживания, то наблюдаемые нами сходства или различия представляют не только академический интерес. Предположим для простоты, что наносимая на карту величина является долей дефектной продукции, административных ошибок или выписанных в больнице ошибочных рецептов, регистрируемых ежедневно или ежечасно (или по какой-то другой подходящей временной шкале). В случае устойчивых процессов на Рисунке 1 мы способны предсказать масштаб этих проблем, с высокой степенью уверенности в том, что наши прогнозы останутся в силе в будущем (предполагая, что рассматриваемый процесс по важным параметрам не будет существенно меняться на протяжении будущего рассматриваемого периода времени). Тогда мы в состоянии предсказать ущерб и потери возникающие в результате этих ошибок, оценить желательность введения некоего механизма контроля или инспектирования, вынести решение относительно приоритетов в попытках улучшить процесс, чтобы избежать подобных проблем в первую очередь, и т.д. Далее, в силу одинаковости поведения подобных устойчивых процессов во времени, для таких прогнозов и оценок могут и должны использоваться все данные, от начала и до конца любой рассматриваемой нами карты. Попытки выполнить подобные предсказания на основе лишь, скажем, одной или двух точек данных вместо использования намного более полной имеющейся информации, несомненно, являются пустой тратой времени и обязательно будут вводит в заблуждение. Вероятно, мы также могли бы давать прогнозы относительно воздействия потенциальных изменений на рассматриваемые процессы. Конечно же, эти карты действительно могут быть «скучными»,* но статистически управляемые процессы безусловно привлекательны с практической точки зрения. На устойчивом процессе мы можем строить бизнес. В противоположность этому, в работе с неустойчивым процессом можно строить лишь догадки.

Хотя карты на Рисунке 1 (а также на Рисунке 2) в высшей степени похожи, на самом деле, они представляют широкий спектр разных процессов. Для простоты сравнения, каждая отображает данные для одинакового количества временных точек. Рисунок 1(a) представляет сумму точек на верхних гранях четырёх игральных костей, брошенных 24 раза. Рисунок l(b) показывает количество «орлов», выпавших при бросании 25 монеток, снова за 24 раза.

На Рисуноке 1(c) приводятся результаты эксперимента с красными бусинами,* проведенного в ходе публичного семинара в БАД в Grosvenor Hotel, Лондон, 10 июня 1992 года.

Рисунок 1(d) показывает частоту моего пульса, измеряемого непосредственно перед завтраком за последние 24 дня октября 1991 года. Рисунок 1(e) показывает суммарные длины фиксатора контактных гнезд розеток для зажигалки в первых 24-х подгруппах, зарегистрированных в A Japanese Control Chart [3]. А Рисунок 1(f) представляет собой карту месячных значений дефицита торгового баланса США (в миллиардах долларов) за 1988-й и 1989-й годы. Ничего себе выборка процессов! И они были подобраны таким образом намеренно.

Выражение «меняющийся случайным образом» сразу приходит на ум, когда мы думаем о бросании костей или монет. На самом деле, «случайная вариабельность», как она понимается и используется специалистами по математической статистике, является идеалом, который редко (если вообще) достижим на практике. Тем не менее, карты временных последовательностей на Рисунке 1 (или соответствующие им контрольные карты на Рисунке 2) неотличимы от того, что могла бы дать истинная случайная вариабельность – но это не относится к картам на Рисунке 3. Кстати, стоит отметить, что даже высказанные нами ранее предположения о сглаженности, в частности на Рисунке 1(c), вполне могли бы быть необоснованными – разве что у кого-то имеются оригинальные интерпретации того, что происходит в эксперименте с красными бусинами!

Из этого нужно извлечь важный урок. Наверняка все согласятся, что при бросании костей или монет бессмысленно пытаться объяснять мельчайшие подробности полученных результатов. Ну и что, если время от времени значительно чаще обычного на монете выпадают «орлы» или получается необычно малый счет при игре в кости? Конечно же, мы согласны: это просто элемент случайности – в этом нет ничего «особенного». Тем не менее, если уж мы признали, что не можем обнаружить различие в статистическом поведении какого-либо из шести приведённых процессов, то почему же тогда будет более обоснованно пытаться объяснить мельчайшие подробности любого из них в дальнейшем?

Нельзя сказать, что у нас нет на то оснований; они есть. Если бы мы очень постарались, то возможно, смогли бы объяснить конкретное количество выпавших на монете «орлов» тем, каким образом мы монеты подбрасывали: быстроту воздействия нашего пальца на монету, щелкнули ли мы ее прямо вверх или под углом, была или нет на столе скатерть, влияние сопротивления воздуха и т.д. и т.п. Да, у результатов устойчивого процесса есть причины. Их называют общими причинами, потому что эти причины влияют на все полученные результаты. Общие причины постоянно составляют неотъемлемую часть устойчивого процесса. Поэтому мы, вероятно, сможем чему-то научиться, если будем изучать всю имеющуюся в нашем распоряжении информацию. Но из каких-либо отдельных результатов нельзя узнать ничего, заслуживающего особого внимания.

И это справедливо для всех устойчивых процессов – не только для подбрасывания монет или игры в кости, но также и для всех других процессов, приведенных нами в качестве примера. Почему же тогда между ними должна быть какая-то разница? Ведь мы уже согласились, что их статистические свойства неотличимы друг от друга. Итак, снова повторим: пока процесс остается устойчивым, нельзя получить какую-либо ценную информацию из случайно высокой или низкой частоты пульса, или высоких или низких показателей торгового дефицита. Также ничего стоящего нельзя извлечь из того факта, что сегодняшние цифры выше, чем вчерашние; или что показатели текущего месяца ниже, чем показатели прошлого месяца. За исключением случайно повторившегося значения текущие цифры должны быть выше или ниже предыдущих! Ну и что из этого следует? В бесчисленном количестве организаций тратится огромное количество времени и денег в попытках объяснить месячные или даже недельные различия в разного рода счетах, продажах, выпуске продукции и эффективности функционирования, тогда как на самом деле эта вариабельность обусловлена главным образом общими причинами!*

А теперь давайте вернемся к Рисунку 3 – к картам с «интересными» чертами, явными изменениями в поведении. Изменения в поведении, будь они временные или устойчивые, не могут происходить совсем беспричинно: они тоже вызываются причинами. И такие причины должны отличаться от обсуждавшихся выше общих причин. Потому что общие причины не вызывают изменений в поведении: они вызывают постоянное схожее поведение. Причины изменившегося поведения (что делает карты на Рисунке 3 «интересными»), будь то изменения временные или более устойчивые, называются особыми причинами. Изменения в поведении на этих картах заслуживают объяснения: сделать это имеет смысл.

На ранних этапах своей работы с японцами (начало 1950-х годов) д-р Деминг выработал некоторые очень полезные определения контролируемой и неконтролируемой вариабельности, которые четко и ясно выразили то понимание, к которому мы только что пришли. Вот они:

Контролируемая вариабельность: Если вариабельность контролируемая, то попытки определить причину отдельных отклонений не принесут пользы.

Неконтролируемая вариабельность: Будет полезно попытаться определить и устранить причину неконтролируемой вариабельности.

Поэтому различие между устойчивыми процессами (статистически управляемыми) и неустойчивыми процессами (статистически неуправляемыми) является исключительно практическим различием. Если мы ищем причину какой-либо конкретной детали, замеченной нами в данных, то есть ли вероятность того, что мы обнаружим что-нибудь полезное, или же мы просто отправляемся в погоню за недостижимым (см., например, опасность вмешательства,* обычной характерной черты неправильного управления процессами)?

Это, несомненно, является ключевым вопросом, если мы стараемся улучшить эффективность работы наших процессов – что, предположительно, нам и требуется делать в эти как никогда сложные и конкурентные времена. Должны ли мы с усердием приниматься за улучшение процесса в целом, используя всю имеющуюся в нашем распоряжении информацию (т.е., заниматься общими причинами вариабельности), или же нам следует уделить время изучению возможных особых причин изменений поведения в ходе процесса? Как показано в Почему SPC?,1 неверный выбор может не только не улучшить состояние дел: скорей всего, он сделает ситуацию еще хуже.

Ответ на вопрос, являются ли процессы на Рисунках 1 и 3 статистически управляемыми или нет, достаточно очевиден, если просто посмотреть на карты временных последовательностей. Однако, это не всегда так. А как нам отвечать на этот вопрос в других, «промежуточных» случаях?

Основная часть всего этого подхода, а также специальный инструмент контрольных карт, были разработаны доктором Уолтером Шухартом (Walter A Shewhart) в 1920-х годах.* Мы уже указывали, что существует некое конкретное правило того, как следует рассчитывать контрольные границы, показанные на Рисунке 2. Всем деталям этого мы обязаны Шухарту. Но указания Шухарта не только помогают нам определить соответствующие контрольные границы для прогнозирования будущего поведения устойчивых процессов: они, фактически, дают нам мощное оружие двойного назначения. Кроме обеспечения нас границами для устойчивых процессов, те же самые вычисления дают диагностику нестабильности в неуправляемых процессах и, зачастую, средство её преодоления.

Рисунок 4 показывает контрольные границы, полученные на основе нанесенных на Рисунке 3 данных, используя в точности те же вычислительные методики, на основе которых были получены контрольные границы на Рисунке 2 из данных, нанесенных на Рисунке 1. Обратите внимание, что в каждом из случаев одна или более точек лежат теперь вне контрольных границ. В подобных ситуациях Шухарт советует нам искать особые причины такого необычного поведения.

Рисунок 4. Шесть контрольных карт (неустойчивые процессы)

 

Источники данных на Рисунке 3 фактически те же самые, что и на Рисунке 1, необходимо только учитывать, что они были зарегистрированы в более поздний период, когда проводились основные изменения, то есть, действительно существовали особые причины. Что касается процессов (a), (b), и (c), я вам могу рассказать, какими были особые причины, потому что я их ввел намеренно! Для Рисунка 3(a) я использовал в первых шести бросках те же четыре игральные кости, что и прежде, но в следующих шести бросках я использовал только две игральные кости, а во всех остальных я использовал шесть игральных костей. На Рисунке 3(b), начиная с 15-й точки, я увеличивал количество монет на 2 каждый раз, имея в конце этой карты 45 монет вместо 25. На Рис. 3(c), который был получен в ходе эксперимента с красными бусинами, проведенного в конце того же месяца (в Park Lane Колледже, в г. Лидз, 26 июня 1992 года), я симулировал ситуацию, при которой на последней неделе (последние шесть точек) главный контролер начал бы суммировать подсчёты своих двух младших контролеров, вместо того, чтобы регистрировать их единый согласованный подсчёт красных бусин.

Я не оказывал такого прямого влияния на три другие процесса; тем не менее, полагаю, что могу предположить нечто относящееся к делу по поводу (особых) причин изменений в поведении. Рисунок 3(d) показывает частоту моего пульса во время завтрака за последние 24 дня ноября 1991-го года. В начале того месяца я стал лечиться у другого доктора. 26-го ноября мой новый доктор прописал мне курс атенолола для снижения артериального давления. Теперь вам все понятно? Рисунок 3(e) получен на основе вторых 24-х подгрупп из A Japanese Control Chart. Если вы сверитесь с деталями этого исследования, то увидите, что увеличение длины оказалось обусловленным истиранием корректирующей манжеты; сразу же, как только было зарегистрировано очень высокое значение, были приняты меры для исправления ситуации. И наконец, Рисунок 3(f) представляет помесячные величины дефицита торгового баланса США за 1990-й и 1991-й годы. Имеется некоторое указание на то, что должно было произойти некое обнадеживающее снижение дефицита на протяжении зимы 1990-91-го года. Но, к сожалению, оно оказалось кратковременным и, вероятнее всего, являлось следствием развивающейся рецессии, а не признаком какого-то реального улучшения.

Отметим, что, как это обычно происходит, на Рисунке 4 одна или более точек выходят за контрольные границы или (i) почти сразу после того, как происходит резкое изменение в процессе, или же (ii) после возникновения некоторого кумулятивного эффекта при более постепенном изменении.

Я выбрал именно такой набор процессов из-за их очень переменчивой природы, а также потому, что они достаточно хорошо иллюстрируют основные понятия устойчивости и неустойчивости. Вы, вероятно, будете применять эти идеи в основном к процессам, в которых вы принимаете участие у себя на работе, к процессам, которые вам, возможно, захочется помочь улучшить. Стоит еще раз напомнить основные советы, которые дает Шухарт в этой связи. Если контрольная карта показывает, что процесс устойчив, то усилия по улучшению следует направлять на процесс в целом, используя информацию за относительно длительный период времени. Пусть вас не сбивают с толку краткосрочные данные или, что еще хуже, единичные точки. Если процесс неустойчив, то первоначальные усилия по улучшению требуется направлять на попытки идентифицировать и устранить или невелировать влияния особых причин неустойчивости; в этом случае оправданно и действительно необходимо исследовать в данных краткосрочные влияния, особенно руководствуясь точками, выходящими за пределы контрольных границ.

Остальная часть настоящей брошюры посвящена проработке специальных деталей контрольных границ по Шухарту, включая не только понимание того, как они рассчитываются, но и того, почему они рассчитываются таким образом.

 

Некоторые базовые расчёты

В этом разделе мы описываем и иллюстрируем на примерах некоторые арифметические понятия и вычисления, знакомство с которыми будет подразумеваться в дальнейшем в данной брошюре.

Предположим, что у нас есть небольшой набор данных, состоящий, например, из пяти наблюдений:

1.4    1.2    2.1    1.8    1.2

(Безусловно, нет никаких причин для того, чтобы два разных наблюдения не дали одинакового значения, как это здесь произошло с 1.2.) Чтобы начать знакомить вас с некоторой терминологией, используемой в дальнейшем, давайте будем называть такой небольшой набор данных подгруппой. Отдельные наблюдения часто обозначаются буквой X, а количество этих X в подгруппе обозначается через n; поэтому в данном случае n = 5.

Мы часто говорим о средних величинах. Самое распространенное название для «средних» - это среднее значение или среднее арифметическое (если давать полное название). Будем обозначать среднее значение некоторого набора Х-ов через . – это то, что мы получаем сложением всех n отдельных наблюдений X-ов в данной подгруппе и затем делением полученной суммы на n. Числа в нашей подгруппе дают следующее:

= (1.4 + 1.2 + 2.1 + 1.8 + 1.2) / 5 = 7.7 / 5 = 1.54

Кроме регистрации среднего значения по подгруппе, нас обычно также интересует степень вариабельности в данной подгруппе. Предпочитаемая специалистом-статистиком характеристика вариабельности в таком наборе данных большинству обычных смертных может показаться слишком мудреной – и не без оснований! (Если бы историю статистики можно было переписать, то возможно, был бы сделан более удобный выбор). Пользователь контрольных карт может обходить некоторые вызываемые ею сложности, хотя полностью их избежать он не сможет.

Такая достаточно сложная характеристика вариабельности называется стандартным отклонением, и обычно обозначается греческой буквой (произносится «сигма»). В частности, если (как в данном случае) мы ссылаемся на стандартное отклонение некоторых наблюдений, обозначенных через X, то мы будем писать . (Если очевидно, на какой набор наблюдений мы ссылаемся, то можно просто написать . Однако, включение подстрочного индекса предотвращает возможную неоднозначность, поэтому в большинстве случаев мы будем пользоваться этим принятым обозначением).

Грубо говоря, представляет собой типичное отклонение значений X-ов в данной подгруппе от их среднего арифметического, . Конечно же, это вполне разумный подход к измерению вариабельности в конкретной подгруппе. К сожалению, специалисты-статистики обычно не берутся за этот «вполне разумный подход» «вполне разумным образом», который несомненно состоял бы в следующем. В нашей группе из пяти наблюдений (для которой, как мы помним, = 1.54), отклонения пяти X-ов от таковы:

1.54 - 1.4 = 0.14,  1.54 - 1.2 = 0.34,  2.1 - 1.54 = 0.56,  1.8 - 1.54 = 0.26,  1.54 - 1.2 = 0.34

Конечно, очевидным действием будет сложить эти пять отклонений и затем разделить на 5, то есть, определить среднее отклонение. Это дает:

(0.14 + 0.34 + 0.56 + 0.26 + 0.34) / 5 = 1.64 / 5 = 0.328

Хотя эта характеристика вариабельности признается в литературе (для нее есть даже специальный термин: Среднее Абсолютное Отклонение, the Mean Absolute Deviation, или сокращенно MAD!), но эксперты ею пользуются редко. Вместо этого, они возводят отклонения в квадрат, суммируют получившиеся числа, делят либо на n, либо на n-1, и затем из получившегося результата извлекают квадратный корень! Это и есть стандартное отклонение, .

Если вы достаточно сообразительны, то можете подтвердить, что для нашей подгруппы это дает = либо 0.356, либо 0.397.

Интуитивно, все эти три предлагаемые величины (MAD и две ) правдоподобны в качестве характеристики вариабельности. Например, если бы мы удвоили промежутки (разности числовых значений) между всеми членами нашей подгруппы, то, несомненно, любое приемлемое представление вариабельности в нашей подгруппе тоже бы удвоилось. Да, все три вышеприведенные характеристики в таком случае действительно удваиваются. Если хотите, можете проверить их для следующих чисел:

1.4   1.0   2.8   2.2   1.0

(Внимательно сверьте эти числа с первоначальной подгруппой: первое число я оставил как есть, но затем другие получил путем удвоения всех промежутков, с которыми проводится сравнение). Если вы будете проводить вычисления с этими данными, то должны получить MAD и два равными 0.656, 0.711, и 0.795, соответственно.

Однако, существует намного более простая характеристика вариабельности – характеристика, которая также подчиняется упомянутому критерию удвоения – и именно ее мы используем во многих наших вычислениях контрольных карт. Это размах данной подгруппы, обозначаемый R и определяемый просто как промежуток между самым большим и самым малым значениями в подгруппе. Снова возвращаясь к нашей первоначальной подгруппе, увидим, что наименьшее значение равно 1.2, а наибольшее - 2.1. Поэтому, просто R = 2.1 - 1.2 = 0.9. Вот и все! Отметим, что в рассматриваемой выше подгруппе с удвоенными промежутками наименьшее значение равняется 1.0, а наибольшее - 2.8, поэтому значение R в ней будет 2.8 - 1.0 = 1.8, что как раз является удвоенным значением R (0.9) из первоначальной подгруппы, подтверждая тем самым, что R действительно также подчиняется правилу удвоения.

К сожалению, хотя мы можем и действительно используем размах во многих наших вычислениях, но стандартное отклонение настолько доминирует в теории математической статистики, что на практике мы не можем отказаться от него полностью. Поэтому имеются некоторые переводные коэффициенты, которые преобразуют R в «эквивалентное» значение . Этот метод обычно не дает в точности такое же численное значение , как каждый из указанных выше более сложных вычислений, тем не менее оно находится обычно в том же диапазоне.

Переводные коэффициенты* обозначаются (прошу прощения, но именно это вы найдете почти во всех книгах!) и приведены ниже для подгруппы размера n, где n имеет величину от 2 до 6.

n
2
3
4
5
6
1.128
1.693
2.059
2.326
2.534

 

Для преобразования R в его эквивалентное значение просто разделите R на величину , соответствующую размеру n данной подгруппы. Наши подгруппы имеют размер n = 5, поэтому для первоначальной подгруппы мы имеем:

= R / 2.326 = 0.9 / 2.326 = 0.387,

тогда как для подгруппы с удвоенными промежутками мы имеем:

= R / 2.326 = 1.8 / 2.326 = 0.774,

которые, как можно видеть, подобны значениям , рассчитанным более сложными методами.

На самом деле, на практике, при работе с процессом у нас имеется не одна, а несколько подгрупп (все одного размера). В таком случае мы могли бы вычислить R для каждой подгруппы отдельно, затем найти среднее (среднее значение) этих R - для которого, конечно, очевидным обозначением будет - и наконец воспользоваться тем же методом переводных коэффициентов для определения значения , которое таким образом соединяет информацию от всех подгрупп. Поэтому, например, у нас могла бы быть не одна, а скажем, 20 или 25 подгрупп (все размером 5), дающих средний размах = 0.86; тогда мы подсчитали бы для всех этих подгрупп как = 0.86 / 2.326 = 0.370.

Как будет видно в следующем разделе, когда мы имеем в наличии несколько подгрупп, то обычно рисуем две контрольные карты, одну для средних значений в подгруппах, , а вторую для размахов в подгруппах, R. Не удивительно, что для вычисления контрольных границ любой контрольной карты нам всегда приходится использовать (прямо или косвенно) стандартное отклонение () наносимой на карту величины. Таким образом, для -карты нам нужно значение , а для R-карты нам нужно значение . Для специалиста-практика это не составит особого труда: все что будет нужно - это использовать дополнительные таблицы переводных коэффициентов, сходных с теми, описанными выше, которые переводят R в эквивалентное значение путем деления на . На самом деле, можно избежать какого-либо подробного рассмотрения этих стандартных отклонений: все, что нужно сделать на практике для получения контрольных границ как -карты, так и R-карты – это умножить на соответствующие переводные коэффициенты. Более подробно это будет описано позднее.

Рисунок 5. Карта временной последовательности для:
(A) индивидуальных наблюдений, (B) средних значений

Хотя использование этих переводных коэффициентов – это все, что нужно на практике, стоит упомянуть одну конкретную особенность стандартных отклонений, иначе порой она может вызывать путаницу. Речь идёт о взаимосвязи между (стандартным отклонением для индивидуальных X), и (стандартным отклонением средних значений по подгруппам, ). Они не одно и то же! С первого взгляда это можно понять следующим образом. Давайте снова рассмотрим те первые 24 подгруппы из A Japanese Control Chart, которые уже использовались на Рисунке 1(e). На Рисунке 5(a) я нарисовал карту временной последовательности первого наблюдения в каждой из подгрупп (то есть, значения индивидуальных наблюдений, X), тогда как на Рисунке 5(b), который имеет тот же масштаб, что и Рисунок 5(a), я нарисовал карту временной последовательности средних значений в подгруппах, . Очевидно, что, как будет подсказывать нам наша интуиция, вариабельность значительно меньше вариабельности X; то есть, значительно меньше . Точно выполненный математический подсчет дает следующее полезное соотношение хорошо известное специалистам в области статистики:

(где n, напомним, обозначает размер подгрупп). Поэтому, поскольку в работе A Japanese Control Chart используются подгруппы размера n = 4, то это дает нам:

Повторим снова, это соотношение не будет выполняться строго для конкретных наборов данных. Однако, если мы вычислили на основе соответствующих данных любое из или , то использование этой формулы немедленно дает нам «эквивалентное» значение для другого (используя значение слова «эквивалентный» в прежнем значении).

 

 

Контрольные границы шухарта

На практике используется приблизительно с полдюжины типов контрольных карт. Различия между ними связаны с относительно тонкими деталями, обычно определяемыми типом изучаемого процесса и типом собранных из него данных. Приложение 2 дает полные и всесторонние советы по поводу того, какой конкретной картой воспользоваться. Однако, общий вид различных типов контрольной карты, а также интерпретации того, что можно увидеть на построенных картах, практически одинаковы и не зависят от того конкретного типа карты, с которой мы работаем.

Как мы уже видели, основная разница между устойчивыми и неустойчивыми процессами состоит в том, что неустойчивые процессы подвержены непредсказуемым изменениям поведения, тогда как у устойчивых процессов какие-либо заметные изменения в поведении отсутствуют. Но что означает «заметные»? Конечно, наносимые на карту конкретные числовые значения действительно обычно меняются каждый раз, когда мы их измеряем, но необычно, чтобы поведение повторялось в деталях в разные моменты времени (в самом деле, если бы такое происходило, это было бы подозрительно). Итак, снова, что же такое «заметные»?

Помня наши прежние определения контролируемой и неконтролируемой вариабельности, должно быть интуитивно очевидно, что не может существовать железного, несомненно верного способа разграничения этих двух ситуаций. Есть два типа ошибок, которые мы, конечно же, можем совершать. Мы можем искать особую причину там, где ничего стоящего нет. Или мы можем воздержаться от поисков, когда можно найти что-то стоящее. К сожалению, снижение риска совершить одну из этих ошибок увеличивает шанс совершить другую из них. Поэтому не может существовать способа, с помощью которого всегда принимается правильное решение о том, что нужно делать.

Именно здесь начинают работать рекомендации Шухарта. Его однозначным предложением было рассчитать верхнюю и нижнюю контрольные границы и считать изменение поведения «заметным», если какие-либо точки выходят за пределы этих контрольных границ. Как следует рассчитывать контрольные границы? В качестве правила, которое должно хорошо работать с тем типом данных, которые обычно встречаются на практике, он предложил следующую простую формулу:

где «среднее» и вычисляются на основе наносимых на карту данных, а t – это некоторое число, относительно которого предстоит принять решение. (Как мы уже видели на Рисунках 2 и 4, кроме контрольных границ обычно также наносят «среднюю линию», представляющую собой это «среднее».) Каким должно быть t? Очевидно, что если оно слишком велико, давая широкие контрольные границы, то можно упустить некие важные признаки существования особых причин. Если t слишком мало, то мы слишком часто будем отправляться в погоню за химерами. Выбор Шухарта, и его обоснование этого выбора, в сжатой форме появились в его книге [7] 1931-го года в следующей формулировке:

"Нам все еще предстоит выбрать t. Опыт показывает, что t = 3, по-видимому, является экономически приемлемым значением."

Какой можно выдвинуть лучший аргумент?

Для диагностики отсутствия статистического управления иногда используются некоторые другие типы сигналов. Понятно, что какой-либо убедительный признак неслучайного поведения наносимых на карту значений будет вызывать подозрения, даже если вне контрольных границ не лежит никаких точек. Однако, в контексте проведения улучшений, потребность в дополнительных формальных методах выявления неустойчивости значительно меньше, чем некоторым хотелось бы, нас убедить. На своем четырехдневном семинаре в Лондоне в 1991-м году д-р Деминг говорил об этом следующим образом: «Не позволяйте одурачить себя людям, которые занимаются ненужным усложнением... Не увлекайтесь чрезмерно паттернами." Мы вкратце вернемся к этому вопросу в последнем разделе.

 

контрольная карта

Здесь мы сосредоточимся на самом изощрённом из обычно используемых типов контрольной карты. Фактически, это две карты, -карта (читается «Х с чертой карта) и R-карта; для краткости эту пару часто называют картой. Небольшой участок карты, описанной в A Japanese Control Chart, показан на Рисунке 6 (при этом данные и т.д. написаны над картой, а различные комментарии снизу).

Рисунок 6. Отрывок из A Japanese Control Chart

 

Для подробного обсуждения этого конкретного типа карты перед тем, как перейти к другим, существует две причины. Первая причина состоит в том, чтобы побудить вас собирать, если возможно, данные того типа, которые могут наноситься на карту, потому что такая карта является обычно самой надежной и информативной из всех используемых контрольных карт. Вторая причина заключается в том, что обсуждать логическое обоснование, стоящее за деталями других карт, будет легче после того, как мы рассмотрим эту конкретную карту.

Вместе с тем отметим, что собирать данные, пригодные для построения карты, возможно не для всех процессов. Не волнуйтесь, если это случится с теми процессами, которыми вы занимаетесь: проверку временем вполне успешно выдержали и другие карты! Однако, при разработке будущих действий по сбору данных помните о вероятности того, что у вас может появиться желание проанализировать эти данные с помощью какой-либо контрольной карты – поскольку информация, собранная без такого намерения, часто не вполне готова к употреблению.

Основной критерий использования карты касается того, ограничены ли данные, получаемые от процесса, единичными измерениями, или вместо этого удобно собирать данные небольшими порциями или подгруппами. Другими словами, при записи данных на определенный день, минуту, положение, прибор и т.д., существует ли только один очевидный выбор того, что вы измеряете, или вы могли бы выбирать из некоторого числа сходных возможностей? Примером первой ситуации могла бы служить регистрация суммарных продаж за один день. Примером второй – массовое производство компонентов, в большом количестве поступающих с поточной линии. В этом случае нет никакого конкретного единственного выбора того, какой компонент(ы) выбрать для контроля производства, скажем, в полдень. Необходимым условием для использования карты является возможность собирать данные небольшими подгруппами (скажем, 4 или 5 в подгруппе), а не просто по-одному.

Основное преимущество сбора данных такими подгруппами, а не просто по-одному, состоит в том, что обычно мы тем самым можем получить надежное представление о величине общей вариабельности, даже если процесс неуправляем! Предположим, что мы измеряем веса упомянутых выше компонентов, а на производственный процесс оказывают влияние некие дестабилизирующие факторы. Примерами могут служить изменения в сырье, степень износа инструмента или альтернативные наладочные параметры станка, используемые другой сменой. Такие факторы будут время от времени менять поведение весовых данных – но надо быть большим неудачником, чтобы какое-либо из таких изменений произошло внутри любой из наших подгрупп, а не между ними. Причина состоит в том, конечно, что обычно временной интервал, представленный данными внутри какой-либо одной подгруппы, имеет меньший порядок величины, чем временные интервалы между выборками таких подгрупп для наблюдений.

Таким образом, вариабельность наблюдений внутри подгруппы в стандартном случае будет представлять обычную вариабельность процесса. Подобным же образом, вариабельность наблюдений внутри какой-либо другой подгруппы также будет представлять обычную вариабельность. Но обратите внимание на это слово «внутри»: мы говорим о сравнении наблюдений в любой подгруппе друг с другом, а не с наблюдениями в каких-либо других подгруппах. Вот почему имеется здравый смысл в том, чтобы (как предполагалось ранее) основывать наши вычисления на , среднем арифметическом размахов подгрупп: тем самым используется информация от всех подгрупп, но сравнения производятся только между наблюдениями из одной и той же подгруппы. Таким образом, отражает общую вариабельность, и это как раз то, что нам нужно при подсчете контрольных границ.

Особые причины вариабельности могут воздействовать на процесс различным образом. Это воздействие может быть лишь временным, например, воздействие, вызванное нетипичным одноразовым сбоем компьютера, которое легко исправляется. И наоборот, поведение процесса может измениться на период в несколько временных единиц, если не еще дольше. Такие изменения поведения могли бы повлиять на среднее, или на вариабельность, или на то и другое вместе. Например, если ночная смена изменяет параметры настройки станка, это может привести лишь к увеличению или уменьшению среднего веса продукции на определенную величину, но оставить вариабельность вокруг этого нового среднего почти такой же, как прежде. С другой стороны, вместо или вдобавок к такому изменению среднего значения веса вариабельность весовых значений может повыситься или понизиться.

Важные изменения в средних значениях измерений веса должны непременно обнаружить себя на -карте. Однако, если особые причины воздействуют также и на вариабельность показателей веса, то понятно, что увидеть это на –карте может быть трудно. Поэтому очевидно, что нам все же придётся построить и R-карту тоже.*

Как указывалось ранее, явных ссылок на стандартные отклонения, такие как , можно умело избежать, если использовать простые переводные коэффициенты. Как мы уже видели, верхние и нижние контрольные границы для -карты должны иметь следующий вид:


где - это среднее арифметическое средних арифметических подгруппы (что также является просто средним значением всех индивидуальных наблюдений). Но все, что на практике нужно сделать для получения этих границ – это рассчитать


 

где находят из следующей таблицы:

n
2
3
4
5
6
1.880
1.023
0.729
0.577
0.483

Энтузиаст может подтвердить, что

Детали для -карты даже еще проще, поскольку для рассматриваемых здесь размеров подгруппы n (не больше 6 —что находится в соответствии с общепринятой практикой), нижняя контрольная граница отсутствует.*

(Верхняя) контрольная граница для R-карты рассчитывается следующим образом:

 

где переводной коэффициент дается в следующей таблице. (Скажем снова: пожалуйста, не спрашивайте почему для представления переводного коэффициента используется это несколько сбивающее с толку обозначение – оно используется так давно, что теперь уже никто его менять не будет!).

n
2
3
4
5
6
3.268
2.574
2.282
2.114
2.004


(В соответствии с приведенным ранее рассуждением, значения D4 получаются при вычислении )

 

X-Карта

Если мы не можем собирать подгруппы данных, то есть, у нас имеются только последовательные единичные наблюдения, то возникает очевидная проблема. Конечно, достаточно легко построить карту временной последовательности этих индивидуальных значений. Но как мы можем рассчитать контрольные границы для преобразования карты временной последовательности в контрольную карту? Проблема в том, что в этом случае у нас нет никаких подгрупп, с помощью которых можно оценить вариабельность, вызванную общими причинами. Но для расчёта контрольных границ нам необходимо иметь оценку вариабельности, вызываемой общими причинами.

Для данных особого типа, известных под названием аттрибутивные данные, которые мы будем рассматривать в следующем разделе, статистическая теория часто дает удобный выход из положения. В противном случае нам потребуется достаточно прагматическое решение, описываемое ниже*.

Поскольку у нас нет границ, мы должны удовольствоваться наиболее подходящим понятием: скользящим размахом (MR). Это просто разница между значениями последовательных наблюдений. В качестве примера давайте используем данные по частоте пульса из Рисунка l(d). Вот 24 частоты пульса, дающих приводимые ниже 23 скользящих размаха:

 

82
84
80
79   78   80   87   84   77   88   83   85   85   86   86   91   84   86   80   81   88   85   84   76
2
4
1
  1   2   7   3   7   11   5   2   0   1   0   5   7   2   6   1   7   3   1   8  

 

Эти 23 скользящих размаха в сумме дают 86, и средний скользящий размах получается равным:

 

Для вычисления значения мы продолжаем действовать так, как если бы эти скользящие размахи были границами подгрупп размером n = 2. То есть, мы вычисляем как

 

(так как 1.128 является значением для n = 2). Средняя частота пульса, , составляет 83.29, и поэтому контрольные границы располагаются на расстоянии 3 = 9.96 с каждой стороны от 83.29, давая значения 73.33 и 93.25.

Отметим, что вместо этого контрольные границы можно вычислить гораздо проще, без отдельного специального вычисления . Расстояние между и контрольными границами просто равняется

,

то есть,

 

Почему 2.66? Потому что 2.66 = 3 / 1.128. (Либо подумайте и разберитесь, либо просто примите как данное). Для наших данных = 3.74. Поэтому расстояние между и контрольными границами теперь рассчитано как 2.66 x 3.74 = 9.95, давая тем самым нижнюю и верхнюю границы 83.29 - 9.95 = 73.34 и 83.29 + 9.95 = 93.24, практически те же самые, что и полученные выше.

Если процесс является фактически неуправляемым, то на некоторые из MR будет влиять вариабельность, вызываемая особыми причинами, и поэтому некоторые из них могут оказаться значительно больше, чем ожидалось бы, если бы процесс был устойчивым. Однако, обычно это не будет влиять на очень многие значения MR, и поэтому не окажется слишком далеко от того, каким оно было бы, если бы процесс оставался управляемым. Другими словами, в случае неуправляемого состояния, использование для вычисления контрольных границ все ещё достаточно «надежно», то есть, оно работает в широком диапазоне обстоятельств. Следовательно, любые внезапные значительные смещения в значениях X, вероятно, будут давать некоторые точки за пределами контрольных границ.

Действительно, при наличии данных этого типа (то есть, при «последовательных единичных» наблюдениях), вычисление контрольных границ по скользящим размахам является самым лучшим подходом, если не возникают особые обстоятельства, что мы будем подробно рассматривать в следующем разделе. Приведенный метод в высшей степени универсален, то есть, имеет широкий спектр применения. Не дайте ввести себя в заблуждение «начетчикам» (как склонен называть их д-р Деминг), тем, кто пытается доказывать, что, наоборот, предлагаемый в данном разделе метод имеет силу только при строгих математических ограничениях.

 

Альтернативные данные

В то время, как карты и X-карты могут иметь очень широкое применение, контрольные карты, рассматриваемые в данном разделе, припасены для довольно специфических случаев.

Альтернативные данные появляются только тогда, когда подсчитываются количества событий определенного вида. Примерами этого являются неисправности, брак, прогульщики, аварии, несоответствия требованиям, ошибки. Обратите внимание, что все это примеры негативных событий. Мы не выискиваем специально негативные события, но поскольку (будем надеяться) их обычно гораздо меньше, чем соответствующих позитивных событий, вести подсчёт негативных событий обычно намного проще!

Что делает альтернативные данные особенными в контексте построения контрольных карт, так это то, что в обычно встречающихся на практике условиях, информация о среднем числе негативных событий дает нам информацию о вариабельности регистрируемой величины. В частности , величину стандартного отклонения, можно тогда вычислить непосредственно по среднему значению! Понятно, что речь не идет о данных в общем случае. Например, знание того, что частота моего пульса на Рисунке 1(d) в среднем равна = 83.29 ударов в минуту, не позволяет мне вычислить стандартное отклонение , частоты моего пульса. Как мы уже видели, для этого потребуется провести анализ всех исходных данных на основе соответствующего расчета. Аналогичным образом, если бы среднее было 73.29, или 65.0, и т.д., то эта информация тоже практически ничего не говорила бы мне относительно .

А теперь рассмотрим следующую ситуацию. В ней мы будем рассматривать не непрерывную величину, какой является частота пульса, но дискретно изменяющаяся величина - количество заказов, в которых обнаружены ошибки, в выборке из 100 заказов, взятой из всех заказов за день. Предположим (возьмем крайний случай), что накопив такую информацию за несколько дней, я сказал вам, что средняя величина заказов, в которых обнаружены ошибки, равна 0. Вы немедленно могли бы прийти к заключению, что в этих данных нет никакой вариабельности!* Единственный способ получить среднее равным 0 – это чтобы каждое значение в этих данных равнялось 0. Аналогичным образом, единственный способ получить среднее равным 100 – это чтобы каждое значение в этих данных равнялось 100. Поэтому в обоих случаях в данных отсутствует вариабельность, давая = 0. С другой стороны, если бы среднее равнялось 50, то тогда количества неисправностей, формирующие наши данные, будут, по-видимому, варьировать достаточно значительно, давая относительно большое значение . При других средних, приблизительно равных 50, , по-видимому, снова будет достаточно большим, тогда как другие средние, близкие к 0 или 100, должны будут давать малые значения .

Принятыми условными обозначениями в таком случае будут n = объему выборки (поэтому здесь n = 100) и p = доле элементов в данной выборке, которые имеют «характерное свойство», при этом в данном случае свойством является наличие одной или более ошибок. Средняя доля дефектных заказов относительно всех выборок обозначена через (отсюда, среднее количество дефектов равно ). Статистическая теория дает следующее выражение для стандартного отклонения np, числа дефектов в выборке:

Отметим, что в экстремальных случаях, рассмотренных выше, = 0 или = 1; и действительно, в обоих случаях эта формула дает = 0. Кроме того, мало, когда находится вблизи 0 или 1, но оно значительно больше, когда принимает промежуточные значения. Все это согласуется с приведенным выше обсуждением.

Точное допущение, необходимое для вывода этой формулы (в контексте приведенного выше примера), состоит в том, что заказы, имеющие дефекты, возникают независимо друг от друга, в отличие, например, от тенденции, когда дефекты группируются. Статистическая модель, на которой основывается формула для , называется биномиальной моделью («би-номиальная» = «два варианта», как, например, дефектный и бездефектный, или орел и решка). Из шести процессов, приведенных нами в качестве иллюстрации в начале данной брошюры, биномиальная модель несомненно применима (практически, во всех отношениях) как к (b) бросанию монеты, так и к (с) эксперименту с красными бусинами.

Поэтому, при условии, что это предположение корректно, центральная линия на контрольной карте будет лежать на уровне , а контрольные границы:

 

Такая контрольная карта называется np-картой.

И, наконец, в этой теме существует тонкое различие. Предположим, что вместо наличия выборки элементов (например, заказов), каждый из которых мы классифицируем, как дефектный или бездефектный, теперь изучаемый объект представляет собой отдельный, относительно цельный предмет. Например, это может быть страница газеты или кусок коврового покрытия. Мы проводим проверку того, как много опечаток, ошибок или вообще дефектов мы можем на нём найти (обратите внимание на тонкий переход от слова «дефектный» к слову «дефект» - подумайте об этом!). Очевидное отличие от биномиального случая состоит в том, что теперь для количества обнаруживаемых дефектов нет естественного максимума – в отличие от биномиального случая, где невозможно зарегистрировать количество (скажем, дефектных элементов) большее, чем n.

Обычное обозначение для количества дефектов и т.д. – это c (не спрашивайте меня почему!), а среднее для разных газетных страниц, которые мы исследовали – это . При предположении, довольно близком к тем, которые были сделаны для биномиального случая, статистическая теория снова приходит к простому способу вычисления значения для – даже более простому, чем в биномиальном случае. Вот он:

- да-да, вы не ошиблись: просто квадратный корень из среднего! Эта модель известна под названием модели распределения Пуассона, по имени разработавшего её французского геометра и физика. Необходимое предположение, аналогичное биномиальному случаю, состоит в том, что дефекты возникают независимо друг от друга – то есть, что возникновение дефекта в определенном месте не увеличивает или уменьшает шанса возникновения других дефектов вблизи этого места или где-нибудь еще.*

При условии, что этот критерий независимости выполняется, контрольная карта для c будет, таким образом, иметь центральную линию на уровне и контрольные границы:

 

Заключительные замечания

Что читать дальше

Естественно, что никакая короткая публикация не может полностью охватить тему контрольных карт, но мы надеемся, что данная брошюра все же послужит для этого хорошим началом. Ниже приводятся несколько дополнительных замечаний. Если вы хотите более полно и всеобъемлюще познакомиться с этим вопросом, то наилучшим из мне известных единым источником является издание 1992-го года книги Дональда Уиллера (Donald J Wheeler) и Дэвида Чамберса (David S Chambers): Understanding Statistical Process Control [8]. Заметим, что большинство авторов публикаций по вопросам методологии и интерпретации контрольных карт проявляют некоторое недопонимание подхода Шухарта к данному предмету (что прискорбно, поскольку мы знаем, что именно он-то его и создал!). Некоторые аспекты такого ложного понимания описываются в брошюре Why SPC?[1]. Из всех известных мне на данный момент специалистов (конечно, кроме д-ра Деминга), д-р Уиллер, по-видимому, наиболее близок к идеям Шухарта.


РИСУНОК 7. Контрольные карты для данных
Рисунков 1 и 3 с контрольными границами,
взятыми из Рисунка 2.

Выделение подгрупп

Как следует проводить отбор объектов для объединения их в подгруппы? Часто можно прочитать, что подгруппы выделяются так, чтобы минимизировать вариабельность внутри этой подгруппы. Однако, такой совет может быть опасным. Причина в том, что во многих случаях, данные полученные в близких наблюдениях, являются естественным образом автокоррелированными. Это означает, что значения показателей процесса, измеренные в очень близкие моменты времени, несомненно не будут и не могут «варьировать случайным образом» по отношению друг к другу. Наиболее общий автокорреляционный эффект состоит в том, что значения, регистрируемые в очень близкие моменты времени, оказываются тоже близки друг к другу. Вспомните температуры или какие-либо другие метеорологические показатели; вспомните измерения частоты пульса, показатели артериального давления, уровня холестерина или просто какие-то другие медицинские показатели; вспомните измерения текущего расхода мощности у электрического генератора. Очень многие процессы, будь то в сфере производства, услуг, управления и финансов, являются автокоррелированными по самой своей природе: другими они и быть не могут. Поэтому, чем данные ближе друг к другу, тем меньше будет между ними вариабельность. Тем более что, если данные располагаются слишком близко друг от друга, то большая часть вариабельности в количественных данных вполне может быть результатом самого процесса измерения! Нет сомнения, что в любом таком случае глупо говорить о таком подходе к выделению подгрупп, при котором «минимизируется вариабельности» внутри подгрупп.

Большая часть работ по выделению подгрупп подчеркивает необходимость того, чтобы данные располагались достаточно близко друг от друга. Но как-то редко упоминается, что данные также должны находиться достаточно далеко друг от друга! Конечно же, они не должны находиться настолько далеко, чтобы вызывать проявление внутри подгрупп эффекта увеличения вариабельности в случае появления особой причины. Этот компромисс должен решаться на основе знания и понимания природы рассматриваемого процесса. Нужно, чтобы вариабельность внутри подгруппы, если это возможно, отражала вариабельность, вызываемую общими причинами, то есть, тип вариабельности, возникающей в рассматриваемом процессе в то время, когда он может считаться управляемым (является или нет в текущий момент он действительно управляемым!). Если подгруппы хорошо выбраны для этой цели, то тогда они называются рациональными подгруппами. Это требование не будет выполняться, если данные внутри подгруппы либо слишком далеко отстоят друг от друга, либо (при наличии автокорреляционных эффектов) слишком близки друг к другу. Сходные соображения применяются при выборе времени для индивидуальных наблюдений, помня при этом, что для оценки вариабельности, вызываемой общей причиной, будут использоваться скользящие размахи.

 

Когда можно рассчитать контрольные границы

Кроме примера вычисления контрольных границ для серии длиной в 24 временные точки, до сих пор не давалось никаких рекомендаций относительно того, когда нужно вычислять границы. Согласно установившейся многолетней практике считалось, что их можно вычислять после получения 20-30 точек индивидуальных наблюдений. Вследствие большего объема информации, содержащейся в подгруппах, является общепринятым вычислять контрольные границы на основе несколько меньшего числа подгрупп, скажем, от 15 до 20.

Не все процессы дают возможность собрать такое количество точек данных до начала вычисления контрольных границ. Несомненно, это относится к данным, собираемым только еженедельно, ежемесячно или даже на более длительных отрезках времени. Обычно нет ничего плохого в том, что вычисляются промежуточные контрольные границы более коротких серий для получения предварительной оценке данных в этих более коротких сериях. Однако, если эти контрольные границы проектировать на будущее, то к сигналам о неуправляемости нужно относиться с определенной долей осторожности, и в любом случае следует пересчитать контрольные границы, когда длина серии вырастает до приведенных выше рекомендаций. Если вы занимаетесь именно такими процессами, то вам может оказаться полезной книга д-ра Уиллера (Dr Wheeler): Short Run SPC[9]

Безусловно, после устранения каких-либо существенных особых причин или после значительных изменений процесса было бы разумно повторно рассчитать контрольные границы. С другой стороны, если, после расчёта контрольных границ в соответствии с вышеприведенными рекомендациями, процесс оказывается управляемым, то эти контрольные границы можно распространить на будущее, чтобы помочь диагностировать будущие особые причины. Отметим, что это можно было бы сделать со всеми из наших шести процессов, приведенных в качестве иллюстрации выше.

Естественно, что такие контрольные границы будут диагностировать будущие изменения более эффективно (вместо новых контрольных границ, вычисленных из будущих данных), поскольку будущие данные затем сравниваются с предыдущими данными.

Но контрольные границы на Рисунке 4 были непосредственно рассчитаны по данным Рисунка 3, а не Рисунка 1.

Хотя контрольные границы, вычисленные по Рисунку 1 и приведенные на Рисунке 2, дали бы более сильные сигналы при анализе более поздних данных, стоит еще раз подчеркнуть, что контрольные карты могут давать сигналы об особых причинах даже если контрольные гранциы были вычислены в процессе не имеющем устойчивости. Шухарт разрабатывал свои контрольные границы, в значительной степени принимая в расчет и эту цель тоже. Для сравнения, Рисунок 7 показывает контрольные карты с границами, вычисленными на основе данных Рисунков 1 и 3, то есть, границами, нанесенными на Рисунке 2.

Переменные контрольные границы для альтернативных данных

В разделе об альтернативных данных мы допустили, что как и в биномиальном случае, размер анализируемого в модели Пуассона элемента выборки – например, страницы газеты или куска напольного покрытия – остаётся неизменным. Если этого не происходит, то тогда, строго говоря, контрольные границы должны измениться достаточно сложным образом. В публикации данного размера представлялось неуместным пытаться разбираться во всех этих деталях. Тех читателей, которых они заинтересуют, можно отослать к публикации Understanding Statistical Process Control,[8] Глава 10.

Все же здесь нам следует упомянуть одну рекомендацию из этой главы. Уиллер и Чамберс сообщают, что если n или объём элемента выборки изменяются не более, чем на 20% в любую сторону от его среднего, то тогда обычные контрольные карты, описанные в предыдущем разделе, могут использоваться без каких-либо поправок (за исключением использования средней величины n, , при расчёте контрольных границ для np-карты).

 

Другие сигналы

Нет прямого ответа на вопрос относительно того, следует или нет вводить дополнительные сигналы в критерий Шухарта (то есть, точки, выходящие за 3-границы). Это в значительной степени зависит от того, почему и как используются контрольные карты. Если они применяются исключительно в целях мониторинга – то есть, с основной целью получить раннее предупреждение об отклонении от текущего (будем надеяться, устойчивого) состояния – тогда дополнительные сигналы могут оказаться желательными. Но если контрольные карты используются в контексте проведения улучшения (как в ситуации, когда Шухарт их придумал), то тогда вполне может статься, что дополнительные сигналы могут стать скорее помехой, чем средством помощи. В контексте проведения улучшения встает вопрос, следует ли направлять усилия по улучшению на саму систему или на идентификацию и устранение особых причин.

Стоит привести два наблюдения. Во-первых, эти два аспекта улучшения вовсе не обязательно будут независимы друг от друга. – как это хорошо показано в работе A Japanese Control Chart, и как ясно на это указывал Шухарт. Во-вторых, не только д-р Деминг, но и д-р Джозеф Джуран (Joseph Juran), и другие исследователи уверены, что подавляющее большинство возможностей для проведения улучшения находятся в общих (внутри системы), а не специальных причинах. Поэтому, хотя следует заниматься «очевидными» специальными причинами, все же разумным кажется принцип, что в пограничных случаях (случаях «серой зоны) следует сосредоточивать усилия на улучшении системы, а не на отслеживании возможных специальных причин. Использование дополнительных сигналов сдвигает нас в направлении противоположной стратегии.

Может быть, полезно отметить, что когда я имел возможность многократно проводить эксперименты с красными бусинами, то заметил, что обычно используемые альтернативные сигналы о наличии специальных причин появляются слишком часто. Однако, как это отмечалось ранее, представляется маловероятным, что в полностью контролируемых условиях эксперимента с красными бусами мы смогли бы найти реальные источники специальных причин! В этом частично кроется причина того, что я с большой осторожностью отношусь к дополнительным сигналам.

Однако, было бы неразумно игнорировать очевидные признаки изменения, например, необычно длинная последовательность точек по одну сторону от центральной линии. Если вам захочется дополнительно прочитать о других возможных сигналах, обратитесь к книге Understanding Statistical Process Control, Глава 5, а также к работе Ллойда Нельсона (Lloyd Nelson): "The Shewhart Control Chart—Tests for Special Causes".[10]

 

Потенциальные возможности

Некоторые книги и руководства по SPC уделяют значительное место «потенциальным возможностям» процессов – даже неустойчивых процессов. Особенно в последнем случае, такие рассуждения как нам представляется, покоятся на очень ненадёжном основании. Позиция д-ра Деминга относительно потенциальных возможностей процессов простая и ясная: процесс имеет потенциальные возможности только тогда, когда он устойчив, и в этом случае эти потенциальные возможности определяются его контрольными границами (для индивидуальных значений), поскольку они указывают, каковы производственные возможности такого процесса.

 

«Обоснованность» переводных коэффициентов

В предисловии к данной брошюре, а также в самом последнем абзаце, который следует далее, я отвергаю часто выражаемое мнение, что «обоснованность» контрольных карт и расчёты контрольных границ зависят от предположений о нормальном характере распределения.

Такой взгляд направлен, в частности, на выбор множителя «3» в выражении для расчета 3-границ и на использование переводных коэффициентов , и т.д.

Я могу предположить, что приведенное на стр. 21 собственное объяснение Шухартом того, почему он выбирает «3», опровергает первое из названных. Более подробную информацию по этому вопросу см. в Приложении 1 к брошюре "Почему SPC?".

Что касается переводных коэффициентов, то верно, что они точно приложимы только к определенному искусственному случаю, когда данные произвольным образом извлекаются из в точности устойчивого процесса, имеющего нормальное распределение. Однако, как указывает Деминг*, на практике мы никогда, даже случайно, не сталкиваемся с в точности устойчивым процессом, не говоря уже о процессе с заданным распределением! Слабость математического подхода с точки зрения его применения в реальном мире состоит в том, что он неизбежно требует сделать предположения, которые невозможно реализовать на практике. Поэтому в реальном мире полезность математических результатов заключается не в том, что они дают исходя из этих нереалистичных предположений, но в том, насколько широко они полезны при всем многообразии реально встречающихся на практике условий. Другими словами, нет сомнения, что задача прикладной (а не теоретической) математики состоит в том, чтобы давать советы, которые работают в том мире, где мы живем, а не ожидать, что мир будет подстраиваться под какие-либо математические модели.

Представляется, что переводные коэффициенты, используемые при вычислении контрольных границ, удовлетворяют этому критерию.

 

«Математические» требования и интерпретации

Многие презентации контрольных карт включают ссылки на нормальные распределения, Центральную предельную теорему, вероятности, среднюю длину серий, уровни достоверности и т.д.. По-видимому, более математизированный подход к теории контрольных карт и интерпретации, связанные с этими понятиями, не совместимы ни со взглядами Шухарта, ни со взглядами Деминга. Наверно, читатель уже заметил, что в данной брошюре я тоже не использую такую терминологию.

 

Приложение 1

Переводные коэффициенты и контрольные границы

n
2
3
4
5
6
1.128
1.693
2.059
2.326
2.534
1.880
1.023
0.729
0.577
0.483
3.268
2.574
2.282
2.114
2.004

n = объём рациональной подгруппы

дает «эквивалентное значение» как / , где – это средний размах некоторых подгрупп (или размах одной подгруппы) объёма n

 

-R карта

–диагр

Центральная линия:

R-диагр

Центральная линия:

Нижняя контрольная граница не существует (для n<6)

X-диагр

Центральная линия:

np-диагр

Центральная линия:

c-диагр

Центральная линия:

 

Приложение 2

Карта принятия решений для выбора типа контрольной карты

 

[A] «Альтернативные данные» появляются только тогда, когда подсчитываются количества событий определенного типа (например, неисправности или дефекты)». Смотреть здесь

[B] Данные типа «количество дефектов» появляются там, где каждый элемент в образце классифицируют одним из двух вариантов, скажем, дефектный или бездефектный, и эти данные являются количеством, например, дефектов, содержащихся в одном образце. Смотреть здесь

[C] Условие независимости состоит в том, что дефекты (или другой рассматриваемый атрибут) возникают, на самом деле, случайным образом, а не собранными в группу или проявляющими какой-либо другой тип паттерна. Смотреть здесь

[D] Предполагается, что «(почти) равные» объёмы выборки (размеры образца) интерпретируются как все, лежащие в пределах 20% относительно среднего объёма выборки. Смотреть здесь

[E] Подробнее об np-картах смотреть здесь и Приложение 1

[F] Это означает, что должно быть возможно представить, что анализируемый элемент выборки разбивается на большое количество n малых фрагментов, при этом каждый фрагмент имеет одинаковый (малый) шанс p содержать дефект*.

[G] Как [C] выше. Смотреть здесь

[H] Подобно [D] выше, предположение состоит в том, что размеры выбранных образцов, анализируемых на наличие дефектов и т.д., отличаются не более чем на 20% в обе стороны от их среднего значения. Смотреть здесь

[I] Подробнее о c-картах смотреть здесь и Приложение 1

[J] Глава 10 работы Understanding Statistical Process Control [8] приводит соображения по корректировке деталей контрольных карт для альтернативных данных, чтобы допустить более широкие отклонения в размерах единичных образцов или объёмах выборок.

[K] Термин «рациональные подгруппы» означает, (i) что данные могут собираться «по нескольку за раз», а не только «одно за раз», и (ii) что их собирают таким образом, что вариабельность между наблюдениями в пределах подгруппы корректно отражает вариабельность, вызываемую общей причиной. Смотреть здесь и здесь

[L] Подробнее об картах смотреть здесь и Приложение 1

[M] Подробнее об X-картах смотреть здесь и Приложение 1

 


Ссылки

1. Почему SPC? Брошюра № A4, Британская Ассоциация Деминга (1990); SPC Press, Knoxville, Tennessee (1992).

2. Out of the Crisis, автор W Edwards Deming. Massachusetts Institute of Technology, Center for Advanced Engineering Study (1986); Cambridge University Press (1988).

3. A Japanese Control Chart (видео и сопровождающая брошюра). SPC Press, Knoxville, Tennessee (1984).

4. The Deming Dimension автор Henry R Neave. SPC Press, Knoxville, Tennessee (1990).

5. The Experiment on Red Beads. Брошюра № A15, Британская Ассоциация Деминга (1993); SPC Press, Knoxville, Tennessee (1993).

6. The New Economics for Industry, Government, Education, автор W.Edwards Deming. Massachusetts Institute of Technology, Center for Advanced Engineering Study (1993).

7. Economic Control of Quality of Manufactured Product, автор Walter A Shewhart. van Nostrand (1931); переиздано the American Society for Quality Control (1980).

8. Understanding Statistical Process Control, авторы Donald J Wheeler and David S Chambers. SPC Press, Knoxville, Tennessee (1986, 2-ое издание 1992).

9. Short Run SPC, автор Donald J Wheeler. SPC Press, Knoxville, Tennessee (1992).

10. "The Shewhart Control Chart—Tests for Special Causes", автор Lloyd S Nelson. Journal of Quality Technology (October 1984), страницы 237-239.

 

Автором данной брошюры является Генри Р. Нив, Директор по образованию и исследованиям Британской Ассоциации Деминга. Д-р Нив с благодарностью принимает предложения, высказанные, среди прочих, членами Группы статистических исследований БАД, читавшими черновые варианты данного материала. Автор также благодарит Дона Уиллера и SPC Press Inc. за разрешение воспроизвести отрывок из книги A Japanese Control Chart, а именно, Рисунок 6.

 

Обсудить этот материал на нашем форуме