Результат любого измерения не определён однозначно и имеет случайную составляющую. Поэтому адекватным языком для описания погрешностей является язык вероятностей. Тот факт, что значение некоторой величины «случайно», не означает, что она может принимать совершенно произвольные значения. Ясно, что частоты, с которыми возникает те или иные значения, различны. Вероятностные законы, которым подчиняются случайные величины, называют распределениями.
Случайной будем называть величину, значение которой не может быть достоверно определено экспериментатором. Чаще всего подразумевается, что случайная величина будет изменяться при многократном повторении одного и того же эксперимента. При интерпретации результатов измерений в физических экспериментах, обычно случайными также считаются величины, значение которых является фиксированным, но не известно экспериментатору. Например смещение нуля шкалы прибора. Для формализации работы со случайными величинами используют понятие вероятности. Численное значение вероятности того, что какая-то величина примет то или иное значение определяется либо как относительная частота наблюдения того или иного значения при повторении опыта большое количество раз, либо как оценка на основе данных других экспериментов.
Замечание. Хотя понятия вероятности и случайной величины являются основополагающими, в литературе нет единства в их определении. Обсуждение формальных тонкостей или построение строгой теории лежит за пределами данного пособия. Поэтому на начальном этапе лучше использовать «интуитивное» понимание этих сущностей. Заинтересованным читателям рекомендуем обратиться к специальной литературе: [5].
Рассмотрим случайную физическую величину , которая при измерениях может принимать непрерывный набор значений. Пусть — вероятность того, что результат окажется вблизи некоторой точки в пределах интервала : . Устремим интервал к нулю. Нетрудно понять, что вероятность попасть в этот интервал также будет стремиться к нулю. Однако отношение будет оставаться конечным. Функцию называют плотностью распределения вероятности или кратко распределением непрерывной случайной величины .
Замечание. В математической литературе распределением часто называют не функцию , а её интеграл . Такую функцию в физике принято называть интегральным или кумулятивным распределением. В англоязычной литературе для этих функций принято использовать сокращения: pdf (probability distribution function) и cdf (cumulative distribution function) соответственно.
Проиллюстрируем наглядно понятие плотности распределения. Результат большого числа измерений случайной величины удобно представить с помощью специального типа графика — гистограммы. Для этого область значений , размещённую на оси абсцисс, разобьём на равные малые интервалы — «корзины» или «бины» (англ. bins) некоторого размера . По оси ординат будем откладывать долю измерений , результаты которых попадают в соответствующую корзину. А именно, пусть — номер корзины; — число измерений, попавших в диапазон . Тогда на графике изобразим «столбик» шириной и высотой . В результате получим картину, подобную изображённой на рис. 2.1.
Высоты построенных столбиков будут приближённо соответствовать значению плотности распределения вблизи соответствующей точки . Если устремить число измерений к бесконечности (), а ширину корзин к нулю (), то огибающая гистограммы будет стремиться к некоторой непрерывной функции .
Самые высокие столбики гистограммы будут группироваться вблизи максимума функции — это наиболее вероятное значение случайной величины. Если отклонения в положительную и отрицательную стороны равновероятны, то гистограмма будет симметрична — в таком случае среднее значение также будет лежать вблизи этого максимума. Ширина гистограммы будет характеризовать разброс значений случайной величины — по порядку величины она, как правило, близка к среднеквадратичному отклонению .
Из определения функции следует, что вероятность получить в результате эксперимента величину в диапазоне от до можно найти, вычислив интеграл:
(2.1) |
Согласно определению вероятности, сумма вероятностей для всех возможных случаев всегда равна единице. Поэтому интеграл распределения по всей области значений (то есть суммарная площадь под графиком ) равен единице:
Это соотношение называют условием нормировки.
Вычислим среднее по построенной гистограмме. Если размер корзин достаточно мал, все измерения в пределах одной корзины можно считать примерно одинаковыми. Тогда среднее арифметическое всех результатов можно вычислить как
Переходя к пределу, получим следующее определение среднего значения случайной величины:
(2.2) |
где интегрирование ведётся по всей области значений . В теории вероятностей также называют математическим ожиданием распределения. Величину
(2.3) |
называют дисперсией распределения. Значение есть срекднеквадратичное отклонение в пределе . Оно имеет ту же размерность, что и сама величина и характеризует разброс распределения. Именно эту величину, как правило, приводят как характеристику погрешности измерения .
Обозначим как вероятность того, что отклонение от среднего составит величину, не превосходящую по модулю значение :
(2.4) |
Эту величину называют доверительной вероятностью для доверительного интервала .
Одним из наиболее примечательных результатов теории вероятностей является так называемая центральная предельная теорема. Она утверждает, что сумма большого количества независимых случайных слагаемых, каждое из которых вносит в эту сумму относительно малый вклад, подчиняется универсальному закону, не зависимо от того, каким вероятностным законам подчиняются её составляющие, — так называемому нормальному распределению (или распределению Гаусса).
Доказательство теоремы довольно громоздко и мы его не приводим (его можно найти в любом учебнике по теории вероятностей). Остановимся кратко на том, что такое нормальное распределение и его основных свойствах.
Плотность нормального распределения выражается следующей формулой:
(2.5) |
Здесь и — параметры нормального распределения: равно среднему значению , a — среднеквадратичному отклонению, вычисленным в пределе .
Как видно из рис. 2.1, распределение представляет собой симметричный «колокол», положение вершины которого соответствует (ввиду симметрии оно же совпадает с наиболее вероятным значением — максимумом функции ).
При значительном отклонении от среднего величина очень быстро убывает. Это означает, что вероятность встретить отклонения, существенно большие, чем , оказывается пренебрежимо мала. Ширина «колокола» по порядку величины равна — она характеризует «разброс» экспериментальных данных относительно среднего значения.
Замечание. Точки являются точками перегиба графика (в них вторая производная по обращается в нуль, ), а их положение по высоте составляет от высоты вершины.
Универсальный характер центральной предельной теоремы позволяет широко применять на практике нормальное (гауссово) распределение для обработки результатов измерений, поскольку часто случайные погрешности складываются из множества случайных независимых факторов. Заметим, что на практике для приближённой оценки параметров нормального распределения случайной величины используются выборочные значения среднего и дисперсии: , .
Вычислим некоторые доверительные вероятности (2.4) для нормально распределённых случайных величин.
Замечание. Значение интеграла вида (его называют интегралом ошибок) в элементарных функциях не выражается, но легко находится численно.
Вероятность того, что результат отдельного измерения окажется в пределах оказывается равна
Вероятность отклонения в пределах :
а в пределах :
Иными словами, при большом числе измерений нормально распределённой величины можно ожидать, что лишь треть измерений выпадут за пределы интервала . При этом около 5% измерений выпадут за пределы , и лишь 0,27% окажутся за пределами .
Пример. В сообщениях об открытии бозона Хиггса на Большом адронном коллайдере говорилось о том, что исследователи ждали подтверждение результатов с точностью «5 сигма». Используя нормальное распределение (2.5) нетрудно посчитать, что они использовали доверительную вероятность . Такую точность можно назвать фантастической.
Полученные значения доверительных вероятностей используются при стандартной записи результатов измерений. В физических измерениях (в частности, в учебной лаборатории), как правило, используется , то есть, запись
означает, что измеренное значение лежит в диапазоне (доверительном интервале) с вероятностью 68%. Таким образом погрешность считается равной одному среднеквадратичному отклонению: . В технических измерениях чаще используется , то есть под абсолютной погрешностью имеется в виду удвоенное среднеквадратичное отклонение, . Во избежание разночтений доверительную вероятность следует указывать отдельно.
Замечание. Хотя нормальный закон распределения встречается на практике довольно часто, стоит помнить, что он реализуется далеко не всегда. Полученные выше соотношения для вероятностей попадания значений в доверительные интервалы можно использовать в качестве простейшего признака нормальности распределения: в частности, если количество попадающих в интервал результатов существенно отличается от 2/3 — это повод для более детального исследования закона распределения ошибок.
Теперь мы можем дать количественный критерий для сравнения двух измеренных величин или двух результатов измерения одной и той же величины.
Пусть и () измерены с погрешностями и соответственно. Ясно, что если различие результатов невелико, его можно объяснить просто случайными отклонениями. Если же теория предсказывает, что вероятность обнаружить такое отклонение слишком мала, различие результатов следует признать значимым. Предварительно необходимо договориться о соответствующем граничном значении вероятности. Универсального значения здесь быть не может, поэтому приходится полагаться на субъективный выбор исследователя. Часто в качестве «разумной» границы выбирают вероятность 5%, что, как видно из изложенного выше, для нормального распределения соответствует отклонению более, чем на .
Допустим, одна из величин известна с существенно большей точностью: (например, — результат, полученный студентом в лаборатории, — справочное значение). Поскольку мало, можно принять за «истинное»: . Предполагая, что погрешность измерения подчиняется нормальному закону с и дисперсией , можно утверждать, что различие считают будет значимы, если
Пусть погрешности измерений сравнимы по порядку величины: . В теории вероятностей показывается, что линейная комбинация нормально распределённых величин также имеет нормальное распределение с дисперсией (см. также правила сложения погрешностей (2.7)). Тогда для проверки гипотезы о том, что и являются измерениями одной и той же величины, нужно вычислить, является ли значимым отклонение от нуля при .
Замечание. Изложенные здесь соображения применимы, только если и его стандартное отклонение получены на основании достаточно большой выборки (или заданы точно). При небольшом числе измерений () выборочные средние и среднеквадратичное отклонение сами имеют довольно большую ошибку, а их распределение будет описываться не нормальным законом, а так называемым -распределением Стъюдента. В частности, в зависимости от значения интервал будет соответствовать несколько меньшей доверительной вероятности, чем . Особенно резко различия проявляются при высоких уровнях доверительных вероятностей .
Величины и называют независимыми если результат измерения одной из них никак не влияет на результат измерения другой. Для таких величин вероятность того, что окажется в некоторой области , и одновременно — в области , равна произведению соответствующих вероятностей:
Обозначим отклонения величин от их средних как и . Средние значения этих отклонений равны, очевидно, нулю: , . Из независимости величин и следует, что среднее значение от произведения равно произведению средних и, следовательно, равно нулю:
(2.6) |
Пусть измеряемая величина складывается из двух независимых случайных слагаемых и , для которых известны средние и , и их среднеквадратичные погрешности и . Непосредственно из определения (1.1) следует, что среднее суммы равно сумме средних:
Найдём дисперсию . В силу независимости имеем
то есть:
(2.7) |
Таким образом, при сложении независимых величин их погрешности складываются среднеквадратичным образом.
Подчеркнём, что для справедливости соотношения (2.7) величины и не обязаны быть нормально распределёнными — достаточно существования конечных значений их дисперсий. Однако можно показать, что если и распределены нормально, нормальным будет и распределение их суммы.
Замечание. Требование независимости слагаемых является принципиальным. Например, положим . Тогда . Здесь и , очевидно, зависят друг от друга. Используя (2.7), находим , что, конечно, неверно — непосредственно из определения следует, что .
Отдельно стоит обсудить математическую структуру формулы (2.7). Если одна из погрешностей много больше другой, например, , то меньшей погрешностью можно пренебречь, . С другой стороны, если два источника погрешностей имеют один порядок , то и .
Эти обстоятельства важны при планирования эксперимента: как правило, величина, измеренная наименее точно, вносит наибольший вклад в погрешность конечного результата. При этом, пока не устранены наиболее существенные ошибки, бессмысленно гнаться за повышением точности измерения остальных величин.
Пример. Пусть , тогда , то есть при различии двух погрешностей более, чем в 3 раза, поправка к погрешности составляет менее 5%, и уже нет особого смысла в учёте меньшей погрешности: . Это утверждение касается сложения любых независимых источников погрешностей в эксперименте.
Выборочное среднее арифметическое значение , найденное по результатам измерений, само является случайной величиной. Действительно, если поставить серию одинаковых опытов по измерений, то в каждом опыте получится своё среднее значение, отличающееся от предельного среднего .
Вычислим среднеквадратичную погрешность среднего арифметического . Рассмотрим вспомогательную сумму слагаемых
Если есть набор независимых измерений одной и той же физической величины, то мы можем, применяя результат (2.7) предыдущего параграфа, записать
поскольку под корнем находится одинаковых слагаемых. Отсюда с учётом получаем
(2.8) |
Таким образом, погрешность среднего значения по результатам независимых измерений оказывается в раз меньше погрешности отдельного измерения. Это один из важнейших результатов, позволяющий уменьшать случайные погрешности эксперимента за счёт многократного повторения измерений.
Подчеркнём отличия между и :
величина — погрешность отдельного измерения — является характеристикой разброса значений в совокупности измерений , . При нормальном законе распределения примерно 68% измерений попадают в интервал ;
величина — погрешность среднего — характеризует точность, с которой определено среднее значение измеряемой физической величины относительно предельного («истинного») среднего ; при этом с доверительной вероятностью искомая величина лежит в интервале .
Пусть для некоторого результата измерения известна оценка его максимальной систематической погрешности и случайная среднеквадратичная погрешность . Какова «полная» погрешность измерения?
Предположим для простоты, что измеряемая величина в принципе может быть определена сколь угодно точно, так что можно говорить о некотором её «истинном» значении (иными словами, погрешность результата связана в основном именно с процессом измерения). Назовём полной погрешностью измерения среднеквадратичное значения отклонения от результата измерения от «истинного»:
Отклонение можно представить как сумму случайного отклонения от среднего и постоянной (но, вообще говоря, неизвестной) систематической составляющей :
Причём случайную составляющую можно считать независимой от систематической. В таком случае из (2.7) находим:
(2.9) |
Таким образом, для получения максимального значения полной погрешности некоторого измерения нужно квадратично сложить максимальную систематическую и случайную погрешности.
Если измерения проводятся многократно, то согласно (2.8) случайная составляющая погрешности может быть уменьшена, а систематическая составляющая при этом остаётся неизменной:
Отсюда следует важное практическое правило (см. также обсуждение в п. 2.3): если случайная погрешность измерений в 2–3 раза меньше предполагаемой систематической, то нет смысла проводить многократные измерения в попытке уменьшить погрешность всего эксперимента. В такой ситуации измерения достаточно повторить 2–3 раза — чтобы убедиться в повторяемости результата, исключить промахи и проверить, что случайная ошибка действительно мала. В противном случае повторение измерений может иметь смысл до тех пор, пока погрешность среднего не станет меньше систематической.
Косвенными называют измерения, полученные в результате расчётов, использующих результаты прямых (то есть «непосредственных») измерений физических величин. Сформулируем основные правила пересчёта погрешностей при косвенных измерениях.
Пусть в эксперименте измеряется величина , а её «наилучшее» (в некотором смысле) значение равно и оно известно с погрешностью . После чего с помощью известной функции вычисляется величина .
В качестве «наилучшего» приближения для используем значение функции при «наилучшем» :
Найдём величину погрешности . Обозначая отклонение измеряемой величины как , и пользуясь определением производной, при условии, что функция — гладкая вблизи , запишем
где — производная фукнции , взятая в точке . Возведём полученное в квадрат, проведём усреднение (, ), и затем снова извлечём корень. В результате получим
(2.10) |
Пример. Для имеем — при обращении величины сохраняется её относительная погрешность.
Упражнение. Найдите погрешность логарифма , если известны и .
Упражнение. Найдите погрешность показательной функции , если известны и . Коэффициент задан точно.
Пусть величина вычисляется по измеренным значениям нескольких различных независимых физических величин , , на основе известного закона . В качестве наилучшего значения можно по-прежнему взять значение функции при наилучших значениях измеряемых параметров:
Для нахождения погрешности воспользуемся свойством, известным из математического анализа, — малые приращения гладких функции многих переменных складываются линейно, то есть справедлив принцип суперпозиции малых приращений:
где символом обозначена частная производная функции по переменной — то есть обычная производная по , взятая при условии, что все остальные аргументы (кроме ) считаются постоянными параметрами. Тогда пользуясь формулой для нахождения дисперсии суммы независимых величин (2.7), получим соотношение, позволяющее вычислять погрешности косвенных измерений для произвольной функции :
(2.11) |
Это и есть искомая общая формула пересчёта погрешностей при косвенных измерениях.
Отметим, что формулы (2.10) и (2.11) применимы только если относительные отклонения всех величин малы (), а измерения проводятся вдали от особых точек функции (производные , не должны обращаться в бесконечность). Также подчеркнём, что все полученные здесь формулы справедливы только для независимых переменных , ,
Остановимся на некоторых важных частных случаях формулы (2.11).
Упражнение. Найти погрешность вычисления гипотенузы прямоугольного треугольника по измеренным катетам и .
По итогам данного раздела можно дать следующие практические рекомендации.
Как правило, нет смысла увеличивать точность измерения какой-то одной величины, если другие величины, используемые в расчётах, остаются измеренными относительно грубо — всё равно итоговая погрешность скорее всего будет определяться самым неточным измерением. Поэтому все измерения имеет смысл проводить примерно с одной и той же относительной погрешностью.
При этом, как следует из (2.13), особое внимание следует уделять измерению величин, возводимых при расчётах в степени с большими показателями. А при сложных функциональных зависимостях имеет смысл детально проанализировать структуру формулы (2.11): если вклад от некоторой величины в общую погрешность мал, нет смысла гнаться за высокой точностью её измерения, и наоборот, точность некоторых измерений может оказаться критически важной.
Следует избегать измерения малых величин как разности двух близких значений (например, толщины стенки цилиндра как разности внутреннего и внешнего радиусов): если , то абсолютная погрешность меняется мало, однако относительная погрешность может оказаться неприемлемо большой, если .