Учебное пособие по курсу «Математика»
Теорема Чебышева
-
Если случайные величины независимы и одинаково распределены с математическими ожиданиями и дисперсиями, ограниченными постоянным числом С, т.е. , то справедливо неравенство:
При n из неравенства теоремы Чебышева вытекает:
Закон больших чисел
Смысл закона больших чисел заключается в следующем. Хотя отдельные независимые случайные величины могут принимать значения далекие от своих математических ожиданий, среднее арифметическое достаточного большого числа случайных величин с большой, близкой к единице, вероятностью принимает значения весьма близкие к постоянному числу, равному математическому ожиданию этих величин.
Другими словами, отдельные случайные величины могут иметь значительный разброс, а их среднее арифметическое рассеяно мало.
ПРИМЕР: Номинальное значение диаметра втулки составляет 5 мм, а дисперсия, обусловленная погрешностью изготовления, не превосходит 0,01. Оцените вероятность того, что размер диаметра втулки будет отличаться от номинала не более, чем на 0,5 мм.
По теореме Чебышева:
1.6.3. Теорема Бернулли
Частным случаем закона больших чисел является теорема Бернулли.
Теорема Бернулли
Пусть имеется n испытаний по схеме Бернулли с вероятностью успеха р и q = 1 – p и m – число успехов, тогда для любого числа 0 справедливо неравенство: |
Из неравенства теоремы Бернулли следует закон больших чисел в форме Бернулли:
Теорема Бернулли утверждает, что относительная частота события А стремится к его вероятности, так что при больших n отклонение относительной частоты от вероятности становится сколь угодно малым. Эту теорему в некотором смысле можно считать обоснованием статистического определения вероятности.
ПРИМЕР: Сколько следует провести независимых испытаний, чтобы вероятность выполнения неравенства превысила 0,75, если вероятность появления данного события в одном испытании составляет 0,8?
По теореме Бернулли запишем:
1.6.4. Понятие о центральной предельной теореме
На практике выясняется, что многие случайные величины имеют нормальное распределение. Это обстоятельство во многом определяется тем, что каждую такую величину можно рассматривать как сумму большого числа случайных величин, имеющих самые разнообразные законы распределения, а такое суммирование приводит в итоге к нормальному распределению этой суммы.
Это свойство устанавливается доказанной русским математиком Ляпуновым центральной предельной теоремой.
Центральная предельная теорема
Если случайная величина Х представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то величина Х имеет распределение вероятностей, весьма близкое к нормальному распределению. |
ПРИМЕР: Пусть случайная величина Х – потребление электроэнергии в год в некотором городе. Очевидно, что суммарное потребление складывается из потребления электроэнергии отдельными потребителями, каждое из которых принимает случайные значения с разными законами распределения. Центральная предельная теорема утверждает, что и в этом случае, какое бы распределение не имели отдельные составляющие общегородского потребления, распределение этого общего, суммарного потребления (величины Х) будет близко к нормальному распределению.
Рекомендуемая литература по теме 1.6: [2, 4, 8, 9].
ВОПРОСЫ:
Какие значения может принимать случайная величина, для которой выполняется неравенство Маркова?
При каком условии справедливо неравенство Чебышева?
К чему стремится среднее значение случайных величин согласно закону больших чисел?
К чему стремится относительная частота события при неограниченном увеличении числа испытаний в схеме Бернулли?
Какое основное условие налагает центральная предельная теорема на составляющие суммарной случайной величины?
ТЕМА 1.7. Цепи Маркова
1.7.1. Понятие марковского случайного процесса
Пусть имеется некоторая физическая система S, состояние которой может меняться с течением времени. Заметим, что под такой системой можно понимать: любое техническое устройство, ремонтную мастерскую, компьютер, железнодорожный узел и т.п. Если состояние такой системы меняется во времени случайным, заранее непредсказуемым образом, то говорят: в данной системе протекает случайный процесс. Например, процесс функционирования компьютера, процесс обслуживания клиентов в ремонтной мастерской и т.п.
Случайный процесс, протекающий в системе S, называется марковским процессом, или процессом без последействия, если для каждого момента времени t0 вероятность любого состояния системы в будущем (при t > t0) зависит только от ее состояния в настоящем (при t = t0) и не зависит от того, когда и каким образом система пришла в это состояние.
Таким образом, в марковском случайном процессе будущее его протекание зависит только от настоящего его состояния и не зависит от “предыстории” процесса.
Марковский случайный процесс называется процессом с дискретными состояниями, если возможные состояния системы можно перечислить, или пронумеровать, а сам этот процесс состоит в том, что время от времени система скачком (мгновенно) перескакивает из одного состояние в другое.
ПРИМЕР: Пусть некоторое техническое устройство состоит из двух узлов, каждый из которых в процессе работы устройства может отказать. Возможные состояния системы: S1 – оба узла работают; S2 – первый узел отказал, а второй работает; S3 – отказал второй узел, а первый работает; S4 – оба узла отказали. Можно считать, что в данной системе протекает марковский случайный процесс с дискретными состояниями, а переход системы из одного состояние в другое происходит мгновенно по мере отказа узлов устройства.
При анализе случайных процессов с дискретными состояниями удобно пользоваться геометрической схемой – графом состояний, на котором квадратами изображают возможные состояния системы, а возможные переходы системы – стрелками, соединяющими эти квадраты. На рис. 1.7. представлен граф состояний системы предыдущего примера.
1.7.2. Цепь Маркова с дискретным временем
Способы математического описания марковского случайного процесса, протекающего в системе с дискретными состояниями, существенно зависят от того, в какие моменты времени происходят переходы (скачки) системы из состояния в состояние.
Марковский случайный процесс называется процессом с дискретным временем, если переходы системы из состояния в состояние возможны только в определенные, заранее фиксированные, моменты времени t1, t2, …. Причем в промежутках времени между этими моментами система сохраняет свое состояние.
Эти заранее известные моменты времени принято называть шагами процесса и рассматривать случайный процесс, происходящий в системе, как функцию целочисленного аргумента – номера шага k.
Пусть имеется система S, которая имеет возможные состояния . Обозначим как событие, состоящее в том, что после k шагов система находится в состоянии . Обозначим вероятность события через и назовем эту вероятность – вероятностью i-го состояния после k-го шага. Очевидно, что для любого шага k события образуют полную группу, т.к. система может находиться только в одном из своих состояний, поэтому можно записать: .
Случайная последовательность событий называется цепью Маркова, если для каждого шага вероятность перехода системы из любого состояния в любое состояние не зависит от того, когда и каким образом система пришла в состояние .
Вероятности перехода системы из любого состояния в любое состояние за один шаг можно записать в виде квадратной матрицы переходных вероятностей . В этой матрице некоторые элементы могут быть равны нулю, что означает невозможность перехода системы из i-го состояния в j-е, а на главной диагонали располагаются вероятности задержки системы в состоянии .
Цепь Маркова называется однородной, если переходные вероятности не зависят от номера шага, т.е. не изменяются от шага к шагу. В противном случае цепь Маркова называется неоднородной.
Для определения вероятностей состояний системы после любого k-го шага используется формула, которая называется равенством Маркова:
Как следует из этой формулы, вероятности состояний системы после k-го шага определяются через вероятности состояний после предыдущего (k – 1)-го шага. При проведении практических расчетов чаще используется равенство Маркова, записанное в матричной форме:
-
,
где матрица-строка вероятностей состояний после (k – 1)-го шага, а матрица-столбец искомых вероятностей после k-го шага.
ПРИМЕР: Найдите вероятности состояний после 2 шага некоторой системы, для которой известно, что в начальный момент она находится в состоянии , а матрица переходных вероятностей имеет вид:
Согласно условию, для начального момента (k = 0) запишем: . Для вероятностей состояний системы после первого шага, используя равенство Маркова в матричной форме, можно записать:
Искомые вероятности состояний после второго шага будут равны:
Таким образом, после второго шага вероятнее всего система будет находиться в состоянии .
1.7.3. Цепь Маркова с непрерывным временем
Марковский случайный процесс называется процессом с непрерывным временем, если переходы системы из состояния в состояние возможны в любой, заранее неизвестный, случайный момент времени. Модель такого процесса называют цепью Маркова с непрерывным временем.
В случае непрерывной цепи Маркова для отыскания вероятностей состояний системы в любой момент времени t, т.е. функций , вместо вероятностей перехода используют плотности вероятностей перехода системы из состояния в состояние , которые определены только когда . Эти плотности вероятностей указывают на размеченном графе состояний системы над стрелками возможных переходов.
Используя размеченный граф состояний, составляется система дифференциальных уравнений Колмогорова, решениями которой и являются функции вероятностей состояний от времени. При составлении системы таких уравнений полезно пользоваться следующими правилами:
Правила составления системы дифференциальных уравнений Колмогорова
Левая часть каждого уравнения содержит производную вероятности того состояния, для которого записывается уравнение.
Правая часть каждого уравнения содержит столько слагаемых, сколько стрелок связано с данным состоянием.
Если стрелка исходит из состояния, то соответствующее этой стрелке слагаемое в правой части имеет знак “минус”, если же стрелка входит в данное состояние, то – знак “плюс”.
Каждое слагаемое правой части уравнения есть произведение плотности вероятности перехода, соответствующей данной стрелке, на вероятность того состояния, из которого исходит данная стрелка.
Алгоритм решения системы дифференциальных уравнений Колмогорова можно найти в пособии [2].
ПРИМЕР: В некоторой системе с тремя состояниями протекает марковский случайный процесс с непрерывным временем. Составьте систему дифференциальных уравнений Колмогорова, используя размеченный граф состояний системы, представленный на рис. 1.8.
Используя размеченный граф состояний системы и правила, перечисленные выше, найдем:
или, окончательно:
Рекомендуемая литература по теме 1.7: [2, 10].
ВОПРОСЫ:
Что отличает марковский случайный процесс с дискретными состояниями от других случайных процессов?
В какие моменты времени могут происходить переходы системы из состояния в состояние для цепи Маркова с дискретным временем?
Какие вероятности можно найти, используя равенство Маркова?
В какие моменты времени могут происходить переходы системы из состояния в состояние для цепи Маркова с непрерывным временем?
С помощью чего отыскиваются вероятности состояний для цепи Маркова с непрерывным временем?
РАЗДЕЛ 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Предметом математической статистики является изучение случайных событий и случайных величин по результатам наблюдений. Статистической совокупностью называется совокупность предметов или явлений, объединенных каким-либо признаком. Результатом наблюдений над статистической совокупностью являются статистические данные – сведения о том, какие значения принял в итоге наблюдений интересующий нас признак.
Обработка статистических данных методами математической статистики приводит к установлению определенных закономерностей, присущих массовым явлениям. При этом достоверность статистических выводов повышается с ростом числа наблюдений.
Статистические данные, как правило, представляют собой некоторый ряд значений случайной величины Х. Исследование случайной величины начинается с обработки этого ряда значений. Затем строятся функции, характеризующие эту случайную величину, и называемые статистиками.
Следовательно, статистика – это функция , которая каждому набору значений случайной величины поставляет по некоторому правилу действительное число.
В теоретических исследованиях удобно рассматривать статистику Т как функцию от случайных величин , имеющих такое же распределение, как и случайная величина Х, т.е.: .
Таким образом, всякую случайную величину Х можно рассматривать как набор одинаково распределенных случайных величин . В такой трактовке статистика становится случайной величиной, а изучение ее распределения приводит к выводам о распределении случайной величины Х.
ПРИМЕР: Пусть Х – нормально распределенная случайная величина и имеется n ее наблюдений . Простейшей статистикой этой случайной величины является ее среднее значение: Тогда вместе со случайной величиной Х возникает набор случайных величин и новая случайная величина:
ТЕМА 2.1. Вариационные ряды и их характеристики
2.1.1. Генеральная и выборочная совокупности
Генеральной совокупностью называется совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе.
В математической статистике понятие генеральной совокупности часто отождествляют с понятием случайной величины (законом распределения вероятностей).
В зависимости от количества объектов генеральная совокупность может быть конечной или бесконечной.
Объемом генеральной совокупности называется число объектов (наблюдений).
Выборочной совокупностью или выборкой называется часть объектов генеральной совокупности, случайно отобранных из нее и предназначенных для исследования.
Объемом выборки называется число объектов (наблюдений) в нее входящих.
Сущность выборочного метода в математической статистике заключается в том, чтобы по определенной части генеральной совокупности (выборке) судить о ее свойствах в целом.
Выборочный метод является единственно возможным в случае бесконечной генеральной совокупности или когда исследование связано с уничтожением наблюдаемых объектов (например, исследование предельных режимов работы приборов, исследование воздействия вируса на подопытных животных и т.д.).
Для того чтобы по выборке можно было адекватно судить о случайной величине, выборка должна быть репрезентативной (представительной). Репрезентативность выборки обеспечивается объемом выборки и случайностью отбора ее элементов, т.е. все элементы генеральной совокупности должны иметь одинаковую вероятность попадания в выборку.
Существуют два способа образования выборки (отбора объектов из генеральной совокупности):
повторная выборка, когда каждый элемент, случайно отобранный и исследованный, возвращается в генеральную совокупность и может быть отобран повторно;
бесповторная выборка, когда элемент, случайно отобранный и исследованный, не возвращается в генеральную совокупность.
2.1.2. Вариационный ряд и его графические изображения
Пусть некоторый признак генеральной совокупности описывается случайной величиной Х. Если из генеральной совокупности извлечь выборку объема n, то элементы выборки будут представлять собой значения случайной величины Х.
На начальном этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел по возрастанию.
Вариантами называются различные элементы выборки.
Частотой варианты называется число , показывающее, сколько раз эта варианта встречается в выборке.
Относительной частотой или долей варианты в выборке объема n называется число .
Частоты и относительные частоты называются весами.
Пусть х некоторое число, тогда количество вариант , значения которых меньше х, называется накопленной частотой.
Отношение накопленной частоты к объему выборки называется накопленной относительной частотой .
Вариационным рядом называется ряд вариант, расположенных в порядке возрастания их значений, с соответствующими весами.
Дискретным называется вариационный ряд, представляющий собой выборку значений дискретной случайной величины. Обычно дискретный вариационный ряд записывают в виде таблицы:
-
Варианты
…
Частоты
…
Непрерывным (интервальным) называется вариационный ряд, который представляет собой выборку значений непрерывной случайной величины.
Для построения интервального вариационного ряда разбивают множество значений вариант на полуинтервалы , т.е. производят их группировку. Оптимальное количество интервалов k рекомендуется определять по формуле Стерджесса: При этом длина интервала будет равна: Подсчитывая число значений, попавших в ый полуинтервал, получим значения частот . При этом, если варианта находится на границе интервала, ее причисляют к правому интервалу.
В результате получают интервальный ряд, который записывают в виде таблицы:
-
Варианты
…
Частоты
…
Для наглядности представления используют графические изображения вариационных рядов в виде полигона, гистограммы и кумуляты.
Полигон служит для изображения дискретного вариационного ряда и представляет собой ломаную, соединяющую точки с координатами . Для интервального ряда также строится полигон, только его ломаная соединяет точки , где .
Гистограмма служит только для представления интервальных вариационных рядов и имеет вид ступенчатой фигуры из прямоугольников с основаниями, равными длине интервалов , и высотами, равными частотам соответствующих интервалов.
Кумулята представляет собой ломаную, соединяющую точки с координатами для дискретного ряда, или точки с координатами для интервального ряда.
Эмпирической функцией распределения называется функция, значение которой в точке х равно накопленной относительной частоте, т.е. .
Для интервального ряда указываются не конкретные значения вариант, а только их частоты на интервалах. В этом случае эмпирическая функция распределения будет определена только на концах интервалов, и ее можно изобразить ломаной, проходящей через точки .
Эмпирической плотностью распределения непрерывного вариационного ряда называется функция
ПРИМЕРЫ:
1. В магазине за день продано 45 пар мужской обуви. Имеется выборка значений случайной величины Х – размера обуви:
39, 41, 40, 42, 41, 40, 42, 44, 40, 43, 42, 41, 43, 39, 42,
41, 42, 39, 41, 37, 43, 41, 38, 43, 42, 41, 40, 41, 38, 44,
40, 39, 41, 40, 42, 40, 41, 42, 40, 43, 38, 39, 41, 41, 42.
Построить дискретный вариационный ряд, полигон, кумуляту и эмпирическую функцию распределения.
Различные значения признака располагаем в порядке их возрастания и под каждым из этих значений записываем его частоту. В результате вариационный ряд имеет вид:
-
37
38
39
40
41
42
43
44
1
3
5
8
12
9
5
2
Полигон этого распределения изображен на рис. 2.1.
По данным вариационного ряда находим накопленные частоты и относительные частоты и заносим полученные значения в таблицу:
-
37
38
39
40
41
42
43
44
45
0
1
4
9
17
29
38
43
45
0
0,022
0,089
0,2
0,378
0,644
0,844
0,978
1
По данным полученной таблицы строим кумуляту (рис. 2.2) и эмпирическую функцию распределения (рис. 2.3).
2. Результаты измерений отклонений от номинала диаметров 50 подшипников дали численные значения (в микронах):
-1,752 -0,291 -0,933 -0,450 0,512 -1,256 1,701 0,634 0,720 0,490
1,531 -0,433 1,409 1,730 -0,266 -0,058 0,248 -0,095 -1,488 -0,361
0,415 -1,382 0,129 -0,361 -0,087 -0,329 0,086 0,130 -0,244 -0,882
0,318 -1,087 0,899 1,028 -1,304 0,349 -0,293 -0,883 -0,056 0,757
-0,059 -0,539 -0,078 0,229 0,194 -1,084 0,318 0,367 -0,992 0,529.
Для данной выборки построить интервальный вариационный ряд, полигон, гистограмму, графики эмпирической функции распределения и эмпирической плотности распределения.
По данным выборки находим: . Разобьем множество значений на интервалы. Количество интервалов найдем по формуле Стерджесса: Начало первого интервала , а конец последнего седьмого интервала . При этом варианту отнесем в первый интервал. Длина интервалов будет равна:
.
Подсчитав число вариант, попадающих в каждый интервал, получим таблицу вариационного ряда:
[ai, ai+1) | [-1,75; -1,25) | [-1,25; -0,75) | [-0,75; -0,25) | [-0,25; 0,25) | [0,25; 0,75) | [0,75; 1,25) | [1,25; 1,75) |
| 5 | 8 | 9 | 12 | 9 | 3 | 4 |
По данным таблицы строим полигон и гистограмму распределения (рис. 2.4).
Для построения эмпирической функции распределения вычислим относительные накопленные частоты и составим таблицу:
| -1,75 | -1,25 | -0,75 | -0,25 | 0,25 | 0,75 | 1,25 | 1,75 |
| 0 | 0,1 | 0,26 | 0,44 | 0,68 | 0,86 | 0,92 | 1 |
Найдем значения эмпирической плотности вероятности для каждого интервала по формуле: и составим таблицу:
[ai, ai+1) | [-1,75; -1,25) | [-1,25; -0,75) | [-0,75; -0,25) | [-0,25; 0,25) | [0,25; 0,75) | [0,75; 1,25) | [1,25; 1,75) |
| 0,2 | 0,32 | 0,36 | 0,48 | 0,36 | 0,12 | 0,16 |
На рис. 2.5 изображена эмпирическая функция распределения, а на рис. 2.6 – эмпирическая плотность распределения.
2.1.3. Числовые характеристики вариационных рядов
Основной числовой характеристикой вариационного ряда является его средняя арифметическая, называемая также выборочной средней.
Для дискретного вариационного ряда выборочная средняя вычисляется по формуле:
Для интервального ряда за принимают середину го интервала, а выборочную среднюю вычисляют по формуле:
Вариационным размахом называется число
Выборочной дисперсией называется средняя арифметическая квадратов отклонений вариант от их выборочной средней:
Выборочная дисперсия обладает теми же свойствами, что и дисперсия случайной величины.
Пусть значения выборки разбиты на k групп. Обозначим через количество различных вариант в ой группе, через частоту ой варианты в этой группе. Тогда ую группу можно записать в виде: , при этом значение повторяется раз. Обозначим через групповые средние:
Тогда групповые дисперсии будут равны:
Средняя арифметическая групповых дисперсий будет равна:
Межгрупповая дисперсия равна:
Правилом сложения дисперсий называется равенство:
Еще одной мерой вариации признака является выборочное среднее квадратическое отклонение, которое определяется как корень квадратный из выборочной дисперсии.
При статистическом анализе рассматривается также коэффициент вариации, равный процентному отношению выборочного среднего квадратического отклонения к выборочной средней:
ПРИМЕР: В таблице приведены данные об урожайности ржи на различных участках поля:
Урожайность ржи, ц/га | [9-12] | [12-15] | [15-18] | [18-21] | [21-24] | [24-27] |
Доля участка в общей площади, % | 6 | 12 | 33 | 22 | 19 | 8 |
Найти размах вариации, выборочную дисперсию и коэффициент вариации признака Х – урожайности ржи.
Используя приведенные выше формулы, последовательно найдем:
Таким образом, выборочная дисперсия равна 15,3, следовательно выборочное среднее квадратическое отклонение равно и коэффициент вариации:
Рекомендуемая литература по теме 2.1: [2, 4, 5, 11].
ВОПРОСЫ:
В чем различие между выборочной и генеральной совокупностями?
Как можно из частоты варианты получить ее относительную частоту?
Какие величины составляют вариационный ряд?
Как связаны значения эмпирической функции распределения с накопленными частотами?
Как определяются выборочные средние для дискретного и интервального вариационных рядов?
Может ли выборочная дисперсия быть отрицательной?
страница 1 ... страница 3страница 4страница 5страница 6страница 7 ... страница 12страница 13
скачать
Другие похожие работы: