Педагогическая копилка_физика

Содержание
Введение
1.Нормальное распределение.
2.Точечные оценки параметров распределения.
3.Гистограмма
4. Обработка данных наблюдений с помощью
метода наименьших квадратов

Введение
Метод статистического моделирования дает возможность конструировать для ряда важных задач алгоритмы, хорошо приспособленные к реализации на компьютерах. Под этим названием подразумевают численные методы решения математических задач при помощи моделирования случайных величин и процессов. Основная идея метода – связь между вероятностными характеристиками различных случайных процессов (вероятностями случайных событий или математическими ожиданиями случайных величин) и величинами, являющимися решениями задач математического анализа (значениями интегралов, решениями дифференциальных уравнений и т.п.).
Цель курсовой работы: изучить особенности решения некоторых статистических задач математического моделирования с помощью пакета математических расчётов Mathcad.
Актуальностью данного изучения заключается в том, что метод статистического моделирования даёт возможность оптимизировать процессы разработки, отладки и настройки различных вычислительных систем.
1.Нормальное распределение.
   Говорят, что случайная величина  нормально распределена или подчиняется закону распределения Гаусса, если ее плотность распределения  имеет вид

(

   где a - любое действительное число, а >0. Смысл параметров a и  будет установлен в дальнейшем. Исходя из связи между плотностью распределения  и функцией распределения F(x), имеем

   График функции  симметричен относительно прямой x=a. Несложные исследования показывают, что функция  достигает максимума при x=a, а ее график имеет точки перегиба при  и . При  график функции асимптотически приближается к оси Ox. Можно показать, что при увеличении  кривая плотности распределения становится более пологой. Наоборот, при уменьшении  график плотности распределения сжимается к оси симметрии. При a=0 осью симметрии является ось Oy. На рис. 11 изображены два графика функции y=. График I соответствует значениям a=0, =1, а график II - значениям a=0, =1/2.   

   Покажем, что функция  удовлетворяе условию, т.е. при любых a и  выполняется соотношение

   В самом деле, сделаем в этом интеграле замену переменной, полагая . Тогда

   В силу четности подинтегральной функции имеем

   Следовательно,

   Но,

   В результате получим

(

   Найдем вероятность . По формуле имеем

   Сделаем в этом интеграле замену переменной, снова полагая . Тогда ,  и

(

   Как мы знаем, интеграл  не берется в элементарных функциях. Поэтому для вычисления определенного интеграла вводится функция

(

   называемая интегралом вероятностей. Для этой функции составлены таблицы ее значений для различных значений аргумента. Получим


   Итак,

(

   Легко показать, что функция Ф(х) (интеграл вероятностей) обладает следующими свойствами.     1°. Ф(0)=0     2°. ; при  величина  практически равна 1/2 
   3°. Ф(-x)=-Ф(х), т.е. интеграл вероятностей является нечетной функцией.     График функции Ф(х) изображен на рис.. 

   Таким образом, если случайная величина  нормально распределена с параметрами a и , то вероятность того, что случайная величина удовлетворяет неравенствам , определяется соотношением.     Пусть >0. Найдем вероятность того, что нормально распределенная случайная величина  отклонится от параметра a по абсолютной величине не более, чем на , т.е. .     Так как неравенство  равносильно неравенствам , то полагая в соотношении (32) ,  получим

   Вследствие того, что интеграл вероятностей - нечетная функция, имеем

(



2.      Точечные оценки параметров распределения.
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки, полученные в результате n наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая значения количественного признака как независимые случайные величины, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения - это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.
 Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям: оценка должна быть несмещенной, эффективной и состоятельной.
Поясним каждое из понятий.
  Несмещенной называют статистическую оценку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т. е.
M(Q*) = Q.
 Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую  возможную дисперсию.
При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при п стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при п  стремится к нулю, то такая оценка оказывается и состоятельной.
Рассмотрим точечные оценки параметров распределения, т.е.
оценки, которые определяются одним числом Q* =f( x1, x2,,xn), где x1, x2,,xn- выборка.





3.Гистограмма
Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.
Гистограмма это способ графического изображения интервальных распределений вариант при непрерывном варьировании признака. Гистограмма распределения применяется только для изображения интервального вариационного ряда.
Гистограмма представляет собой столбчатый график, построенный по полученным за определенный период (например, за неделю или за месяц) данным, которые разбиваются на несколько интервалов; число данных, попадающих в каждый из интервалов (частота), выражается высотой столбика.
Данные для построения гистограммы собирают в течение длительного периода - недели, месяца, года и т. д.
Гистограмма – это серия столбиков одинаковой ширины, но разной высоты, показывающая рассеяние и распределение данных. Ширина столбика – это интервал в диапазоне наблюдений, высота – количество данных, приходящихся на тот или иной интервал, т.е. частость. По существу, гистограмма отображает распределение исследуемого показателя. Гистограмма позволяет оценить характер рассеивания показателя и разобраться в том, на чём следует сосредоточить усилия по улучшению.
Гистограмму используют для изображения только интервальных рядов.
Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд такого признака называетсяинтервальным .




Таблица
Общий вид интервального вариационного ряда частот
Интервалы
ai-ai+1

a1-a2
a2-a3

an-an+1

Частоты
mi

m1
m2

mn


Таблица
Общий вид интервального вариационного ряда частостей
Интервалы
ai-ai+1

a1-a2
a2-a3

an-an+1

Частости
wi

w1
w2

wn

Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности (ai-ai+1) называютсячастичными интервалами или интервальными разностями.
Для того чтобы интервальный вариационный ряд не был громоздким и в то же время позволял выявить характерные черты изменения значений случайной величины, обычно число частичных интервалов выбирают от 7 до 10. Длина частичного интервала (интервальная разность) зависит от размаха варьирования и выбранного числа интервалов 

Если окажется, что h – дробное число, то за длину частичного интервала следует брать либо ближайшее целое число, либо ближайшую простую дробь.
Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i-го интервала принимают за вариант xi, а соответствующую интервальную частоту mi– за частоту этого интервала.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению   (плотность частоты). Площадь частичного i-го прямоугольника равна  - сумме частот вариант, попавших в i-ый интервал. Площадь гистограммы частот равна сумме всех частот, т.е. объему выборки n
Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения, который будет являться выборочным аналогом дифференциальной функции распределения f(x).
Гистограммой относительных частотназывают ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению  (плотность относительной частоты). Площадь частичного i-го прямоугольника равна  - сумме относительных частот вариант, попавших в i - ый интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Характерные типы гистограмм показаны на рис. .





 
Рис. Характерные типы гистограмм
На рис.,а показан обычный тип гистограммы с двусторонней симметрией, что указывает на стабильность процесса.
На рис.,б в распределении имеется два пика (двугорбая гистограмма). Такая гистограмма получается при объединении двух распределений, например, в случае двух видов сырья, изменения настройки процесса или объединения в одну партию изделий, обработанных на двух разных станках. Требуется расслоение продукции.
На рис.,в показана гистограмма с обрывом. Такое распределение получается, когда невозможно получить значение ниже (или выше) некоторой величины. Подобное распределение имеет место также, когда из партии исключены все изделия с показателем ниже (и/или выше) нормы, т.е. изначально это была партия с большим количеством дефектных изделий. Такое же распределение получается, когда измерительные приборы были неисправны.
На рис.,г показана гистограмма с островком. Получается при ошибках в измерениях, или когда некоторое количество дефектных изделий перемешано с доброкачественными.
На рис.,д показана гистограмма с прогалами («гребёнка»). Получается, когда ширина интервала не кратна единице измерения или при ошибках оператора.
На рис.,е показана гистограмма в форме плато. Получается, когда объединяются несколько распределений при небольшой разнице средних значений. В этом случае требуется расслоение.
 
4. Обработка данных наблюдений с помощью
метода наименьших квадратов
 
Пусть в результате наблюдений получена таблица значений параметра при изменении другого параметра в заданных пределах. Требуется установить зависимость . Для этого наносят на плоскость Y0X точки, координаты которых соответствуют значениям данных наблюдений, и проводят кривую, как можно ближе расположенную ко всем точкам. По внешнему виду этой кривой записывают ее аналитическое выражение в общем виде, т.е. в виде функции .
Вматематикезамена истинной зависимости некоторой приближенной , при которой отклонение от на рассматриваемом отрезке было бы возможно малым, называется аппроксимацией. Функция называется аппроксимирующей функцией. Следовательно, задача сводится к установлению аппроксимирующей функции . Для аппроксимации абсолютных частот (пример 4.4) принимаем функцию вида:
 
Возникает задача определения коэффициентов наилучшим образом, т.е. установления таких значений этих параметров, при которых построенная кривая имела бы минимальные отклонения от всех точек наблюдений.
Существует много методов определения параметров аппроксимирующей функции, но чаще всего используют метод наименьших квадратов. Рассмотрим суть этого метода.
Запишем разность между значениями аппроксимирующей функции и таблично заданной функцией для каждого таблично заданного :
 
Эта разность называется отклонением аппроксимирующей функции от соответствующего табличного значения. В методе наименьших квадратов сводят к минимуму сумму квадратов отклонений, т.е.
 
где n - количество данных наблюдений.
Условие минимума суммы самих отклонений, а не их квадратов, не решает проблемы, так как сумма отклонений может быть очень малой и тогда, когда отдельные отклонения очень велики, но имеют разные знаки и взаимно компенсируют друг друга.
Так как и известны, то сумма есть функция параметров Обозначим ее через Эта сумма всегда положительна и имеет минимум. Для рассматриваемого случая сумма имеет вид:
 
Выражение (4.4) представляет собой математическую запись метода наименьших квадратов.
Для оценки согласованности полученной функции с данными наблюдений используют среднеквадратичную ошибку
 
Если , то аппроксимирующая функция согласуется с данными наблюдений. Здесь - допустимая погрешность аппроксимации.


Приложенные файлы


Добавить комментарий