Тема: Статистические оценки
Для сдачи: 5 вопросов + 3 учебные задачи
Ограничения: 1 набор вопросов может сдать 2 человека, 1 набор задач может сдать 1 человек
Вопросы:
- Какая оценка называется состоятельной, несмещенной и эффективной?
- Могут ли быть случаи, когда можно сделать интервальную оценку, но нельзя точечную?
- При каком распределении логарифм функции правдоподобия имеет вид параболы?
- Как связаны метод наименьших квадратов, метод хи-квадрата и метод максимума правдоподобия?
- В каких случаях эффективность оценки хи-квадрат и оценки методом максимума правдоподобия будут отличаться? В какую сторону?
- Согласно телефонным опросам в президентских выборах в США (1936) должен был победить республиканец Альфред Лэндон, но с огромным отрывом победил демократ Франклин рузвельт, хотя этот же опрос в выборах ранее правильно предсказал победу республиканцев. Объясните, что не так с этим опросом, каким свойством обладает его оценка.
Задачи:
Учебные:
- При обработке
...
- данных в
...
- питоне основным пунктом является
...
- их фитирования. Наиболее часто используется curve_fit. Чтобы он выдавал правильные результаты, надо понимать
...
- специфику документации, для этого изучите ее. Затем сгенерируйте данные, используя нормальное распределение для генерации ошибки и полином 4 степени. Проведите
...
- своеобразный эксперимент с фитом: используйте полиномы большей, например 10-й, и меньшей, например 2-й, степени, подавайте
...
- разные параметры
...
...
- : границы, ошибки, начальное положение.
- Пусть с помощью сцинтиллятора вы
...
- измерили некий спектр, у которого есть два пика, данные можно смоделировать с помощью двух Гауссов (обоснуйте, почему можно использовать нормальное распределение). Сравните с заданными сигмами
...
- ширины на полувысотах пиков и значения, полученные с помощью фитирования. Получите точечные и интервальные оценки положений пиков.
Рассмотрим процесс
, для которого угловое распределение мюонов имеет видLaTeX Math Inline body --uriencoded--e%5e+e \rightarrow \mu%5e+\mu%5e-
угол рассеяния. Допустим, что в данных заложена гауссова ошибка. Сгенерируйте данные, самостоятельно реализуйте Метод Максимального Правдоподобия и получите оценки параметров (истинными можно взять 0.5 и 0.5)LaTeX Math Inline body --uriencoded--f(x; \alpha, \beta) = \frac %7B1+\alpha x + \beta x%5e2%7D%7B2+2\beta /3%7D, \, x = \cos(\theta), \, \theta \, - - Постройте функцию правдоподобия для распределения Бернулли, данные сгенерируйте с помощью Бернулли, 1 будет соответствовать удачному испытанию, а 0 - неудачному. Постройте графики функции правдоподобия, логарифмической функцию правдоподобия, ее производной и ее вторую, на однин график следует нанести функции для нескольких сгенерированных выборок, например, 100, чтобы увидеть, какой разброс. Графики также лучше строить около "истинного" параметра
, проделать процедуру можно для нескольких параметров. Подумайте, как полученные картинки можно сопоставить с информацией о параметреLaTeX Math Inline body \theta
.LaTeX Math Inline body \theta - Данные это набор точек (x,y, yErr) вида подложка + пик. Определите положение и амплитуду пика и постройте доверительные интервалы (как минимум для положения).
Научные:
- Скачайте данные из гугл диска. Они представляют собой сигналы SiPM, который был соединен со сцинтиллятором, регистрирующим протоны в ускорителе. Для загрузки используйте data = np.load('raw_data_0.npy'), каждая строка соответствует сигналу, то есть data[0] будет первым сигналом. Вам надо профитировать каждый сигнал, использовать можно аппроксимацию распределения Ландау. Так как сигналов много, то визуально все не проверить, а еще есть явно кривые сигналы, которые стоит отбросить. Для этого возьмите некую характеристику качества фита и постройте ее распределение по построенным фитам.