Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Тема: Статистические оценки

Для сдачи: 5 вопросов + 3 учебные задачи

Ограничения: 1 набор вопросов может сдать 2 человека, 1 набор задач может сдать 1 человек

Вопросы:

  1. Какая оценка называется состоятельной, несмещенной и эффективной?
  2. Могут ли быть случаи, когда можно сделать интервальную оценку, но нельзя точечную?
  3. При каком распределении логарифм функции правдоподобия имеет вид параболы?
  4. Как связаны метод наименьших квадратов, метод хи-квадрата и метод максимума правдоподобия?
  5. В каких случаях эффективность оценки хи-квадрат и оценки методом максимума правдоподобия будут отличаться? В какую сторону?
  6. Согласно телефонным опросам в президентских выборах в США (1936) должен был победить республиканец Альфред Лэндон, но с огромным отрывом победил демократ Франклин рузвельт, хотя этот же опрос в выборах ранее правильно предсказал победу республиканцев. Объясните, что не так с этим опросом, каким свойством обладает его оценка.

Задачи:

Учебные:

  1. При обработке

...

  1. данных в

...

  1. питоне основным пунктом является

...

  1. их фитирования. Наиболее часто используется curve_fit. Чтобы он выдавал правильные результаты, надо понимать

...

  1. специфику документации, для этого изучите ее. Затем сгенерируйте данные, используя нормальное распределение для генерации ошибки и полином 4 степени. Проведите

...

  1. своеобразный эксперимент с фитом: используйте полиномы большей, например 10-й, и меньшей, например 2-й, степени, подавайте

...

  1. разные параметры

...

  1. в curve_fit

...

  1. : границы, ошибки, начальное положение.
  2. Пусть с помощью сцинтиллятора вы

...

  1. измерили некий спектр, у которого есть два пика, данные можно смоделировать с помощью двух Гауссов (обоснуйте, почему можно использовать нормальное распределение). Сравните с заданными сигмами

...

  1. ширины на полувысотах пиков и значения, полученные с помощью фитирования. Получите точечные и интервальные оценки положений пиков.
  2. Рассмотрим процесс  

    LaTeX Math Inline
    body--uriencoded--e%5e+e \rightarrow \mu%5e+\mu%5e-
    , для которого угловое распределение мюонов имеет вид  
    LaTeX Math Inline
    body--uriencoded--f(x; \alpha, \beta) = \frac %7B1+\alpha x + \beta x%5e2%7D%7B2+2\beta /3%7D, \, x = \cos(\theta), \, \theta \, -
    угол рассеяния. Допустим, что в данных заложена гауссова ошибка. Сгенерируйте данные, самостоятельно реализуйте Метод Максимального Правдоподобия и получите оценки параметров (истинными можно взять 0.5 и 0.5)

  3. Постройте функцию правдоподобия для распределения Бернулли, данные сгенерируйте с помощью Бернулли, 1 будет соответствовать удачному испытанию, а 0 - неудачному. Постройте графики функции правдоподобия, логарифмической функцию правдоподобия, ее производной и ее вторую, на однин график следует нанести функции для нескольких сгенерированных выборок, например, 100, чтобы увидеть, какой разброс. Графики также лучше строить около "истинного" параметра
    LaTeX Math Inline
    body\theta
    , проделать процедуру можно для нескольких параметров. Подумайте, как полученные картинки можно сопоставить с информацией о параметре 
    LaTeX Math Inline
    body\theta
    .
  4. Данные это набор точек (x,y, yErr) вида подложка + пик. Определите положение и амплитуду пика и постройте доверительные интервалы (как минимум для положения).

Научные:

  1. Скачайте данные из гугл диска.  Они представляют собой сигналы SiPM, который был соединен со сцинтиллятором, регистрирующим протоны в ускорителе. Для загрузки используйте data = np.load('raw_data_0.npy'), каждая строка соответствует сигналу, то есть data[0] будет первым сигналом.  Вам надо профитировать каждый сигнал, использовать можно аппроксимацию распределения Ландау. Так как сигналов много, то визуально все не проверить, а еще есть явно кривые сигналы, которые стоит отбросить. Для этого возьмите некую характеристику качества фита и постройте ее распределение по построенным фитам.