Ответ на примечание Александра Шеня

Мебэйн У.

Аннотация

Ответ на примечание Александра Шеня "О функции правдоподобия и работе Кирилла Калинина "Валидация конечной смешанной модели с использованием квазиэкспериментальных и географических данных"


Александр Шень пишет: «задаваемая им функция параметров \(f_0, f_i, f_e\) определена на треугольнике \(f_0 + f_i + f_e = 1, f_0; f_i; f_e \geq 0\) и является там линейной». Максимизируемое выражение (из [5]) не является функцией \(f_0\), \(f_i\) и \(f_e\). Эти «вероятности» являются функциями правдоподобия и тем самым зависят от оценок значений всех других параметров. Например, в случае, когда учитываются как «умеренные», так и «экстремальные» фальсификации, код на R, реализующий рассматриваемый метод в соответствии с [1, 2, 4, 6], итеративно вычисляет следующие выражения до достижения стабильных значений, максимизирующих функцию правдоподобия:

\(F = (1-f_{\mathrm{i}}-f_{\mathrm{e}})F_0 + f_{\mathrm{i}}F_I + f_{\mathrm{e}}F_E \)

\(h_0 = (1-f_{\mathrm{i}}-f_{\mathrm{e}})F_0/F \)

\( h_I = f_{\mathrm{i}}F_I/F \)

\(h_E = f_{\mathrm{e}}F_E/F \)

\(f_{\mathrm{i}} = \text{mean}(h_I) \)

\(f_{\mathrm{e}} = \text{mean}(h_E)\)

где \(F_0\), \(F_I\) и \(F_E\) - векторы длины \(n\) (количество наблюдений), элементами которых являются значения функции правдоподобия для отдельных наблюдений. \(h_0\), \(h_I\) и \(h_E\) - также векторы длины \(n\); частные \(F_0/F\), \(F_I/F\) и \(F_E/F\) вычисляются поэлементно. Максимизируемая функция правдоподобия есть \(\sum_{i=1}^n(\log(h_0F_0 + h_IF_I + h_EF_E))\), где \(h_0F_0\), \(h_IF_I\) и \(h_EF_E\) - поэлементные произведения. Аргумент "треугольника" Шеня здесь неприменим.

Результаты описанной модели [5] отличаются от результатов, которые дает алгоритм [3], в частности, потому, что в [3] используется метод моделирования Монте-Карло, а не статистический метод, основанный на какой-либо оценке правдоподобия или вероятности.

Поступила в редакцию 02.07.2018.


Список литературы

  1. Dempster A.P., Laird N.M., Rubin D.B. Maximum likelihood from incomplete data via the em algorithm. – Journal of the Royal Statistical Society. Series B (Methodological). 1977. V. 39. No. 1. P. 1–38.
  2. Hasselblad V. Estimation of finite mixtures of distributions from the exponential family. – Journal of the American Statistical Association. 1969. V. 64. No. 328. P. 1459–1471.
  3. Klimek P., Yegorov Y., Hanel R., Thurner S. Statistical detection of systematic election irregularities. – Proceedings of the National Academy of Sciences. 2012. V. 109. No. 41. P. 16469–16473.
  4. McLachlan G., Peel D. Finite Mixture Models. New York: Wiley, 2000.
  5. Mebane W.R., Jr. Election forensics: Frauds tests and observation-level frauds probabilities. – Paper presented at the 2015 Annual Meeting of the Midwest Political Science Association, Chicago, April 7–10, 2016, 2016.
  6. Wu C.F.J. On the convergence properties of the em algorithm. – Annals of Statistics. 1983. V. 11. No. 1. P. 95–103.