Проблема пропусков в социологических данных: смысл и подходы к решению

  • Ирина Казбековна Зангиева Национальный исследовательский университет «Высшая школа экономики» zangieva.irina@gmail.com
Для цитирования
Зангиева И.К. Проблема пропусков в социологических данных: смысл и подходы к решению // Социология: методология, методы, математическое моделирование (Социология:4М). 2016. № 33. С. 28-56.

Аннотация

Содержание настоящей статьи может послужить первым шагом к выработке рекомендаций по выбору способа работы с отдельными пропусками в данных сегодня. В статье предлагаются методы учета конкретной исследовательской ситуации при выборе способов работы с пропусками после сбора данных; выделяются условия, при которых имеет смысл искусственно заполнять пропуски; предлагается способ сравнения алгоритмов заполнения пропусков на основе специально организованного эксперимента; рассматриваются возникающие при этом трудности; строится типология используемых для заполнения пропусков алгоритмов, дающая возможность сократить количество последних при сравнении.
Ключевые слова:
пропуски в данных, неответы, заполнение пропусков, исследовательская ситуация

Биография автора

Ирина Казбековна Зангиева, Национальный исследовательский университет «Высшая школа экономики»
аспирант и преподаватель кафедры методов сбора и анализа социологической информации НИУ

Литература

Lillard L., Smith J.P., Welch F. What Do We Really Know About Wages? The Importance of Nonresponce and Census Imputation // Journal of Political Economy. 1986. No. 5. P. 489–506.



Sousa-Poza A., Hanneberger F. Wage Data Collected by Telephone Interviews: an Empirical Analysis of the Item Nonresponce Problem and Its Implications for the Estimation of Wage Functions // Schweizerishee Zeitschift fur Volkswirtschaft und Statistik. 2000. No. 136. S. 79–98.



Sande I. Imputation in Surveys: Coping with Reality // The American Statistician. 1982. No. 36(3). P. 145–153.



Dilman D.A. Mail and Telephone Surveys: The Total Design Method. N.Y.: John Willey and Sons, 1978. P. 230–245.



Pickery J., Billiet J. Item Non-response as a Predictor of Unit Non-response in a Panel Survey // International Conference on Survey Non-response. Portland Oregon (USA), 1999. Р. 48–67.



Shrapler J-P. Respondent Behavior in Panel Studies: A Case Study of the German Socio – Economic Panel (GSOEP) // DIW Discussion papers. DIW – Berlin. 2001. No. 224. Р. 65–74.



Hill D., Willis R.J. Reducing Panel Attrition: A Search for Effective Policy Instruments // Journal of Human Recourses. 2001. No. 36 (3). Р. 416–438.



Hanefeldt U. Das sozio-ekonomische Panel: Grundlagen und Konzeption. Frankfurt/Main: Campus Verlag, 1987. S. 171–186.



Little R.J., Rubin D.B. Statistical Analysis with Missing Data. N.Y.: John Willey and Sons, 1978.



De Leeuw E. D., Joop H., Huisman М. Prevention and Treatment of Item Nonresponse // Journal of Official Statistics. 2003. No. 19(2). P. 145–160.



Simonoff J.S. Regression Diagnostics to Detect Nonrandom Missingness in Linear Regression // Technometrics. 1988. No. 30(2).



Hoaglin D.C., Welsch R. E. The Hat Matrix in Regression and ANOVA // The American Statistician. 1978. No. 32. P. 17–22.



Cohen J., Cohen P. Applied Multiple Regression // Correlation Analysis for the Behavioral Sciences. 2nd ed. N.J.: Lawrence Erlbaum, 1983. P. 281–289.



Zweimuller J. Survey Non-response and Biases in Wage Regressions // Economic Letters. 1992. No. 39. P. 105–109.



Biewen M. Item Non-response and Inequality Measurement: Evidence from the German Earnings Distribution // Allgemeines Statistiches Archive. 2001. No. 85. P. 409–425.



Чуриков А.В. Основы формирования выборки: лекции для студентов направления 521200 (Социология). М.: ГУ–ВШЭ, 2005.



Daubler T. Nonresponseanalysen der Stichprobe F des SOEP // DIW Berlin. 2002. No. 15. S. 219–249.



Barnard. J.,Meng. X.L. Applications of Multiple Imputation in Medical Studies: from AIDS to NHANES // Statistical Methods in Medical Research. 1999. No. 8. P. 227–244.



Little R.J. Survey Nonresponse Adjustments for Estimates of Means // International Statistical Review / Revue Internationale de Statistique. 1976. No. 54(8). P. 139–157.



Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных // Computer Modelling &New Technologies. 2002. № 6. С. 55–56.



Delyon B., Lavielle M., Moulines E. Convergence of a Stochastic Approximation Version of the EM Algorithm // The Annals of Statistics. 1999. No. 27. P. 94–128.



Wu C.F. On the Convergence Properties of the EM-algorithm // The Annals of Statistics. 1983. No. 11(1). P. 95–103.



SPSS Missing Value Analysis 12.0 [on-line]. URL: http://www.spss.ru/products/missing_value/mva12.pdf.



Rubin D.B. Multiple Imputation after 18+ Years // Journal of the American Statistical Association. 1996. No. 91. P. 473–489.



Horton N. J, Lipsitz S.R. Multiple Imputation in Practice: Comparison of Software Packages for Regression Models with Missing Variables // The American Statistician. 2001. No. 55(3). P. 244–254.



Schafer J. L. Multiple Imputation: A Primer // Statistical Methods in Medical Research. 2001. No. 8. P. 3–15.



Allison P.D. Multiple Imputation for Missing Data: A Cautionary Tale // Sociological Methods and Research. 2000. No. 28. P. 301–309.



Zhang P. Multiple Imputation: Theory and Method // International Statistical Review / Revue Internationale de Statistique. 2003. No. 71(3). P. 581–592.



Ibrahim J. G. Incomplete Data in Generalized Linear Models // Journal of American Statistical Association. 1990. No. 85. P. 765–769.



Barnard J., Rubin D.B., Zanutto E. Lecture Notes of the Short Course on Multiple Imputation for Missing Data. Utrecht, 1997.



Kalton G., Kasprzyk D. The Treatment of Missing Survey Data // Survey Methodology. 1986. No. 12. P. 1–16.



Allison P.D. Missing Data // Sage University Papers Series on Quantitative Applications in the Social Sciences. CA.: Sage, 2001. No. 136.
Форматы цитирования
Другие форматы цитирования:

APA
Зангиева, И. К. (2016). Проблема пропусков в социологических данных: смысл и подходы к решению. Социология: методология, методы, математическое моделирование (Социология:4М), (33), 28-56. извлечено от https://soc4m.ru/index.php/soc4m/article/view/3720
Раздел
ПРАКТИКИ СБОРА И АНАЛИЗА ФОРМАЛИЗОВАННЫХ ДАННЫХ