Анализ последовательностей в социологии: возможности, ограничения и потенциал применения
Аннотация
В статье представлен краткий обзор применения метода анализа последовательностей в социологии. Обсуждается как контекст появления метода в социальных науках, так и примеры его основных приложений. Анализ последовательностей рассматривается в контексте классификации более широкого набора методов анализа временных данных и оценивается в плане своих сравнительных достоинств и недостатков применительно к разным исследовательским вопросам, типам данных и теоретическим допущениям.
Ключевые слова:
анализ последовательностей, временные данные, визуализация временных данных
Литература
Fasang A.E. Liao T.F. Visualizing Sequences in the Social Sciences: Relative Frequency Sequence Plots // Sociological Methods & Research. 2014. Vol. 43(4). P. 643–676.
Abbott A., Tsay A. Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect // Sociological Methods and Research. 2000. Vol. 29(1). P. 3–33.
Wu L.L. Some Comments on «Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect» // Sociological Methods and Research. 2000. Vol. 29(1). P. 41–64.
Levine J.H. But What Have You Done for Us Lately? Commentary on Abbott and Tsay // Sociological Methods and Research. 2000. Vol. 29(1). P. 34–40.
Time Warps, String Edits, and Macromolecules: The Theory and Practice of Sequence Comparison / Ed. D. Sankoff, J. B. Kruskal. Reading, Mass.: Addison-Weasley, 1983. (The David Hume Series).
Прокофьев П.А. Классификация фрагментов текстов с описанием зависимостей правилами на интерпретируемом экспертами языке // Вестник ВГУ, Серия: Системный анализ и информационные технологии. 2012. № 1. С. 174–178.
Ройтберг М.А. Биоалгоритмика. [Электронный ресурс] // Компьютерра. 2001. №36 (413). URL: http://old.computerra.ru/2001/413/197950/ (дата обращения: 12.05.2017).
Abbott A. Time Matters: On Theory and Method. The University of Chicago Press, 2001.
Дурбин Р. и др. Анализ биологических последовательностей: вероятностные модели белков и нуклеиновых кислот / Р. Дурбин, Ш. Эдди, А. Крог, Г. Митчинсон; пер. с англ. А. Миронова. М.: Ин-т компьютерных исследований, 2006.
Gonnet G.H. Surprising Results on Phylogenetic Tree Building Methods Based on Molecular Sequences [online] // BMC Bioinformatics. 2012. Vol. 13.
Наумов Д.Г. Филогенетический анализ семейства белков-гомологов [Электронный ресурс] // Zbio. 2006. URL: http://zbio.net/bio/001/003.html#a6 (дата обращения: 12.05.2017).
Гасфилд Д. Строки, деревья и последовательности в алгоритмах: информатика и вычислительная биология [Электронный ресурс] / Пер. с англ. И. В. Романовского. СПб: Невский Диалект, 2003. URL: http://padaread.com/?book=10289 (дата обращения: 12.05.2017).
Bininda-Emonds O.R.P., et. al. The Delayed Rise of Present-Day Mammals // Nature. 2007. Vol. 446 (7135). P. 507–512.
Cornwell B. Social Sequence Analysis: Methods and Applications. NY: Cambridge University Press, 2015.
Dodge Y. The Concise Encyclopedia of Statistics. NY: Springer-Verlag, 2010.
Fisher R.A. Mathematics of a Lady Tasting Tea // The World of Mathematics. Vol. 3. P. 1514–1521.
Staden R. A Strategy of DNA Sequencing Employing Computer Programs // Nucleic Acids Research. 1979. Vol. 6 (7). P. 2601–2610.
Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Доклады АН СССР. 1965. Т. 163. № 4. С. 845–848.
Ezkurdia I., et. al. Multiple Evidence Strands Suggest that There May Be as Few as 19,000 Human Protein-Coding Genes // Human Molecular Genetics. 2014. Vol. 23 ( 22). P. 5866–5878.
Мельников Б.Ф., Панин А.Г. Параллельная реализация мультиэвристического подхода в задаче сравнения генетических последовательностей // Вектор науки ТГУ. 2012. № 4 (22). С. 83–86.
Abbott A., Forrest J. Optimal Matching Methods for Historical Sequences // Journal of Interdisciplinary History. 1986. Vol. 16(3). P. 479–494.
Elzinga C. H. Sequence Similarity: A Nonaligning Technique // Sociological Methods and Research. 2003. Vol. 32(1). P. 3–29.
Stovel K., Savage M., Bearman P. Ascription into Achievement: Models of Career Systems at Lloyds Bank, 1890–1970 // American Journal of Sociology. 1996. Vol. 102 (2). P. 358–339.
Айвазян С.А., Бухштабер В.Р., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989.
Advances in Sequence Analysis: Theory, Method, Applications / Ed. P. Blanchard, F. Bühlmann, J.–A. Gauthier. NY: Springer, 2014. (Life Course Research and Social Policies).
Gabadinho A., et. al. Analyzing and Visualizing State Sequences in R with TraMineR // Journal of Statistical Software. 2011. Vol. 40(4).
Abbott A. Sequence Analysis: New Methods for Old Ideas // Annual Review of Sociology. 1995. Vol. 21. P. 93–113.
Кокс Д.Р., Оукс Д. Анализ данных типа времени жизни / Пер. с англ. О.В. Селезнева, под ред. Ю.К. Беляева. М.: Финансы и статистика, 1988.
Allison P.D. Event History Analysis: Regression for Longitudinal Event Data. Iowa City: Sage Publications, 1984. (Quantitative Applications in the Social Sciences).
Майстров Л.Е. Развитие понятия вероятности. М.: Наука, 1980.
Baker M., Quera V. Sequential Analysis and Observational Methods for Social Sciences. NY: Cambridge University Press, 2011.
Abbott A. Conception of Time and Events in Social Science Methods: Causal and Narrative Approaches // Historical Methods: A Journal of Quantitative and Interdisciplinary History. 1990. Vol. 23 (4). P. 140–150.
What Is a Case: Exploring the Foundations of Social Inquiry / Ed. C.C. Ragin, H.S. Becker. NY: Cambridge University Press, 1992.
Robette N., Bry X. Harpoon or Bait? A Comparison of Various Metrics in Fishing for Sequence Patterns // Bulletin of Sociological Methodology. 2012. Vol 116. P. 5–24.
Elzinga C.H., Liefbroer A.C. De-Standardization of Family-Life Trajectories of Young Adults: A Cross-National Comparison Using Sequence Analysis // European Journal of Population. 2007. Vol. 23. P. 225–250.
Scherer S. Early Career Patterns: A Comparison between Great Britain and West Germany // European Sociological Review. 2001. Vol 17. P. 114–119.
Kohler U., Brzinsky-Fay C. Stata Tip 25: Sequence Index Plots [online] // The Stata Journal. 2005. Vol. 4(5). URL: http://www.stata-journal.com/sjpdf.html?articlenum=gr0022 (date of access: 12.05.2017).
Piccarreta R., Lior O. Exploring Sequences: A Graphical Tool Based on Multi-dimensional Scaling // Journal of The Royal Statistical Society: Series A. 2010. Vol. 173. P. 165–184.
Gabadinho A., et. al. Extracting and Rendering Representative Sequences // Knowledge Discovery, Knowledge Engineering and Knowledge Management. 2011. Vol. 128. P. 94–106.
Computing and Visualizing Descriptive Statistics [online] // TraMineR: Sequence Analysis in R. Geneva: IDESCO, University of Geneva, Switzerland. URL: http://traminer.unige.ch/preview-describing.shtml (date of access: 12.05.2017).
Abbott A., Tsay A. Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect // Sociological Methods and Research. 2000. Vol. 29(1). P. 3–33.
Wu L.L. Some Comments on «Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect» // Sociological Methods and Research. 2000. Vol. 29(1). P. 41–64.
Levine J.H. But What Have You Done for Us Lately? Commentary on Abbott and Tsay // Sociological Methods and Research. 2000. Vol. 29(1). P. 34–40.
Time Warps, String Edits, and Macromolecules: The Theory and Practice of Sequence Comparison / Ed. D. Sankoff, J. B. Kruskal. Reading, Mass.: Addison-Weasley, 1983. (The David Hume Series).
Прокофьев П.А. Классификация фрагментов текстов с описанием зависимостей правилами на интерпретируемом экспертами языке // Вестник ВГУ, Серия: Системный анализ и информационные технологии. 2012. № 1. С. 174–178.
Ройтберг М.А. Биоалгоритмика. [Электронный ресурс] // Компьютерра. 2001. №36 (413). URL: http://old.computerra.ru/2001/413/197950/ (дата обращения: 12.05.2017).
Abbott A. Time Matters: On Theory and Method. The University of Chicago Press, 2001.
Дурбин Р. и др. Анализ биологических последовательностей: вероятностные модели белков и нуклеиновых кислот / Р. Дурбин, Ш. Эдди, А. Крог, Г. Митчинсон; пер. с англ. А. Миронова. М.: Ин-т компьютерных исследований, 2006.
Gonnet G.H. Surprising Results on Phylogenetic Tree Building Methods Based on Molecular Sequences [online] // BMC Bioinformatics. 2012. Vol. 13.
Наумов Д.Г. Филогенетический анализ семейства белков-гомологов [Электронный ресурс] // Zbio. 2006. URL: http://zbio.net/bio/001/003.html#a6 (дата обращения: 12.05.2017).
Гасфилд Д. Строки, деревья и последовательности в алгоритмах: информатика и вычислительная биология [Электронный ресурс] / Пер. с англ. И. В. Романовского. СПб: Невский Диалект, 2003. URL: http://padaread.com/?book=10289 (дата обращения: 12.05.2017).
Bininda-Emonds O.R.P., et. al. The Delayed Rise of Present-Day Mammals // Nature. 2007. Vol. 446 (7135). P. 507–512.
Cornwell B. Social Sequence Analysis: Methods and Applications. NY: Cambridge University Press, 2015.
Dodge Y. The Concise Encyclopedia of Statistics. NY: Springer-Verlag, 2010.
Fisher R.A. Mathematics of a Lady Tasting Tea // The World of Mathematics. Vol. 3. P. 1514–1521.
Staden R. A Strategy of DNA Sequencing Employing Computer Programs // Nucleic Acids Research. 1979. Vol. 6 (7). P. 2601–2610.
Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Доклады АН СССР. 1965. Т. 163. № 4. С. 845–848.
Ezkurdia I., et. al. Multiple Evidence Strands Suggest that There May Be as Few as 19,000 Human Protein-Coding Genes // Human Molecular Genetics. 2014. Vol. 23 ( 22). P. 5866–5878.
Мельников Б.Ф., Панин А.Г. Параллельная реализация мультиэвристического подхода в задаче сравнения генетических последовательностей // Вектор науки ТГУ. 2012. № 4 (22). С. 83–86.
Abbott A., Forrest J. Optimal Matching Methods for Historical Sequences // Journal of Interdisciplinary History. 1986. Vol. 16(3). P. 479–494.
Elzinga C. H. Sequence Similarity: A Nonaligning Technique // Sociological Methods and Research. 2003. Vol. 32(1). P. 3–29.
Stovel K., Savage M., Bearman P. Ascription into Achievement: Models of Career Systems at Lloyds Bank, 1890–1970 // American Journal of Sociology. 1996. Vol. 102 (2). P. 358–339.
Айвазян С.А., Бухштабер В.Р., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989.
Advances in Sequence Analysis: Theory, Method, Applications / Ed. P. Blanchard, F. Bühlmann, J.–A. Gauthier. NY: Springer, 2014. (Life Course Research and Social Policies).
Gabadinho A., et. al. Analyzing and Visualizing State Sequences in R with TraMineR // Journal of Statistical Software. 2011. Vol. 40(4).
Abbott A. Sequence Analysis: New Methods for Old Ideas // Annual Review of Sociology. 1995. Vol. 21. P. 93–113.
Кокс Д.Р., Оукс Д. Анализ данных типа времени жизни / Пер. с англ. О.В. Селезнева, под ред. Ю.К. Беляева. М.: Финансы и статистика, 1988.
Allison P.D. Event History Analysis: Regression for Longitudinal Event Data. Iowa City: Sage Publications, 1984. (Quantitative Applications in the Social Sciences).
Майстров Л.Е. Развитие понятия вероятности. М.: Наука, 1980.
Baker M., Quera V. Sequential Analysis and Observational Methods for Social Sciences. NY: Cambridge University Press, 2011.
Abbott A. Conception of Time and Events in Social Science Methods: Causal and Narrative Approaches // Historical Methods: A Journal of Quantitative and Interdisciplinary History. 1990. Vol. 23 (4). P. 140–150.
What Is a Case: Exploring the Foundations of Social Inquiry / Ed. C.C. Ragin, H.S. Becker. NY: Cambridge University Press, 1992.
Robette N., Bry X. Harpoon or Bait? A Comparison of Various Metrics in Fishing for Sequence Patterns // Bulletin of Sociological Methodology. 2012. Vol 116. P. 5–24.
Elzinga C.H., Liefbroer A.C. De-Standardization of Family-Life Trajectories of Young Adults: A Cross-National Comparison Using Sequence Analysis // European Journal of Population. 2007. Vol. 23. P. 225–250.
Scherer S. Early Career Patterns: A Comparison between Great Britain and West Germany // European Sociological Review. 2001. Vol 17. P. 114–119.
Kohler U., Brzinsky-Fay C. Stata Tip 25: Sequence Index Plots [online] // The Stata Journal. 2005. Vol. 4(5). URL: http://www.stata-journal.com/sjpdf.html?articlenum=gr0022 (date of access: 12.05.2017).
Piccarreta R., Lior O. Exploring Sequences: A Graphical Tool Based on Multi-dimensional Scaling // Journal of The Royal Statistical Society: Series A. 2010. Vol. 173. P. 165–184.
Gabadinho A., et. al. Extracting and Rendering Representative Sequences // Knowledge Discovery, Knowledge Engineering and Knowledge Management. 2011. Vol. 128. P. 94–106.
Computing and Visualizing Descriptive Statistics [online] // TraMineR: Sequence Analysis in R. Geneva: IDESCO, University of Geneva, Switzerland. URL: http://traminer.unige.ch/preview-describing.shtml (date of access: 12.05.2017).
Выпуск
Раздел
ОБЩИЕ ВОПРОСЫ МЕТОДОЛОГИИ И МЕТОДИКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ