Методология обработки библиографических данных на русском языке для построения сетей коллаборации (на примере базы данных eLibrary)

Научная статья
  • Дарья Васильевна Мальцева Национальный исследовательский университет «Высшая школа экономики», Москва, Россия dmaltseva@hse.ru ORCID ID https://orcid.org/0000-0003-1789-1711
    Elibrary Author_id 696348
    ResearchID P-9354-2015
  • Василиса Андреевна Ващенко Национальный исследовательский университет «Высшая школа экономики», Москва, Россия vvashchenko@hse.ru
  • Лика Владимировна Капустина Национальный исследовательский университет «Высшая школа экономики», Москва, Россия lkapustina@hse.ru

Аннотация

Представлена методология обработки библиографических данных на русском языке на примере анализа публикаций российских социологов в электронной библиотеке eLibrary. Разработанный методологический подход подразумевает использование и адаптацию технологических решений для формирования базы библиографических данных, построения сетей для дальнейшего анализа и применения методов сетевого анализа для изучения различных областей знания. Описаны основные шаги сбора и предобработки данных на русском языке из eLibrary. На примере массива социологических публикаций из eLibrary рассмотрены типовые проблемы, возникающие на этапе предобработки библиографической информации об именах и аффилиациях авторов, предложены пути их решения. Разработанная методология позволяет сформировать базу библиографических данных и построить на ее основе сети коллаборации для дальнейшего анализа. Методология применима для анализа различных публикаций русскоязычных авторов, представленных в eLibrary.
Ключевые слова:
библиометрический анализ, библиографические сети, данные на русском языке, методология, социологическое сообщество, сети коллаборации, eLibrary

Биографии авторов

Дарья Васильевна Мальцева, Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
Кандидат социологических наук, заведующая Международной лабораторией прикладного сетевого анализа
Василиса Андреевна Ващенко, Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
Стажер-исследователь Международной лаборатории прикладного сетевого анализа
Лика Владимировна Капустина, Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
Стажер-исследователь Международной лаборатории прикладного сетевого анализа

Литература

Bar-Ilan J. Informetrics at the beginning of the 21st century – A review // Journal of informetrics. 2008. Vol. 2, №. 1. P. 1–52. DOI: 10.1016/j.joi.2007.11.001. EDN: MISIBR.

Mingers J., Leydesdorff L. A review of theory and practice in scientometrics // European journal of operational research. 2015. Vol. 246, №. 1. P. 1–19. DOI: 10.1016/j.ejor.2015.04.002. EDN: UQPVRP.

Rousseau R., Egghe L., Guns R. Becoming metric-wise: A bibliometric guide for researchers / Ed. by W. Glänzel [et al]. Cambridge, MA: Chandos Publishing, 2018. 402 р. ISBN 9780081024744.

Сафонова М.А., Винер Б.Е. Сетевой анализ социтирований этнологических публикаций в российских периодических изданиях: предварительные результаты // Социология: методология, методы, математическое моделирование (Социология: 4М). 2013. № 36. С. 140–176. EDN: RCFOWT.

Винер Б.Е., Дивисенко К.С. Когнитивная структура современной российской социологии по данным журнальных ссылок // Журнал социологии и социальной антропологии. 2012. № 15 (4). С. 144–166. EDN: PKOYXD.

Интеллектуальный ландшафт и социальная структура локального академического сообщества (случай петербургской социологии) / М.М. Соколов, М.А. Сафонова, К.С. Губа, Д.В. Димке; под ред. М.М. Соколова. М.: НИУ ВШЭ, 2012. 44 с. (Препринт / Высш. шк. экономики, Нац. исслед. ун-т; Серия WP 6, Гуманитарные исследования). EDN: QONWKT.

Батыгин Г.С., Девятко И.Ф. Социология и власть: эпизоды советской истории // Тоталитаризм и посттоталитаризм (Статьи и подготовительные материалы). Кн. 2. М.: ИС РАН, 1994. С. 174–201. ISBN 5-201-02478-5.

Hou H., Kretschmer H., Liu Z. The structure of scientific collaboration networks in Scientometrics // Scientometrics. 2008. № 75 (2). P. 189–202. DOI: 10.1007/s11192- 007-1771-3. EDN: BMMNCG.

Maltseva D., Batagelj V. iMetrics: the development of the discipline with many names // Scientometrics. 2020. № 125. P. 313–359. DOI: 10.1007/s11192-020- 03604-4. EDN: RHKXCV.

Otte E., Rousseau R. Social network analysis: a powerful strategy, also for the information sciences // Journal of information Science. 2002. Vol. 28, № 6. P. 441–453. DOI: 10.1177/016555150202800601. EDN: JNNEJB.

Maltseva D., Batagelj V. Collaboration Between Authors in the Field of Social Network Analysis // Scientometrics. 2022. № 6. P. 1–34. DOI: 10.1007/s11192-022-04364-z. EDN: VPCXGD.

A Global Comparison of Scientific Mobility and Collaboration According to National Scientific Capacities / Z. Chinchilla-Rodríguez, L. Miao, D. Murray [et al.] // Front. Res. Metr. Anal. 2018. P. 3–17. DOI: 10.3389/frma.2018.00017.

Lopaciuk B. Collaboration strategies for publishing articles in international journals – A study of Polish scientists in economics // Social Networks. 2016. Vol. 44. P. 50–63. DOI: 10.1016/j.socnet.2015.07.001.

Newman P. The structure of scientific collaboration networks // PNAS. 2001. Vol. 98, № 2. P. 404–409. DOI: 10.1073/pnas.98.2.404.

Newman M.E.J. Mixing patterns in networks // Physical Review E. 2003. № 2. P. 67. DOI: 10.1103/PhysRevE.67.026126.

Albert R., Barabási A.-L. Statistical Mechanics of Complex Networks // Reviews of Modern Physics. 2002. Vol. 74, № 1. P. 47–97. DOI: 10.1103/ RevModPhys.74.47. EDN: LZWSIZ.

Kronegger L., Ferligoj A., Doreian P. On the Dynamics of National Scientific Systems // Quality & Quantity. 2011. Vol. 45, № 5. P. 989–1015. DOI: 10.1007/s11135- 011-9484-3. EDN: SXTVAH.

Scientific collaboration dynamics in a national scientific system / A. Ferligoj, L. Kronegger, F. Mali [et al.] // Scientometrics. 2015. Vol. 104, № 3. P. 985–1012. DOI: 10.1007/s11192-015-1585-7. EDN: FAZSFM.

Glänzel W., Schubert A. Analysing Scientific Networks Through Co-Authorship // Handbook of Quantitative Science and Technology Research. Springer: Dordrecht, 2004. P. 257–276. ISBN 978-1-4020-2702-4. DOI: 10.1007/1-4020-2755-9_12.

Wagner C.S., Leydesdorff L. Network structure, self-organization, and the growth of international collaboration in science // Research policy. 2005. Vol. 34, № 10. P. 1608–1618. DOI: 10.1016/j.respol.2005.08.002.

Moody J. The Structure of a Social Science Collaboration Network: Disciplinary Cohesion from 1963 to 1999 // American Sociological Review. 2004. Vol. 69, № 2. P. 213–238. DOI: 10.1177/000312240406900204.

Hunter L., Leahey E. Collaborative research in sociology: Trends and contributing factors // American Sociologist. 2008. № 39. P. 290–306. DOI: 10.1007/s12108-008-9042-1.

Pontille D. Authorship Practices and Institutional Contexts in Sociology: Elements for a Comparison of the United States and France // Science, Technology & Human Values. 2003. Vol. 28, № 2. P. 217–243. DOI: 10.1177/0162243902250905. EDN: JQALSF.

Mali F., Ferligoj A., Kronegger L. Co-authorship trends and collaboration patterns in the Slovenian sociological community // Corvinus journal of sociology and social policy. 2010. Vol. 1, № 2. P. 29–50. DOI: 10.14267/issn.2062-087X.

Моисеев С.П., Мальцева Д.В. Отбор источников для систематического обзора литературы: сравнение экспертного и алгоритмического подходов // Социология: методология, методы, математическое моделирование (Социология: 4М). 2019. № 47. С. 7–43. EDN: MZXVXW.

Булычева Е.Е., Мальцева Д.В. Выделение актуальных тематик в социологии: взгляд сквозь призму анализа сети цитирований // Мониторинг общественного мнения: экономические и социальные перемены. 2020. № 6. С. 113–14. DOI: 10.14515/monitoring.2020.6.971. EDN: UGIDGS.

Understanding large temporal networks and spatial networks: Exploration, pattern searching, visualization and network evolution / V. Batagelj, P. Doreian, A. Ferligoj, N. Kejžar. Chichester, West Sussex: John Wiley & Sons, 2014. 464 р. ISBN 1118915356, 9781118915356. DOI: 10.1002/9781118915370.

Batagelj V., Ferligoj A., Squazzoni F. The emergence of a field: a network analysis of research on peer review // Scientometrics. 2017. № 113. P. 503–532. DOI: 10.1007/s11192-017-2522-8.

Batagelj V., Cerinšek M. On bibliographic networks // Scientometrics. 2013. Vol. 96, № 3. P. 845–864. DOI: 10.1007/s11192-012-0940-1.

Nooy W. de, Mrvar A., Batagelj V. Exploratory social network analysis with Pajek. Revised and expanded edition for updated software. Cambridge; New York: Cambridge University Press, 2018. 420 р. ISBN 1108662099, 9781108662093. DOI: 10.1016/j.socnet.2005.12.002.

Sanyal D.K., Bhowmick P.K., Das P.P. A review of author name disambiguation techniques for the PubMed bibliographic database // Journal of Information Science. 2021. Vol. 47, № 2. P. 227–254. DOI: 10.1177/0165551519888605.

Tekles A., Bornmann L. Author name disambiguation of bibliometric data: A comparison of several unsupervised approaches // Quantitative Science Studies. 2020. Vol. 1, № 4. P. 1510–1528. DOI: 10.1162/qss_a_00081.

Treeratpituk P., Giles C.L. Disambiguating authors in academic publications using random forests // Proceedings of the 9th ACM/IEEE-CS Joint Conference on Digital Libraries. New York: Association for Computing Machinery, 2009. P. 39–48. DOI: 10.1145/1555400.1555408.

Khabsa M., Treeratpituk P., Giles C.L. Online person name disambiguation with constraints // JCDL ‘15: Proceedings of the 15th ACM/IEEE-CS Joint Conference on Digital Libraries. New York: Association for Computing Machinery, 2015. P. 37–46. DOI: 10.1145/2756406.2756915.

A Unified Probabilistic Framework for Name Disambiguation in Digital Library / J. Tang, A.C.M. Fong, B. Wang, J. Zhang // IEEE Transactions on Knowledge and Data Engineering. 2012. Vol. 24, № 6. P. 975–987. DOI: 10.1109/TKDE.2011.13.

Zhang B., Hasan M.A. Name disambiguation in anonymized graphs using network embedding // Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore: ACM, 2017. P. 1239–1248. DOI: 10.1145/3132847.3132873.

Damerau F.J. A technique for computer detection and correction of spelling errors // Communications of the ACM. 1964. Vol. 7, № 3. P. 171–176.
Статья

Поступила: 30.05.2023

Опубликована: 31.12.2023

Раздел
ОБЩИЕ ВОПРОСЫ МЕТОДОЛОГИИ И МЕТОДИКИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ