Новости

02. 07. 2018
Развитие городских территорий: что нужно знать девелоперу?
Круглый стол организованный Ассоциацией инвесторов Москвы совместно с газетой
02. 07. 2018
Рейтинг одобрения властей
Левада-центр провёл очередное исследование мнения россиян о деятельности Президента РФ и Правительства
27. 06. 2018
Отношение россиян к западным санкциям
ВЦИОМ представляет данные исследования, посвященного теме западных санкций
25. 06. 2018
Общественное мнение: права и свободы
ФОМ провёл исследование ситуации с соблюдением прав человека в стране, а также выяснил, какие права и свободы для россиян наиболее важны.
21. 06. 2018
Глобальные экологические проблемы
Ipsos Global@dvisor провёл онлайн исследование, какие экологические проблемы волнуют людей во всём мире
19. 06. 2018
Гендерный дисбаланс на рынке труда
Социологи из НИУ ВШЭ изучили гендерный дисбаланс в сфере естественных наук, технологий, инженерии и математики (STEM) и предложили меры поддержки женщин, работающих там.

24. 11. 2017

«Извлекая мнения из сети Интернет»

Этой осенью в пятом номере журнала «Мониторинг общественного мнения: Экономические и социальные перемены» была опубликована статья «Извлекая мнения из сети Интернет: могут ли методы анализа текстов заменить опросы общественного мнения?». Авторы статьи - кандидат социологических наук, доцент кафедры прикладной и  отраслевой социологии СПбГУ Дудина Виктория Ивановна и социолог Центра социологических и Интернет-исследований СПбГУ Юдина Дарья Игоревна.

Пользовательский контент интернет-ресурсов становится альтернативным или дополнительным источником изучения общественного мнения. Тем не менее остается не до конца проясненным вопрос, могут ли эти данные при современных методах анализа полностью или частично заменить массовые опросы. Цель статьи— показать на примере анализа больших текстовых данных методологические возможности для такой замены методами тематического моделирования и алгоритма по извлечению мнений. В статье проводится сравнение анализа комментариев пользователей видеохостинга Youtube к  фильму «Чайка» Фонда борьбы с коррупцией с результатами опроса общественного мнения по поводу отношения к фильму и представленным в нем фактам. Результаты исследования показывают, что анализ мнений в Интернете пока не может полностью заместить массовые опросы, но предоставляет более широкий контекст для интерпретации мнений и их более детальной оценки, а также может быть использован для улучшения структуры анкеты и качества самих вопросов.

Основных выводов, полученных в результате сравнения результатов массового опроса с результатами анализа  больших текстовых данных из интернета, оказалось два. Первый - различные мнения и обсуждения в сети, будучи подвергнуты соответствующему анализу, позволяют исследователям получать представления о контексте формирования общественного мнения относительно события или персоналии. Второй вывод - результаты такого рода анализа можно использовать для улучшения качества структуры опросника и самих вопросов.

В статье однако отмечается, что результаты анализа текстов из интернета пока не могут рассматриваться как полноценная альтернатива массовым опросам. При подобном методе анализа отсутствует теоретическая база для переноса данных на более широкие группы населения.  В случае с анализом данных из соцмедиа появляется проблема с получением надёжной демографической информации, которую предполагает традиционная модель массового опроса. Информация из онлайна позволяет определить лишь спектр обсуждаемых вопросов, их популярность, но не представляется возможным сопоставить мнения с их носителями. Другой проблемой является нерешенность вопроса, как формировать выборку, представляющую «генеральную» совокупность.

Тематическая модель отражает структуру текстов и обсуждения в целом. Алгоритмы же по извлечению мнений разрабатываются для оценки отношения к конкретным объектам, о которых говорится в тексте. Такие алгоритмы более универсальны и не столь требовательны к длине и количеству анализируемых текстов, как тематические модели. Примеры сравнений результатов алгоритмизированного анализа данных из онлайн-источников и опросов демонстрируют большую гибкость опросных методов относительно набора характеристик.