Анализ ключевых слов в статьях студентов-филологов

Материал из wiki
Перейти к: навигация, поиск

Авторы работы Амирасланова Эльвира и Касапов Лев.


В данной статье представлен отчет по результатам социологического исследования среди студентов учебных групп ГИРЯ им. А.С.Пушкина в целях определения вероятности встречаемости отдельных слов и выявления закономерностей их использования.

Рис. 1 (на основе массива ключевых слов студентов)

Было рассмотрено 24 работы иностранных студентов, а именно статьи в форме эссе на тему «Почему я выбрал(а) русский язык?», а также облака слов, сделанные с помощью соответствующих веб-сервисов.

Облако слов представляет собой графическое отображение списка слов соответсвенно частоте их употребления в текстеи (см. рис. 1)

Ключевые слова помогают передать содержимое текста. Важно определить верно слова, которые правильно и объективно выражают суть текста. Студентами были выделены ключевые слова, которые по их представлениям наиболее полно отражают смысл написанного текста.

Нами была проведена работа по добавлению ключевых слов в выделенный ряд в работах студентов (выбирались значения, которые повторялись в виде синонимичных слов на протяжении всего текста). Так мы сгруппировали наборы образов в однозначные ключевые слова.



ОБРАБОТКА ДАННЫХ

Таблица 1

В результате первого этапа обработки данных получилась приведенная таблица (см. табл. 1). Наиболее распространенными причинами (по статьям) явились любовь к русскому языку, русской культуре и счастье.

Если же посмотреть на результаты по облакам слов и на приведенный график, там слова «культура» и «любовь» встречаются заметно реже, зато на 2-й строке возникает «интерес».

Всего получилось 13 совпадений против 36 уникальных слов. Это всего 26,5%. При этом нельзя сказать, что погрешностям больше подвержено ручное выделение слов, поскольку изученные нами облака слов имели мало общего со статьями, на основе которых они строились.


РЕЗУЛЬТАТ АНАЛИЗА

Судя по всему, причины существенных расхождений следующие:

1) Некорректное выполнение работ (многие облака слов построены на основе неполного текста оригинальной статьи);

2) Неполноценность использования облака слов как единственного инструмента для выделения ключевых слов.

Например, человек пишет статью о взаимодействии людей и использует синонимы: коммуникация, общение, обмен репликами, транзакция и т.д. По сути вся статья об общении, но каждый из синонимов менее заметен на графическом отображении облака слов.



ВЫВОД

Данный инструмент хоть и полезен при составлении ряда ключевых слов, но не дает исчерпывающее представление о тексте.

Важно понимать, что ключевые слова – это довольно важный, несмотря на свой небольшой объем, элемент научной работы. Правильно выписанные ключевые слова помогают сориентироваться и получить первое впечатление о следующем далее тексте.

Стоит применять облако слов в качестве первичного поиска самых явных и однозначных ключевых слов, для выявления общего характера работы, но при этом проверять и дополнять их своими руками.

Информация об исследовании также представлена в виде презентации и в виде инфографики