Близкие слова / related words

и задачки для интервью.
User avatar
idle0
Уже с Приветом
Posts: 2846
Joined: 28 Jun 2000 09:01
Location: Milwaukee, WI

Близкие слова / related words

Post by idle0 »

Вот такой вопрос. Как решить такую задачу.

Дается одно слово на английском языке. Например sand.

Надо придумать алгоритм который сгенерит много слов которые часто импользуются во фразах, содержащих первое слово.

Т.е. f(sand) = (dunes, brown, drift, granular, desert, white, beach, ...)

Куда копать?
moria# show running-config
User avatar
Иоп
Уже с Приветом
Posts: 8832
Joined: 18 Feb 2005 08:00
Location: Yekaterinburg --> Toronto

Post by Иоп »

Ну, самый примитивный способ это анализ текстов на предмет слов расположенных по соседству с заданным. Составляется словарь из которого исключаются все предлоги, местоимения и т.п. После того, как получен словарь релевантных слов, необходимо проверить обратную релевантность, т.е. брать каждое слово из словаря и анализировать тексты на предмет того, как часто рядом с ним встречается исходное слово. Если обратная релевантность достаточно сильная, то слово заносится в итоговый словарь, если нет, то исключается.

Return to “Головоломки”