распознавание речи и контекст?

aspirantka
Уже с Приветом
Posts: 1464
Joined: 05 Aug 2001 09:01
Location: Ca, Silicon Valley

распознавание речи и контекст?

Post by aspirantka »

Не подскажет ли кто какие-нибудь источники на эту тему? или даже уже какие-то разработанные алгоритмы, продукты и так далее... ? Проблема такая - пусть распознавание речи уже существует, но когда человек употребляет в речи числительные (один, два, второй, пятьдесят третий)как система может опознать, о чем идет речь - об автобусе или номере комнаты, и пр. ?
Sincerely,
Tara
User avatar
nastya12
Уже с Приветом
Posts: 2622
Joined: 17 Jun 2003 04:41
Location: Canada

Post by nastya12 »

Это шутка? 8O :) Вы очень своеобразно поняли условия задачи(распознавания речи в контексте). Не контекст распознают по содержимому, а содержимое по контексту.
aspirantka
Уже с Приветом
Posts: 1464
Joined: 05 Aug 2001 09:01
Location: Ca, Silicon Valley

Post by aspirantka »

извините, если я путанно написала. Конечно, распознать по контексту, что имеется в виду. В данном конкретном случае речь идет о системах типа Smarthouse - т.е. человек управляет "домом" с помощью речи, жестов + дополнительных remote control. задача - в идеале - состоит в том, чтобы это дело управлялось речью. Сказал - переключить на 10-й - система поняла, что это 10-й канал ТВ, сказал - повысить до 70 - включили обогреватель на 70 градусов. Я спрашиваю, занимался ли кто-нибудь этим, и в каком направлении, где посмотреть публикации. Это только лишь neural networks или что-то другое тоже есть на эту тему? Может, какие-нибудь работы, основанные на статистическом подходе?
И хорошо было бы, чтобы народ уже описал эту проблему, - может быть, есть хотя бы списки подобных задач. Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?
Sincerely,
Tara
User avatar
Каскыр
Уже с Приветом
Posts: 7133
Joined: 02 Mar 2003 03:28
Location: 94596

Post by Каскыр »

--Петька, прибор!
--16, Василь Иваныч!
--Что - 16?!
--А что - прибор?
(С) ;)
"Как выглядит кусок хлеба, зависит от того, голодны вы или сыты"
Слiн
Уже с Приветом
Posts: 1407
Joined: 07 Jan 2003 19:51
Location: НорКа

Post by Слiн »

aspirantka wrote:Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?


По команде "70!" переключить в состояние 70 все, что таковое состояние имеет.
User avatar
Каскыр
Уже с Приветом
Posts: 7133
Joined: 02 Mar 2003 03:28
Location: 94596

Post by Каскыр »

Слiн wrote:
aspirantka wrote:Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?


По команде "70!" переключить в состояние 70 все, что таковое состояние имеет.


А заодно - и всё, что имеет состояние 17 ;)
"Как выглядит кусок хлеба, зависит от того, голодны вы или сыты"
Hamster
Уже с Приветом
Posts: 11475
Joined: 20 Nov 2000 10:01
Location: Escondido, CA

Post by Hamster »

Да-да, телевизор на 70 канал, A/C на 70 F, воду в душе ( под которым кто-то моется ) тоже на 70 F ( можно С, будет веселее ), угол наклона кровати к полу 70 градусов.
aspirantka, вам надо найти форум, где тусуются специалисты по AI. Или пойти в университет и поискать статьи по этой теме в базах данных.
User avatar
Ollenka
Уже с Приветом
Posts: 2239
Joined: 18 Oct 2003 21:01
Location: NY

Post by Ollenka »

А скажите, это фантастика или жизнь? 8O 8O
User avatar
Basil
Уже с Приветом
Posts: 8404
Joined: 06 Nov 2000 10:01
Location: SPb -> Silicon Valley, CA, USA

Post by Basil »

Насколько я знаю (не работаю в этой области уже несколько лет), все что делалось по данной теме было не привязано конкретно к распознаванию речи. То есть, собственно распознавание речи - это превращение аудио потока в текст. Снятие неоднозначностей, контексты и пр. подобные вещи делают уже на тексте. По русски может называться "глубинный синтаксис", "семантический анализ" и т.д. Смотрите также работы по машинному переводу. Если не знаете конкретно, что ищете (название технологии, название методики), обьем работ может быть огромным. Знаю, что коммерческие продукты именно такого направления делала Lernout&Hauspie, не знаю как у них теперь дела.
Слiн
Уже с Приветом
Posts: 1407
Joined: 07 Jan 2003 19:51
Location: НорКа

Post by Слiн »

Hamster wrote:Да-да, телевизор на 70 канал, A/C на 70 F, воду в душе ( под которым кто-то моется ) тоже на 70 F ( можно С, будет веселее ), угол наклона кровати к полу 70 градусов.
.


Ну хорошо, тогда шаг алгоритма нумер 2:

- по команде "чо за [... moderated... ]" вернуть недавно(~1min) переведенные в "70" (ну или "17" ;)) объекты в пределах помещения, откуда подана команда "чо за..." в предыдущее состояние.
User avatar
flip_flop
Уже с Приветом
Posts: 4379
Joined: 20 Jun 2001 09:01

Post by flip_flop »

Небольшое добавление (к вопросу о терминах):

1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах :wink: (работает не очень надежно , но все-таки ...).

2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...

--
Internet (www.google.com) is power
User avatar
olg2002
Уже с Приветом
Posts: 990
Joined: 27 Mar 2002 10:01
Location: Palo Alto, CA

Post by olg2002 »

flip_flop wrote:Небольшое добавление (к вопросу о терминах):

1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах :wink: (работает не очень надежно , но все-таки ...).

2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...


Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.
Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).
User avatar
Basil
Уже с Приветом
Posts: 8404
Joined: 06 Nov 2000 10:01
Location: SPb -> Silicon Valley, CA, USA

Post by Basil »

olg2002 wrote:
flip_flop wrote:Небольшое добавление (к вопросу о терминах):

1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах :wink: (работает не очень надежно , но все-таки ...).

2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...


Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.


Именно потому что (1) во всех современных системах, известных мне, делается без или почти без (2), результаты не супер хороши.

Проблема в том, что (2 Распознавание смысла) даже без приложения к речи не существует, кроме как в теоретических и очень фрагментарных экспериментальных работах.

А (1) отдельно взятое есть уже в виде промышленных разработок. В буквальном смысле: например в виде чипа, на вход которого подается аудиопоток на каком-то языке, на выходе - текст.
User avatar
Basil
Уже с Приветом
Posts: 8404
Joined: 06 Nov 2000 10:01
Location: SPb -> Silicon Valley, CA, USA

Post by Basil »

olg2002 wrote:
flip_flop wrote:Небольшое добавление (к вопросу о терминах):

1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах :wink: (работает не очень надежно , но все-таки ...).

2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...


Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).


Распознавание речи - термин уже устоявшийся, и последние лет 15 обозначает именно (1).
Cougar
Уже с Приветом
Posts: 203
Joined: 26 Oct 2000 09:01
Location: New York

Post by Cougar »

olg2002 wrote:
flip_flop wrote:Небольшое добавление (к вопросу о терминах):

1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах :wink: (работает не очень надежно , но все-таки ...).

2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...


Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.
Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).


Good point. Только для того, чтобы правильно такой (semantics, pragmatics, discourse analysis) делать надо к "слушающему" устройству добавить как минимум зрение, обоняние, любовь, ... фактически сделать из этого устройства аналог человека. И даже этого будет недостаточно. Надо добавить семантические особенности "говорящего". Например, когда я говорю: "Я пошел гулять на улицу." - вы поняли о чем я? А вот мой друг знает, что я по бабам :D

Return to “Наука и Жизнь”