распознавание речи и контекст?
-
- Уже с Приветом
- Posts: 1464
- Joined: 05 Aug 2001 09:01
- Location: Ca, Silicon Valley
распознавание речи и контекст?
Не подскажет ли кто какие-нибудь источники на эту тему? или даже уже какие-то разработанные алгоритмы, продукты и так далее... ? Проблема такая - пусть распознавание речи уже существует, но когда человек употребляет в речи числительные (один, два, второй, пятьдесят третий)как система может опознать, о чем идет речь - об автобусе или номере комнаты, и пр. ?
Sincerely,
Tara
Tara
-
- Уже с Приветом
- Posts: 2622
- Joined: 17 Jun 2003 04:41
- Location: Canada
-
- Уже с Приветом
- Posts: 1464
- Joined: 05 Aug 2001 09:01
- Location: Ca, Silicon Valley
извините, если я путанно написала. Конечно, распознать по контексту, что имеется в виду. В данном конкретном случае речь идет о системах типа Smarthouse - т.е. человек управляет "домом" с помощью речи, жестов + дополнительных remote control. задача - в идеале - состоит в том, чтобы это дело управлялось речью. Сказал - переключить на 10-й - система поняла, что это 10-й канал ТВ, сказал - повысить до 70 - включили обогреватель на 70 градусов. Я спрашиваю, занимался ли кто-нибудь этим, и в каком направлении, где посмотреть публикации. Это только лишь neural networks или что-то другое тоже есть на эту тему? Может, какие-нибудь работы, основанные на статистическом подходе?
И хорошо было бы, чтобы народ уже описал эту проблему, - может быть, есть хотя бы списки подобных задач. Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?
И хорошо было бы, чтобы народ уже описал эту проблему, - может быть, есть хотя бы списки подобных задач. Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?
Sincerely,
Tara
Tara
-
- Уже с Приветом
- Posts: 7133
- Joined: 02 Mar 2003 03:28
- Location: 94596
-
- Уже с Приветом
- Posts: 1407
- Joined: 07 Jan 2003 19:51
- Location: НорКа
-
- Уже с Приветом
- Posts: 7133
- Joined: 02 Mar 2003 03:28
- Location: 94596
Слiн wrote:aspirantka wrote:Или какие-то примитивные решения? (в смысле, система будет работать, но через пень-колоду) и т.п. ?
По команде "70!" переключить в состояние 70 все, что таковое состояние имеет.
А заодно - и всё, что имеет состояние 17
![Wink ;)](./images/smilies/icon_wink.gif)
"Как выглядит кусок хлеба, зависит от того, голодны вы или сыты"
-
- Уже с Приветом
- Posts: 11475
- Joined: 20 Nov 2000 10:01
- Location: Escondido, CA
Да-да, телевизор на 70 канал, A/C на 70 F, воду в душе ( под которым кто-то моется ) тоже на 70 F ( можно С, будет веселее ), угол наклона кровати к полу 70 градусов.
aspirantka, вам надо найти форум, где тусуются специалисты по AI. Или пойти в университет и поискать статьи по этой теме в базах данных.
aspirantka, вам надо найти форум, где тусуются специалисты по AI. Или пойти в университет и поискать статьи по этой теме в базах данных.
-
- Уже с Приветом
- Posts: 2239
- Joined: 18 Oct 2003 21:01
- Location: NY
-
- Уже с Приветом
- Posts: 8404
- Joined: 06 Nov 2000 10:01
- Location: SPb -> Silicon Valley, CA, USA
Насколько я знаю (не работаю в этой области уже несколько лет), все что делалось по данной теме было не привязано конкретно к распознаванию речи. То есть, собственно распознавание речи - это превращение аудио потока в текст. Снятие неоднозначностей, контексты и пр. подобные вещи делают уже на тексте. По русски может называться "глубинный синтаксис", "семантический анализ" и т.д. Смотрите также работы по машинному переводу. Если не знаете конкретно, что ищете (название технологии, название методики), обьем работ может быть огромным. Знаю, что коммерческие продукты именно такого направления делала Lernout&Hauspie, не знаю как у них теперь дела.
-
- Уже с Приветом
- Posts: 1407
- Joined: 07 Jan 2003 19:51
- Location: НорКа
Hamster wrote:Да-да, телевизор на 70 канал, A/C на 70 F, воду в душе ( под которым кто-то моется ) тоже на 70 F ( можно С, будет веселее ), угол наклона кровати к полу 70 градусов.
.
Ну хорошо, тогда шаг алгоритма нумер 2:
- по команде "чо за [... moderated... ]" вернуть недавно(~1min) переведенные в "70" (ну или "17"
![Wink ;)](./images/smilies/icon_wink.gif)
-
- Уже с Приветом
- Posts: 4379
- Joined: 20 Jun 2001 09:01
Небольшое добавление (к вопросу о терминах):
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах
(работает не очень надежно , но все-таки ...).
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
--
Internet (www.google.com) is power
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах
![Wink :wink:](./images/smilies/icon_wink.gif)
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
--
Internet (www.google.com) is power
-
- Уже с Приветом
- Posts: 990
- Joined: 27 Mar 2002 10:01
- Location: Palo Alto, CA
flip_flop wrote:Небольшое добавление (к вопросу о терминах):
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах(работает не очень надежно , но все-таки ...).
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.
Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).
-
- Уже с Приветом
- Posts: 8404
- Joined: 06 Nov 2000 10:01
- Location: SPb -> Silicon Valley, CA, USA
olg2002 wrote:flip_flop wrote:Небольшое добавление (к вопросу о терминах):
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах(работает не очень надежно , но все-таки ...).
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.
Именно потому что (1) во всех современных системах, известных мне, делается без или почти без (2), результаты не супер хороши.
Проблема в том, что (2 Распознавание смысла) даже без приложения к речи не существует, кроме как в теоретических и очень фрагментарных экспериментальных работах.
А (1) отдельно взятое есть уже в виде промышленных разработок. В буквальном смысле: например в виде чипа, на вход которого подается аудиопоток на каком-то языке, на выходе - текст.
-
- Уже с Приветом
- Posts: 8404
- Joined: 06 Nov 2000 10:01
- Location: SPb -> Silicon Valley, CA, USA
olg2002 wrote:flip_flop wrote:Небольшое добавление (к вопросу о терминах):
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах(работает не очень надежно , но все-таки ...).
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).
Распознавание речи - термин уже устоявшийся, и последние лет 15 обозначает именно (1).
-
- Уже с Приветом
- Posts: 203
- Joined: 26 Oct 2000 09:01
- Location: New York
olg2002 wrote:flip_flop wrote:Небольшое добавление (к вопросу о терминах):
1. Распознавание речи (speech/voice recognition) - это именно преобразование звуков в текст. По крайней мере 15 лет исследований и разработок. Теперь имеем эти технологии в некоторых сотовых телефонах(работает не очень надежно , но все-таки ...).
2. Распознавание смысла (cognitive & computational linguistics, sense recognition) - преобразование текста в "смысл". Интересная область, учитывая что человеческая логика не является формальной логикой, со всеми вытекающими...
Насколько я понимаю, делать надежно 1, без попыток 2. невозможно.
Поэтому, наверное, мы говорим "распознавание речи" (voice/speech recognition),
а подразумеваем "распознавание речи" (semantics, pragmatics, discourse analysis).
Good point. Только для того, чтобы правильно такой (semantics, pragmatics, discourse analysis) делать надо к "слушающему" устройству добавить как минимум зрение, обоняние, любовь, ... фактически сделать из этого устройства аналог человека. И даже этого будет недостаточно. Надо добавить семантические особенности "говорящего". Например, когда я говорю: "Я пошел гулять на улицу." - вы поняли о чем я? А вот мой друг знает, что я по бабам
![Very Happy :D](./images/smilies/icon_biggrin.gif)