«Научится» ли машина автомат узнавать говорящего человека по голосу?

Другая практически важная задача — это автоматическое распознавание речи: например, «научить» машину печатать текст прямо с голоса человека, поручив ей одновременно функции и стенографистки и машинистки, вводить информацию в ЭВМ прямо с голоса и т. п.

Ведь только тогда человек смог бы в полной мере использовать могучие возможности электронного мозга роботов, буквально общаться с ними на нашем обычном языке. Сегодня в этом направлении достигнуты большие успехи. Однако задача эта оказалась настолько трудной, что полностью ее решить пока что не удалось.

Например, машина легко распознает речь одного человека или нескольких «знакомых» ей дикторов, но «не желает» распознавать незнакомых, «понимает» речь взрослых и «не хочет понимать» детей. Если же и удается расширить круг дикторов, то тут же приходится вводить ограничение числа слов. Даже могучие современные ЭВМ не в состоянии пока что решить в полной мере такую детскую задачу, как письмо под диктовку. Пусть, например, «знакомый» машине диктор будет читать машине «знакомый» ей текст, но плачущим голосом, и машина его не поймет.

Причина неудач кроется в индивидуальных и эмоциональных особенностях речи разных людей, сильно искажающих фонетическую структуру «стандартного» речевого сигнала, на распознавание которого заранее настраивается машина. Образно говоря, все три вида речевой информации (ЧТО говорит, КТО говорит и КАК говорит) «растворены» в звуке голоса человека.

Наш слух не испытывает затруднений в их разделении, а машина «затрудняется». Поэтому можно надеяться, что изучение индивидуальноэмоциональных особенностей речи и механизмов, на которые опирается наш слух и мозг при их разделении, позволит, наконец, окончательно решить и проблему ее автоматического распознавания. Может быть, здесь пригодятся данные о том, что для восприятия и переработки логической и эмоциональной информации речи в мозгу человека имеется два специализированных отдела: левое полушарие мозга — для логики, правое — для эмоций.

Окончательное решение этой проблемы, надо думать, произойдет тогда, когда машина автомат «научится» безошибочно определять не только логический смысл слов, но и узнавать говорящего человека по голосу. И, конечно же, определять эмоции.

Опубликовано
Раздел: Акустический алфавит языка эмоций