В прошлом году профессор Ченг Чжан из Корнельского университета представил прототип «умного ожерелья» NeckFace, которое умело анализировать мимику владельца. Оно имело ряд недостатков, поэтому ученый разработал новую версию под названием «Speechin». Это устройство умеет распознавать речь владельца, но для этого ему не нужно видеть лица говорящего.
Главной задачей Чжана было сохранить конфиденциальность пользователя Speechin. Подразумевается, что гаджет будет применяться для скрытой передачи голосовых команд на смартфон там, где громкий голос звучит неуместно – в библиотеке, во время деловых встреч, в толпе и т.д. Также устройство не видит лица пользователя, даже его губ, оно считывает данные по движению подбородка.
Используя принципы машинного обучения, профессор Чжан при помощи 20 добровольцев научил Speechin распознавать базовые слова и фразы. Половина команды говорила на английском, вторая на китайском, при этом точность распознавания речь у первой группы достигла 90,5%, а у второй 91,6 %. Но сразу же выявился и весомый недостаток – распознавать речь на ходу оказалось практически невозможно, разная походка заставляла головы говорящих двигаться непредсказуемым образом.
В качестве дополнительных возможностей использования Speechin указываются случаи, когда вокруг слишком шумно, и смартфон не может разобрать речь владельца. Также подобные устройства помогут тем, кто потерял голос на время болезни или из-за травмы.
Источник — Cornell University