|
|
Вверх #4 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
Цитата
(Могилиус Трупп;1618921) »
И их не будет еще очень долго при нынешнем уровне развития искусственного интеллекта
На самом деле, подозреваю, если бы все фирмы имеющие наработки в распознавании объединили бы усилия - уже было бы все сделано и с достаточно приличным качеством (причём для всех языков). По крайней мере, та программа распознавания, которая ставится с SAPI некоторые звуки угадывала вполне регулярно... И, скорее всего, другие программы четко угадывают другие звуки... |
|
|
|
|
|
Вверх #7 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
che-hoff
Цитата
а темп речи, а ударение, а границы фраз?
Ударение тоже не должно вызывать проблем - ударную гласную отличает длительность, громкость (да и другие параметры, например, если обнаружено чёткое о, значит оно ударное). Если человек на слух может сказать с каким ударением произнесено слово даже не зная этого слова - то и компьютер, в принципе, тоже может и никакого ИИ для этого не нужно. С темпом речи вообще вроде никаких проблем, даже в имеющихся программах.... |
|
|
|
|
|
Вверх #9 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
Цитата
А как на этот счет MS Ofice 2007 ?
Если тот же движок, что ставится с SAPI - распознавание очень плохое (для английского языка, для русского ничего и не было вроде). Достаточно чётко распознаёт несколько звуков и регулярно придумывает слова, отсутствующие в тексте. 50 процентов похожих на сказанные слова, 20 процентов угаданных слов, 30% - полнейшая отсебятина. По крайней мере, мне добиться лучшего не удалось... У меня, правда, английское произношение далеко не идеальное, но те 30% вообще когда речи нет возникали... |
|
|
|
|
|
Вверх #11 |
ПродвинутыйРегистрация: 12.10.2007
|
Среди английских Dragon Dictate и Dragon Naturally speaking. Первая ориентирована на набор текста, а вторая на управление компом с помощью голоса. Из руских юзал только Горыныча(по ходу он построян на ядре Dragon Dictate). Вцелом качесвто распознавания зависило от того сколько я слов правильно надиктую при настройке. Ну там всегда в начале давали прочитать текст если читать их все больше и с правильным произношением то прожка будет работать более-менее. Фишка в том что для русского Горыныча надо было надиктовывать каждое слово в отдельности, а это занимало массу времени. Интересным является не только speach-to-text технология, но и обратная text-to-speach. Среди движков такого рода из русских мне больше всего понравился Digalo Nikolai(как ни странно французкого производства), а для англ. вполне катит стандартный Microsoft Sam.
__________________
Дьявол не искушает грешников и неверующих, ибо они уже его. |
|
|
|
|
|
Вверх #12 |
ЗапрещенныйРегистрация: 20.09.2006
Адрес: везде и всегда
|
Цитата
(Antichrist;1625065) »
Antichrist
Алексей с Украины добавил : Antichrist Это она и есть? http://209.85.129.132/search?q=cache...lr=lang_uk</a> |
|
|
|
|
|
Вверх #13 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
Цитата
Среди движков такого рода из русских мне больше всего понравился Digalo Nikolai
Основная проблема - расстановка ударений, в особенности на омографы (типа рУки/рукИ), решается с помощью моей разработки - Книгодела (http://www.bludnikov.ru/soft2.htm) (он работает со всеми указанными движками, формат вывода выбирается в настройках, а затем выполняется команда Export, оптимальные варианты установок, на мой взгляд, Diagalo-Nikolai, Alena (транскрипция), Olga (новая) для соответствующих движков). (Альтернативное решение - словари замен - даёт гораздо худший результат). P.S.: когда смотрел Горыныча (было это, правда, очень давно, лет 10 назад) он даже (с обучением) не всегда мог отличить "к" от "вобла" (при трёх словах, которым его обучил). Последний раз редактировалось rquester; 10.03.2009 в 15:57. |
|
|
|
|
|
Вверх #14 |
ПродвинутыйРегистрация: 12.10.2007
|
При распознавании речи на качество влияют многие факторы: Тип микрофона(Все советуют close-talk), громкость источника, скорость чтения, четкость дикции, внешние шумы и т.д. Я юзаю микрофон который шел в комплекте от моей мамки ASUS. Он не close-talk, но зато стерео и с подавлением шумов(циклически повторяющихся звуков и антифидбек). Установка этого микрофона значительно улучшила качество распознавания.
Antichrist добавил : Алексей с Украины Цитата
Antichrist Это она и есть? http://209.85.129.132/search?q=cach...l=ru&lr=lang_uk [/url]
http://www.programy.com.ua/ukr/download/187944/
__________________
Дьявол не искушает грешников и неверующих, ибо они уже его. |
|
|
|
|
|
Вверх #16 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
Dead Krow
Цитата
SAPI - ? что это???
Цитата
кто пробовал переводить речь в текст опишите какое нужно оборудование и как выглябит процесс, схоже с просто записью речи на комп???
![]() Для лучшего распознавания можно сделать калибровку - заданный текст читается в микрофон. |
|
|
|
|
|
Вверх #18 |
НовенькийРегистрация: 04.03.2009
Адрес: Санкт-Петербург
|
Max Ader
Цитата
Был бы спрос хороший - все бы уже появилось... А так, маловата (с точки зрения индустрии) целевая база и ее возможности.
Но это - для стабильно распознающей системы с минимальным процентом ложных срабатываний. Если синтез на данный момент уже достаточно хорош для использования на практике (хотя проблемы есть - относительно небольшое число голосов, одноязычность каждого голоса, отсутствие стандартов для движков в SAPI (например, не стандартизован символ ударения)), недостаточно интонаций и т.д., но проблемы решаемые в достаточно короткие сроки), то распознавание даёт сбои слишком часто. При таком проценте ошибок область применения оказывается действительно небольшой... Последний раз редактировалось rquester; 19.03.2009 в 19:11. |
|
|
|
|
|
Вверх #19 |
ЗаслуженныйРегистрация: 18.02.2004
Адрес: ???
|
Цитата
(rquester;1629523) »
На самом деле, целевая база работоспособной системы распознавания - практически все домашние пользователи.
__________________
I'm in the way, aren't I?! |
|
|
|
|
|
Вверх #20 |
3Dnews fanРегистрация: 10.11.2003
Адрес: EU
|
Цитата
(Max Ader;1629840) »
А на какие шиши? Они за это заплатят? "Индейская национальная изба... Фиг-вам, называется!" (с)
__________________
Нет **йне! |
|
|
|