ПО Linux: распознавание речи и текста

Гондаренков, А. Маска, я вас… распознал

Гондаренков, А. Маска, я вас… распознал! Cистема распознавания CuneiForm вновь вошла в список лучших OCR мира [Текст] : [открытая система оптического распознавания текста CuneiForm от Cognitive Technologies как пример успеха открытого проекта] / рубрику готовил Андрей Гондаренков  //  Linux Format. — 2017. — № 5 (223), май. — С. 8. — (Новости) (Открытое ПО). 
     Аннотация
     Открытая система оптического распознавания текста CuneiForm от Cognitive Technologies — краткая история, возможности, уникальные технологии, использование в сканерах известных брендов, достижение — вхождение в список лучших OCR-систем
мира за 2017 год. 

Дрейк, Н. AUI Suite: Pi слушает голос

Дрейк, Н. AUI Suite: Pi слушает голос [Текст] : [голосовое управление Pi] : [руководство] / Нейт Дрейк [Nate Drake]  //  Linux Format. — 2017. — № 3 (221), март. — С. 92-95. — (Raspberry Pi). — Прил.: "Основные голосовые команды" : [комментированный перечень голосовых команд Pi AUI Suite] ; "Скорая помощь. Если при проверке перевода текста в речь вы слышите слово ‘fill’, флажок наполнителя стоит установить в 0. Нажмите y, для подтверждения, что вы хотите изменить это" : [совет]. — С. 93 ; "Скорая помощь" : [совет по выбору кодового слова] ; "Подстройка голосовых команд" : [добавление и изменение команд в ПО Voicecommand]. — С. 94 ; "Настройка голосовых команд на вашем Pi" : [пошаговое руководство]. — С. 95. 
     Аннотация
     Голосовое управление Pi — аппаратура (USB-микрофон или веб-камера со встроенным микрофоном, недорогая звуковая карта USB), ПО (Pi AUI Suite от Стивена Хиксона [Steven Hickson], PlayVideo, Downloader, Google Text to Speech Service, Google Voice Commands, Voicecommand), настройка программы Voicecommand, настройка голосовых команд на вашем Pi согласно пошаговому руководству. 

«Проект GNU представил СПО синтеза речи Gnuspeech, способное служить как система компьютерной генерации речи и для экспериментов.»

"Проект GNU представил СПО синтеза речи Gnuspeech, способное служить как система компьютерной генерации речи и для экспериментов." [Текст] : [информация на основе материалов lists.gnu.org] / рубрику готовил Андрей Гондаренков  //  Linux Format. — 2015. — № 12 (203), дек.. — С. 9. — (Новости) (Новости короткой строкой). 
 

Гондаренков, А. Mycroft, брат Шерлока

Гондаренков, А. Mycroft, брат Шерлока. Пообщаемся с искусственным интеллектом на своем родном языке [Текст] : [система распознавания речи Mycroft AI проекта искусственного интеллекта Mycroft адаптируется к рабочим столам Ubuntu Unity и KDE, а также к мобильному телефону Ubuntu Phone] / рубрику готовил Андрей Гондаренков  //  Linux Format. — 2015. — № 12 (203), дек.. — С. 7. — (Новости) (Человек и машина). 
     Аннотация
     В области систем распознавания речи Linux значительно отстает от систем Microsoft (Cortana) и Apple (Siri), но лед тронулся и проект Mycroft под началом Райана Сайпса (Ryan Sipes) начал адаптацию системы распознавания речи Mycroft AI к рабочим столам Unity и KDE и мобильному телефону Ubuntu Phone. 
     Проект Mycroft и его компонент Mycroft AI — краткая информация. 

 

Федорчук, А. Linux и OCR — братья навек

Федорчук, А. Linux и OCR — братья навек [Текст] : [свободные средства распознавания текста Cuneiform, графическая оболочка YAGF для Cuneiform и программа для предварительной коррекции отсканированного документа Scan Tailor] / Алексей Федорчук  //  Linux Format. — 2011. — № 5 (144), май. — С. 9. — (Обзоры).
     Аннотация
     Благодаря программам Cuneiform, Scan Tailor (разработчик Иосиф Арцимович) для предварительной коррекции отсканированного документа и интегрирующей графической оболочке YAGF (создатель Андрей Боровский) для Cuneiform, улучшается работа по распознавания текста в Linux.

 

Хейвард, Д. Распознавание речи

Хейвард, Д. Распознавание речи [Текст] : [сравнит. обзор программ Linux для распознавания голоса и речи] / Дэвид Хейвард (David Hayward)  //  Linux Format. — 2014. — № 10 (188), окт.. — С. 24-29. — (Сравнение) (Распознавание голоса). — Содерж.: Наша подборка : [Перечень тестируемых программ] ; Про наш тест : [платформы тестирования — обоснование выбора Ubuntu 14.04 64­-bit в качестве программной платформы тестирования и информация об альтернативах — Knoppix (www.knoppix.org) или Vinux (http://vinuxproject.org); аппаратная платформа — ноутбук Dell Latitude E6400]. — С. 24 ; Установка. Легко ли установить подобное приложение? : [особенности установки] ; Вердикт : [наиболее проста установка Speech-App как расширения Chromium] ; Простота запуска. Что нужно, чтобы эти голосовые программы начали вас слушать? : [особенности общения с программами] ; Вердикт : [лидер Speech-App с его умением практически мгновенно начать слушать ]. — С. 25
Дополнительные функции. Что еще предлагают эти программы? ; Вердикт : [наиболее богат удобными функциями  Simon] ; Просторечие и акцент. Ляхко ли с йими? Харашо, панимаэшь? : [как программы обрабатывают акцент] ; FreeSpeech ; Julius. — С. 26 ; Palaver ; Speech-App ; Simon. — С. 27 ; Столкнем лбами. Новички, пользователи среднего уровня и продвинутые — какое им лучше ; Вердикт : [Simon с большим количеством функций — приложение для пользователей любого уровня подготовки]. — С. 27 ; Повседневное использование. Как они справляются с повседневной работой? : [характеристика и оценка повседневного использования программ] ; Вердикт : [Simon — надежная программа для повседневного использования] ; Дальнейшее развитие. Что ждет в будущем эти программы распознавания речи? : [анализ обновлений и информация от разработчиков о прекращении разработки] ; Вердикт : [недавно обновлялись Simon и Speech­App]. — С. 28 ; Распознавание голоса. Вердикт : [краткие итоговые характеристики протестированных программ распознавания речи в Linux] ; I. Simon : [Simon 0.4.1 (http://simon.kde.org), лицензия GNU GPL v1.2: общая оценка в баллах и резюме] ; II. Speech-App : [Speech-App 0.5 (http://bit.ly/speech­app), лицензия GNU GPL: общая оценка в баллах и резюме] ; III. Julius : [Julius 4.2.2 (http://bit.ly/JuliusEng), лицензия http://bit.ly/JuliusLic: общая оценка в баллах и резюме] ; IV. Palaver : [Palaver 1 (http://bit.ly/Palaver), лицензия GPL v3: общая оценка в баллах и резюме] ; V. FreeSpeech : [FreeSpeech r120 (http://bit.ly/Freespeech), лицензия GPL v3: общая оценка в баллах и резюме] ; Рассмотрите также… : [запуск Windows-программы Dragon Naturally Speaking в Wine; проект SpeechControl для Ubuntu (http://bit.ly/SpeechControl)]. — С. 29. 
      Аннотация
      Поговори­-ка ты со мной… а вот и не гитара, а компьютер под управление Linux. Тест систем распознавания речи для Linux — FreeSpeech, Julius, Palaver, Simon, Speech-App.
 

 

Мосс Б. Технологии доступа

Мосс Б. Технологии доступа [Текст] : учебник / Боб Мосс (Bob Moss)  //  Linux Format. — 2010. — № 3 (129), март. — С. 58-61. — Содерж.: Orca: Читаем вслух : [рабочий стол Gnome: настройка читалки текста экрана Orca, установка и настройка ее движка — синтезатора речи eSpeak (http://espeak.sourceforge.net/), распознавание речи с помощью утилиты GnomeVoiceControl (http://live.gnome.org/GnomeVoiceControl) и голосовое управление компьютером]. — С. 58-59 ; "Скорая помощь. Для выхода из читалки экрана нажмите управляющую клавишу Orca и Q.". — С. 59 ; Perlbox: TTS на KDE : [настройка Festival в качестве синтезатора речи, предпосылки установки, установка и настройка Perlbox Magic (http://bit.ly/8sPqOG), ]. — С. 60-61 ; "Скорая помощь. В Festival есть маленькая утилита под названием text2wav, которая позволяет экспортировать синтезированный текст в файл WAV способом, аналогичным eSpeak." ; Альтернативы : [краткая информация о KSayIt (www.kde­apps.org/content/show.php?content=10028), Open Mind Speech (http://freespeech.sourceforge.net), XVoice (http://xvoice.sourceforge.net), Simon (https://sourceforge.net/projects/speech2text)]. — С. 61.
      Аннотация
      TTS (Text-to-speech, озвучивание текста) и распознавание речи стали обычным делом для окружения Windows. Для этого предназначены такие коммерческие продукты, как Dragon NaturallySpeaking или утилиты, встроенные в Vista и Windows 7.
      В мире свободного ПО создан широкий спектр свободных синтезаторов речи, читалок с экрана и движков распознавания голоса — и многие из них по умолчанию присутствуют в основных дистрибутивах, а пользователь включает их по необходимости. И, в отличие от Windows-­аналогов, они бесплатные!
      Боб Мосс показывает, как наделить своего железного друга приятным женским или мужским голосом и научить его понимать ваши команды.
 

 

Боровский А. Читаем с листа

Боровский А. Читаем с листа [Текст] / Андрей Боровский  //  Linux Format. — 2009. — № 5 (118), май. — С. 36-39. — (Распознавание текстов). — Прил.: "Мои пять копеек" : [Андрей Боровский поддерживает альтернативную собственную ветвь Cuneiform (symmetrica.net/cuneiform-linux, https://code.launchpad.net/~anb-symmetrica/cuneiform-linux/cuneiform-multilang) и сообщает о добавленных им некоторых возможностях (о них тоже говорится в статье)]. — С. 37 ; "Результаты тестирования Cuneiform 0.6.0" [Таблица]. — С. 38 ; "Таблица функций" [Таблица] : [Основные параметры Cuneiform и Tesseract]. — С. 39
      Аннотация 
      Изложены причины отставания открытого программного обеспечения и Linux в области оптического распознавания текстов и необходимость разработки открытых инструментов распознавания текста. При этом Андрей Боровский обращает внимание на известную проблему конкуренции между открытыми и закрытыми платформами, которая заключается в том, что успешная открытая программа не добавляет конкурентных преимуществ какой-либо конкретной платформе, так как может быть без особых усилий перенесена на любую закрытую ОС. 
      Рассмотрены приложения командной строки для распознавания текста — свободно распространяемая открытая система оптического распознавания текстов Cuneiform 0.6.0 (https://code.launchpad.net/cuneiformlinux/+download) и свободная программа для распознавания текстов Tesseract (http://tesseract-ocr.googlecode.com/). 

 

Боровский А. Распознавание речи : Часть 2: Сфинксов не кормить!

Боровский А. Распознавание речи [Текст] : Часть 2: Сфинксов не кормить! / Андрей Боровский  //  Linux Format. — 2009. — № 4 (117), апр.. — С. 42-45. — (Распознавание речи). 
      Аннотация
      Рассмотрены движки распознавания речи: CMU Sphinx (cmusphinx.sourceforge.net) и его воплощения Sphinx 3, Sphinx 4 и PocketSphinx, протестировано распознавание русского языка в Sphinx 3. 
      Краткая информация о проектах HTK (Hidden Markov Model Toolkit), Julius, Simon. 

 

Боровский А. Распознавание речи : Научи компьютер слышать!

Боровский А. Распознавание речи [Текст] : Научи компьютер слышать! / Андрей Боровский  //  Linux Format. — 2009. — № 3 (116), март. — С. 42-45. — (Распознавание речи).  
      Аннотация 
      Почему же Open Source отстает от коммерческих программ в области распознавания текста и речи. 
      Два применения технологий распознавания речи, которые чаще всего используются на компьютерах общего назначения: система голосовых команд и электронная диктовка. 
      Распознавание речи и Linux — история, принципы и современное состояние.