DeepL запускає переклад голосу у реальному часі

Компанія DeepL відома як один з перших AI-інструментів для перекладу тексту, ті, хто слідкує за інвестиціями, знають її як один з перших єдинорогів TA Ventures — український фонд досить давно у них інвестував. Тепер компанія запускає переклад голосу у реальному часі.

«Після багатьох років роботи з текстовим перекладом, голос був для нас природним наступним кроком, — сказав CEO DeepL Ярек Кутиловський. — Ми значно просунулися в перекладі текстів і документів. Але зрозуміли, що на ринку немає справді якісного продукту для перекладу голосу в реальному часі».

Ідея нових функцій у тому, щоб перекладати голос людини у реальному часі на іншу мову: ви говорите українською, а співбесідник з Нью-Йорку у Zoom чує американську англійську. Чи будь-яку іншу доступну мову.

Кутиловський зазначив, що ключова складність створення такого продукту — це баланс між зменшенням затримки (часу між мовленням і відтворенням перекладеного аудіо) та збереженням високої точності.

  • DeepL випускає доповнення для платформ Zoom і Microsoft Teams, де користувачі можуть або слухати переклад у реальному часі, поки інші говорять рідною мовою, або читати синхронний текст перекладу на екрані. Наразі ця функція доступна в режимі раннього доступу, і компанія запрошує організації приєднатися до списку очікування.
  • Також DeepL пропонує продукт для мобільних і веброзмов — як офлайн, так і онлайн.
  • Компанія заявила, що її технологія голос-у-голос здатна навчатися і адаптуватися до спеціалізованої лексики, зокрема галузевих термінів, назв компаній і імен.

Інший формат використання — клієнтська підтримка. Нові функції дозволяють компаніям надавати сервіс мовами, де складно знайти кваліфікований персонал або це дорого.

Система працює так: спочатку мовлення перетворюється на текст, потім перекладається, а після цього знову перетворюється на аудіо. DeepL вважає, що багаторічний досвід у текстовому перекладі дає їй перевагу в якості. У майбутньому компанія планує створити повністю end-to-end модель голосового перекладу, яка взагалі пропускатиме текстовий етап.

Помітили помилку? Виділіть його мишею та натисніть Shift+Enter.

DeepL запускає переклад голосу у реальному часі

Компанія DeepL відома як один з перших AI-інструментів для перекладу тексту, ті, хто слідкує за інвестиціями, знають її як один з перших єдинорогів TA Ventures — український фонд досить давно у них інвестував. Тепер компанія запускає переклад голосу у реальному часі.

«Після багатьох років роботи з текстовим перекладом, голос був для нас природним наступним кроком, — сказав CEO DeepL Ярек Кутиловський. — Ми значно просунулися в перекладі текстів і документів. Але зрозуміли, що на ринку немає справді якісного продукту для перекладу голосу в реальному часі».

Ідея нових функцій у тому, щоб перекладати голос людини у реальному часі на іншу мову: ви говорите українською, а співбесідник з Нью-Йорку у Zoom чує американську англійську. Чи будь-яку іншу доступну мову.

Кутиловський зазначив, що ключова складність створення такого продукту — це баланс між зменшенням затримки (часу між мовленням і відтворенням перекладеного аудіо) та збереженням високої точності.

  • DeepL випускає доповнення для платформ Zoom і Microsoft Teams, де користувачі можуть або слухати переклад у реальному часі, поки інші говорять рідною мовою, або читати синхронний текст перекладу на екрані. Наразі ця функція доступна в режимі раннього доступу, і компанія запрошує організації приєднатися до списку очікування.
  • Також DeepL пропонує продукт для мобільних і веброзмов — як офлайн, так і онлайн.
  • Компанія заявила, що її технологія голос-у-голос здатна навчатися і адаптуватися до спеціалізованої лексики, зокрема галузевих термінів, назв компаній і імен.

Інший формат використання — клієнтська підтримка. Нові функції дозволяють компаніям надавати сервіс мовами, де складно знайти кваліфікований персонал або це дорого.

Система працює так: спочатку мовлення перетворюється на текст, потім перекладається, а після цього знову перетворюється на аудіо. DeepL вважає, що багаторічний досвід у текстовому перекладі дає їй перевагу в якості. У майбутньому компанія планує створити повністю end-to-end модель голосового перекладу, яка взагалі пропускатиме текстовий етап.

Помітили помилку? Виділіть його мишею та натисніть Shift+Enter.
Читати на тему