Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Назван самый привлекательный город для туризма в Беларуси — и это не областной центр или Минск
  2. Ввели валютное ограничение для населения
  3. Ремонт на «Дружбе» завершен, Украина готова возобновить прокачку нефти, заявил Зеленский. Он ожидает разблокировки кредита ЕС
  4. На четверг объявили оранжевый уровень опасности
  5. «Как бы они на меня сегодня ни обиделись». Лукашенко потребовал ужесточать подготовку водителей
  6. Американцы выложили в сеть похищенный нацистами советский архив Смоленской области. В нем есть много интересного по беларусской истории
  7. «Бюро»: Дмитрий Басков расширяет бизнес — подробности
  8. После жалоб преподавателя руководство БГУИР опубликовало данные по зарплате в учебном заведении
  9. Синоптики предупредили о похолодании — возможен даже мокрый снег
  10. Трех беларусов будут судить за измену государству
  11. Бывшая политзаключенная Наталья Левая, которую освободили из колонии на последних месяцах беременности, родила ребенка
  12. Этого классика беларусской литературы расстреляли в 45 лет, но он успел сделать столько, сколько удалось немногим. Вот о ком речь
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.