Prvý open source hlasový súbor slovenčiny obsahuje nová verzia datasetu Common Voice Corpus 7.0

15.08.2021 | 11:19 | Mozilla | Novinky

Hlasové datasety slúžia k trénovaniu AI pre nasadenie v následujúcich oblastiach: 1. STT-speech to text - strojové rozpoznanie a prevod hlasu do textu DeepSpeech
2. TTS-text to speech - rozpoznanie a prevod textu na strojom generovaný umelý hlas Text-to-Speech for all

Takže prispievajte, šírte informácie, pritiahnite ďalších dobrovoľníkov, teraz keď už je slovenčina vonku, treba to už "len" rozširovať a zlepšovať...
- darovaním textov s licenciou CC0 sentence-collector
- validovaním obsahu z wikipedie podľa návodu v diskusii Slovak-Group
- darovaním hlasu (hovorte)
- darovaním ucha (počúvajte)

Zdroj: Common Voice

    • RE: Prvý open source hlasový súbor slovenčiny obsahuje nová verzia datasetu Common Voice Corpus 7.0 15.08.2021 | 19:41
      Avatar bedňa LegacyIce-antiX  Administrátor

      To je fajn správa. Asi tomu obetujem nejaký čas, keď sa našiel prvý Slovák čo to dotiahol do konca.

      Táto správa neobsahuje vírus, pretože nepoužívam MS Windows. http://kernelultras.org
    • RE: Prvý open source hlasový súbor slovenčiny obsahuje nová verzia datasetu Common Voice Corpus 7.0 27.08.2021 | 12:59
      Avatar jedacandy   Používateľ

      Bude to fungovať dobre, vyskúšam to pre svoju prácu a čakám na ďalšie príspevky od vás run 3