Prvý open source hlasový súbor slovenčiny obsahuje nová verzia datasetu Common Voice Corpus 7.0
Hlasové datasety slúžia k trénovaniu AI pre nasadenie v následujúcich oblastiach: 1. STT-speech to text - strojové rozpoznanie a prevod hlasu do textu DeepSpeech
2. TTS-text to speech - rozpoznanie a prevod textu na strojom generovaný umelý hlas Text-to-Speech for all
Takže prispievajte, šírte informácie, pritiahnite ďalších dobrovoľníkov, teraz keď už je slovenčina vonku, treba to už "len" rozširovať a zlepšovať...
- darovaním textov s licenciou CC0 sentence-collector
- validovaním obsahu z wikipedie podľa návodu v diskusii Slovak-Group
- darovaním hlasu (hovorte)
- darovaním ucha (počúvajte)
Zdroj: Common Voice
Pre pridávanie komentárov sa musíte prihlásiť.
To je fajn správa. Asi tomu obetujem nejaký čas, keď sa našiel prvý Slovák čo to dotiahol do konca.
Bude to fungovať dobre, vyskúšam to pre svoju prácu a čakám na ďalšie príspevky od vás run 3