Mozilla's Common Voice - databáze Crowdsourced pro zlepšení rozpoznávání hlasu


Dostávám spoustu komplimentů o mém hlubokém skotském přízvuku, ale pokud jde o hlasové aplikace, jako jsou Siri a Alexa, můj hlas je více než jen majetek. Když Apple a Amazon dělali své hlasové asistentky, zdálo se, že nemají skotského akcenta na poradce s rychlou volbou.

Pokud má být rozpoznávání hlasu cestou budoucnosti - a pravděpodobně to je kam máme směřovat - pak vyhledávače a hlasové asistentky musí začít lépe pracovat na porozumění obtížným přízvukům. Ne všichni máme veřejné akcenty anglického školáka.

Mozilla (tvůrci prohlížeče Firefox) se pokouší problém vyřešit tak, že požádá lidi, aby dobrovolně zadali své hlasy do databáze nazvané „Společný hlas “. Přiřazením hlasů k nastaveným frázím Mozilla doufá, že jejich databáze bude v budoucnu pro každou aplikaci nakonec neocenitelným nástrojem v závislosti na rozpoznávání hlasu.

Registrace pro 'Common Voice'

Než půjdeme dále, pojďme nejprve vyřešit problémy s ochranou soukromí, protože je již slyším přicházet.

I když je možné se zaregistrovat pomocí účtu Firefox, Github nebo Google, můžete se místo toho zaregistrovat prostřednictvím e-mailu . Stačí otevřít anonymní anonymní e-mailový účet a nikdo nebude moudřejší, o kterém mluvíte.

Jakmile si vytvoříte účet a přihlásíte se, budete podívejte se na palubní desku.

Existují dvě sekce - Mluvita Poslouchat. V sekci Mluvtebudete vyzváni, abyste přispěli svým vlastním hlasem. Poslouchatje místo, kde posloucháte hlasy ostatních lidí a porovnáváte je s frází, kterou museli mluvit. Pak byste uvedli, zda to bylo správné.

Mluvit

Pro účast v mluvené sekci budete potřebovat funkční mikrofon, který zřetelně zachytí váš hlas. Musíte také poskytnout webu Mozilla přístup k tomuto mikrofonu.

Když kliknete na sekci Mluvit, zobrazí se vám pět náhodných frází. Pokyny jsou velmi jasně na obrazovce a lze je snadno sledovat.

Jednoduše kliknete na ikonu mikrofonu níže a poté si přečtete větu obvyklým tónem hlasu. Nedávejte neobvyklý přízvuk ani nemluvte opravdu pomalu.

Celým cílem tohoto cvičení je, že se databáze učí porozumět přízvukům lidí způsobem, kterým se běžně mluví. Jinými slovy je celá věc zbytečná.

Po dokončení první věty uvidíte v pravém horním rohu možnosti buď přehrát klip, nebo znovu nahrát klip, pokud nejste s tím spokojeni.

Pokud jste s tím spokojeni, pohybuje se na další a pokračuje, dokud nebude hotových všech pět frází. Potom kliknutím na modré tlačítko Odeslat odešlete klipy do Mozilly ke kontrole.

Pokud se nyní vrátíte na palubní desku, uvidíte, že vám byly tyto věty připsány.

Pak je to jednoduchý případ oplachování a opakování. Čím více příspěvků a různých přízvuků může Mozilla získat ve své databázi, tím úspěšnější bude projekt.

Poslouchejte

Jakmile lidé do Mozilly vloží své fráze, je třeba je zkontrolovat. aby se zajistilo, že se hlasový klip shoduje s frází. To je také něco, co se také rozdává dobrovolníkům.

Zpět na palubní desce, vpravo uvidíte sekci Poslouchat. V části Hlavní přispěvatelévidíte, že byly shromážděny některé závažné statistiky.

>

Chcete-li začít ověřovat hlasové fráze, přejděte na <<Poslouchat  sekce a dostanete frázi a tlačítko pro přehrávání.

Klikněte na tlačítko přehrávání (ujistěte se, že jsou vaše reproduktory zapnuté!) a uslyšíte nahraný hlas. Pokud se rozhodnete, že fráze byla vyslovena správně, klikněte na Ano. Pokud došlo k nesprávnému vyjádření, k něčemu jinému nebo k nějaké jiné chybě, klikněte na NO

Závěr

Toto je jen jeden z mnoha projektů, které Mozilla v současnosti provádí (přejděte na hlavní web Mozilla a klikněte na Projektyv horní části - neustále se mění). Crowdsourcing je skvělý způsob, jak se uskutečnit hodnotné projekty, a vždy stojí za to věnovat svůj čas a pomoci vám vytvořit něco užitečného pro budoucnost.

Související příspěvky:


5.08.2019