tehnologia Text-to-Speech într-un stil spontan, dezvoltat de Xiaomi AI Lab în China, este una dintre ultimele frontiere în ceea ce privește recunoașterea vocii și utilizarea dispozitivelor prin voce. Proiectul care este nascut in interiorul laboratorului ia numele de "Deține vocea mea". Permite destinatarilor care, din păcate, suferă de tulburări de vorbire să aibă voci unice și personalizate pentru a comunica cu alte persoane. Să vedem în detaliu ce este și de când compania chineză lucrează la el.
Xiaomi a dezvăluit cea mai recentă aplicație de algoritmi avansați și tehnologie de vorbire dezvoltată de sine, care îi ajută pe cei cu tulburări de vorbire
Xiaomi îi pasă de oameni și se străduiește să le satisfacă diferitele nevoi prin inovație tehnologică. În ultimii ani, marca chinezească a descoperit dorința multor utilizatori cu tulburări de limbaj ai propria ta voce, chiar unic, pentru a fi folosit pentru comunicarea zilnică. Din acest motiv, Xiaomi a înființat echipa de proiect "Deține vocea mea". Zhu Xi, coordonatorul Comitetului de tehnologie pentru Tech for Good al Xiaomi, a spus:
Suntem încântați să explorăm multiplele valori pe care ni le oferă inovația tehnologică, cum ar fi răspunsul la solicitările utilizatorilor pentru identitatea personală și construirea identității
Pentru a genera cea mai potrivită și personalizată voce pentru utilizatorul cu deficiențe de vorbire, echipa de proiect Xiaomi are a recrutat peste 200 de voluntari înăuntru să-ți dai vocea. Algoritmul de potrivire a amprentei vocale a fost folosit pentru a potrivi caracteristicile vocilor donate de voluntari cu cele ale vocii destinatarului. Prin această abordare, a fost a găsit vocea cea mai potrivită ca sunet de referință voce de bază pentru destinatar.
De asemenea, citește: Mi Band 7 iese cu multă dată și preț | Fotografie
Mai târziu, oamenii de știință au folosit tehnologia de sinteză a vorbirii în stil spontan pentru antrenează modelul de inteligență artificială. În acest fel, un ritm și o intonație naturale capabile să i se adauge treptat acestei noi voci exprimă sincer emoția și tonul unei ființe umane.
Zhu Xi a adăugat:
Dacă observăm și răspundem nevoilor grupurilor minoritare într-un stadiu incipient, procesul de răspândire a tehnologiei ar putea fi mult redus. Acest lucru permite ca beneficiile noilor tehnologii să devină imediat accesibile utilizatorilor cu nevoi speciale
Coloana vertebrală a acestui proiect este un grup de experți în tehnologie vocală de Xiaomi AI Lab. De la 2017 au publicat 37 de articole în acest sens și au fost prezenți în cercuri importante precum celConferință internațională despre acustică, vorbire și procesare a semnalului (ICASSP). Succesul lui "Deține vocea mea”Depinde în principal de stilul spontan al tehnologiei Text-To-Speech pe care au dezvoltat-o. Stilul spontan al tehnologiei Text-To-Speech face, în esență, vocea sintetizată să arate ca o ființă umană reală în intonație, pauză, viteză și alte caracteristici. Aceasta înlocuiește senzația monotonă și nenaturală a vocii electronice cu una mai naturală.