Microsoft-ի նոր նեյրոցանցը 3 վայրկյանանոց ձայնագրության հիման վրա կրկնօրինակում է խոսացողի ձայնը
![](https://1.bp.blogspot.com/-LN7Nn40PC1Q/XywdvjMHYbI/AAAAAAAAlAQ/psfAd8Ql_YAFvTu_-7_np67HPczVcMb4wCLcBGAsYHQ/s200/Generic-calendar-page-icon.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg_o3BBSncP7-Gbjqm3yv16uput-AfD6kfhPGU5ZJvmPIgUp5CFiTPuaiaMrVrrLvHIU86aKu8j6p6EpyQQa5UJVZOR3a-hmoyI0M0t2Z-LTfFYEp0b1X_iYUDBLjVtd_Y2aTvyZSuOJc_a5_gJV6IxB-2kQIXPwOCdqBB16X-qGanZV32S0c01GWhwUg/w640-h370/microsoft-valle-introfoto.webp)
Microsoft ընկերությունը ներկայացրեց VALL-E կոչվող նոր նեյրոցանցը, որը նախատեսված է մարդու ձայնը կրկնօրինակելու համար: Ընդամենը 3 վայրկյանանոց ձայնագրությունը բավական է, որպեսզի նեյրոցանցը կարողանա կրկնօրինակել խոսացողի ձայնն ու էմոցիաները: Նեյրոցանցը «սովորել» է 60 000 ժամ անգլերեն խոսակցություններ լսելով:
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgvayJeliDMP97UgpPejcfsTIVb_zNGO6bavQQrV6F9C6jSOtSUFY3ve3QxQNtAopKtCRVXYvmM-AFOdsGucS_lx1dRm4YQUjKemb4NpZ8_N2p-OJ8D4Ukv2sjNG_jFniCBgMNLANAmRFfZH3fGBr89B4wGKUqjPafxYuYERtJKCJMe88xawUO34df_0Q/w640-h344/Overview.jpg)
Նախագծի կայքում ներկայացված են այս նոր նեյրոցանցի աշխատանքի օրինակներ: Speaker Prompt սյունակում տեղադրված է 3 վայրկյանանոց ցանկացած խոսակցություն (որի ձայնը նեյրոցանցը կրկնօրինակելու է), Ground Truth սյունակում օրիգինալ ձայնով հնչում է այն խոսակցությունը, որը գեներացնելու է նեյրոցանցը (համեմատության համար), Baseline սյունակում տեղադրված է ձայնի սինթեզավորման ավանդական տեխնոլոգիայով գեներացված խոսակցությունը, իսկ ահա VALL-E սյունակում տեղադրված է այս ներյոցանցի կողմից գեներացված խոսակցությունը, որը փաստացի հանդիսանում է օրիգինալ ձայնի կրկնօրինակումը: Այսինքն VALL-E նեյրոցանցի արդյունավետությունը տեսնելու կարող ենք համեմատել Ground Truth և VALL-E սյունակների ձայնագրությունները: