Mozilla使用開源的通用語音識別數(shù)據(jù)集進行多語言操作。
Mozilla宣布,它正在擴大其眾包公共語音項目——旨在創(chuàng)建開源語音識別數(shù)據(jù)集的倡議——以包括更多的語言。
該技術(shù)組織于去年6月首次發(fā)布了Common Voice,邀請世界各地的志愿者通過互聯(lián)網(wǎng)和移動應(yīng)用程序用他們的聲音錄制文本片段。
上圖:錄下你的聲音。
該項目與亞馬遜、谷歌、蘋果和微軟正在開發(fā)的越來越多的專有語音識別技術(shù)相反。上述巨頭正在大力投資語音激活的數(shù)字助理Alexa、谷歌助理、Siri和Cortana,但它們各自的數(shù)據(jù)集都是由公司擁有它。
Mozilla于11月推出了第一批英語常用語音數(shù)據(jù)集,其中包括約500小時的演講,并建立了來自2萬人的40萬段錄音。今天,Mozilla正式開始收集其他三種語言的語音數(shù)據(jù)——法語、德語和威爾士語。目前,正在為數(shù)據(jù)收集過程準(zhǔn)備其他40種語言,巴西葡萄牙語、中國(臺灣省)、印度尼西亞、波蘭和荷蘭等國家已準(zhǔn)備好開始眾包語音數(shù)據(jù)。
下一個大平臺多年以后,語音將成為下一個重要的技術(shù)平臺。就在昨天,亞馬遜正式推出了新的攝像頭注入,Alexa供電的Echo Look智能音箱,告訴你穿什么樣的衣服。我們?nèi)蕴幱谶@場運動的早期階段,但顯然聲音只會越來越普遍。
正是在這種背景下,Mozilla正在推進創(chuàng)建開源數(shù)據(jù)集的計劃,任何人都可以免費使用這些數(shù)據(jù)集來將語音識別智能構(gòu)建到各種應(yīng)用程序和服務(wù)中。
Mozilla首席創(chuàng)新官Katharina Borchert表示:“我們認(rèn)為,這些界面不應(yīng)該由少數(shù)人制作。公司作為控制語音服務(wù)的守門員,我們希望用戶能夠繼續(xù)用他們自己的語言和口音理解用戶,”Mozilla首席創(chuàng)新官Katharina Borchert說。博客帖子。
共同聲音項目的目的類似于其他用于打擊私人平臺的開放許可項目。OpenStreetMap是類似眾包項目的一個很好的例子,它為開發(fā)者提供了一個開放、免費的世界地圖,沒有谷歌地圖等競爭對手服務(wù)的成本或限制。
就可訪問性而言,英語可能在許多方面成為互聯(lián)網(wǎng)的通用語,但事實是大多數(shù)人以英語以外的語言作為母語。隨著語音識別AI革命的興起,任何為開發(fā)者和技術(shù)人員開發(fā)機器學(xué)習(xí)模型提供多語言數(shù)據(jù)集的東西,都只能是好東西。
Mozilla Common Voice項目的數(shù)字策略師Michael Henretty補充說:“使用多種語言標(biāo)志著Common Voice邁出了重要的一步,我們希望這也是整個語音技術(shù)的一大步?!薄罢Z音技術(shù)的民主化不僅會減少全球創(chuàng)新的障礙,還會減少獲取信息的障礙?!?/p>
