KTH hjälper Wikipedia att prata
Nästan fyra miljoner kronor har KTH-forskare nu fått för att lära Wikipedia att prata. Det är genom ett samarbete mellan bland andra universitetet, Post- och telestyrelsen (PTS) och Wikimedia Sverige som Wikipedia ska göras mer tillgängligt för personer med bland annat nedsatt syn. Projektet har fått namnet Wikispeech.
Joakim Gustafson, professor i talteknik på KTH
– Vi har precis fått 2,8 miljoner tillsammans med bland andra Wikimedia Sverige för att ta fram en talsyntes som ska kunna ge människor med synskador och lässvårigheter bättre tillgång till Wikipedia, säger Joakim Gustafson, professor i talteknik på KTH. Vi har dessutom erhållit ytterligare 1 miljon kronor i form av en postdoc-tjänst där forskaren ska hjälpa till med detta arbete.
Wikipedia, som ofta kallas för världens största uppslagsverk, är den mest använda webbplatsen som inte drivs av ett kommersiellt företag. Den besöks av cirka 500 miljoner personer och har 20 miljarder sidvisningar varje månad. Upp till 25 procent av dessa besökare behöver, eller föredrar att, ta till sig textinformation i uppläst form. Talsynteslösningen har alltså potential att stötta cirka 125 miljoner användare varje månad.
Talsyntesen kommer att vara användargenerad, en metod som kallas "crowdsourcing". I likhet med Wikipedias artiklar innebär detta att användarna bidrar till ständig utveckling av talsyntesen så att den blir bättre och låter mer naturlig. Talsyntesen kommer först finnas på svenska och engelska men kommer även att fungera på arabiska. Möjligheten finns sedan att med hjälp av användarna utöka till resterande språk som Wikipedia finns tillgängligt på, vilket i dagsläget är drygt 280 stycken.
Talsyntesen kommer vara ett tillägg till mjukvaran Mediawiki – som Wikipedia använder – och blir därmed öppen källkod och fri att använda för de tusentals svenska företag, kommuner och universitet som redan använder mjukvaran. Allt producerat material kommer att vara fritt licenserat och kan återanvändas gratis av vem som helst, något som inte tidigare gjorts för en så omfattande talsynteslösning.
– Den interna finansieringen om 1 miljon kronor till postdoc-tjänsten kommer från det strategiska forskningsområdet Informations- och kommunikationsteknik och ICT – The Next Generation. Det är Zofia Malisz som kommer att stödja Wikispeech genom att jobba med talsyntesens uttal. Hon studerar var någonstans människor lägger tonvikten när de pratar. Om en talsyntes avviker från detta mönster, till exempel genom felplacerad eller utebliven tonvikt, blir det i längden tröttsamt att lyssna på talsyntesen. Rösten blir då både mindre naturlig och otydligare, säger Joakim Gustafson.
Förutom KTH, PTS och Wikimedia Sverige ingår även Södermalms talteknologiservice i forskningsprojektet som ska pågå mellan mars 2016 till september 2017.
Filed under: SvenskTeknik