Svatko se od nas puno puta našao u prepunoj prostoriji u kojoj  gomila govornika proizvodi kakofoniju zvukova iz koje je teško razabrati i što vam govori onaj prvi do vas. A sad zamislite da se u toj galami možete fokusirati na određenog govornika ili ukloniti zvukove iz određenog 2D područja. To bi zahtijevalo razumijevanje i manipuliranje akustičnom scenom, izolaciju svakog govornika i povezivanje 2D prostornog konteksta sa svakim govorom.

Odvajanje govornika

Nažalost, odvajanje govora velikog broja govornika u prostoriji u pojedinačne tokove i identificiranje njihovih preciznih lokacija poprilično je izazovno, čak i za ljudski mozak. No, ono što ne može ljudski mozak sam, postaje moguće uz pomoć suvremene tehnologije.

Roj robota u svojoj stanici za punjenje, u koju se roboti mogu automatski vratiti 📷 April Hong/University of Washington
Roj robota u svojoj stanici za punjenje, u koju se roboti mogu automatski vratiti

April Hong/University of Washington

Istraživači Sveučilišta u Washingtonu razvili su pametni zvučnik koji mijenja oblik i koristi mikrofone koji se sami postavljaju kako bi podijelio prostorije u govorne zone i pratio položaj pojedinačnih govornika.  

Akustični rojevi

Riječ je o, kako su ga nazvali njegovi tvorci, “akustičnom roju” koji jamči razlučivost koristeći zvuk, eliminirajući pritom potrebu za kamerama ili vanjskom infrastrukturom. Ovaj roj tvori bežični mikrofonski niz koji omogućuje odvajanje i lokaliziranje raznih ljudskih govornika u prostoru, postavljajući ih u različite govorne zone. 

Akustično raspršivanje roja... 📷 University of Washington
Akustično raspršivanje roja…

University of Washington

Svestrani sustav, predstavljen u časopisu Nature Communications, omogućava stvaranje aktivnih zona u kojima se hvataju glasovi, ali i zona s utišanim zvukom te može lokalizirati i razdvojiti tri do pet istovremenih izvora zvuka s preciznošću od 15 do 50 cm. Uz pomoć algoritama za dubinsko učenje, on razdvaja istovremene razgovore, čak i ako govornici imaju slične glasove. 

... i vraćanje akustičnog roja u bazu 📷 University of Washington
… i vraćanje akustičnog roja u bazu

University of Washington

Poput flote Roomba usisavača, svaki promjera oko 2,5 cm, mikrofoni se automatski postavljaju na položaj iz stanice za punjenje i potom vraćaju na nju. To omogućuje premještanje sustava između okruženja i njihovo  automatsko postavljanje. Na sastancima u konferencijskoj sobi, na primjer, takav se sustav može postaviti umjesto središnjeg mikrofona, omogućujući bolju kontrolu zvuka u prostoriji.

Sedam malih robota

Prototip se sastoji se od sedam malih robota koji se raspoređuju po stolovima različitih veličina. Dok se miču sa svog punjača, svaki robot emitira zvuk visoke frekvencije, poput šišmiša u letu, koristeći tu frekvenciju i druge senzore za izbjegavanje prepreka i kretanje bez pada sa stola. Automatsko postavljanje omogućuje robotima da se sami postave za maksimalnu točnost, dopuštajući veću kontrolu zvuka nego ako ih postavlja čovjek. Roboti se razilaze što je moguće dalje jedan od drugog jer veće udaljenosti olakšavaju razlikovanje i lociranje ljudi koji govore. 

Stvaranje govornih zona pomoću akustičnih rojeva 📷 University of Washington
Stvaranje govornih zona pomoću akustičnih rojeva

University of Washington

Neuronske mreže koriste vremenski odgođene signale za odvajanje onoga što svaka osoba govori i praćenje njihove pozicije u prostoru. Dakle, možete imati četiri osobe koje vode dva razgovora i izolirati bilo koji od četiri glasa i locirati svaki od glasova u sobi, objašnjavaju istraživači koji planiraju izraditi robotske mikrofone koji se mogu kretati po cijelim prostorijama, umjesto da budu ograničeni na stolove.

Konus tišine

Istražuju i mogućnost emitiranja zvukova koji omogućuju isključivanje zvuka i aktivne zone u stvarnom svijetu, tako da ljudi u različitim dijelovima sobe čuju različite zvukove. Znanstvenofantastični “konus tišine” iz filma “Get Smart” tako bi mogao postati stvarnost, pišu autori.

Automatsko postavljanje omogućuje robotima da sami odrede poziciju za maksimalnu točnost informacije 📷 University of Washington
Automatsko postavljanje omogućuje robotima da sami odrede poziciju za maksimalnu točnost informacije

University of Washington

“Mogli bi sustavu reći da ne snima ništa oko stola i on će stvoriti oblak metar oko govornika u kojem ništa neće biti zabilježeno. Ili ako dvije grupe razgovaraju jedna pored druge i jedna se postavi u zonu isključenog zvuka, njihov će razgovor ostati privatan”, najavljuju istraživači.

Više o temi

Izvor:Bug.hr