于繼棟:輪子現(xiàn)在還沒有出來。
艾媒網:去年聽說在研發(fā)?
于繼棟:現(xiàn)在還是有問題,就是我們現(xiàn)在大家都認為身高沒有達到一定程度,如果這么小的話放在桌子上也沒有用。
艾媒網:新一代我還沒有見到,F(xiàn)在很多需要用語音入口的東西都要用到科大訊飛的技術,你們自己有沒有說怎么去把這些廠商聯(lián)合起來?把家居智能的水平提高一個檔次?
于繼棟:現(xiàn)在有這個想法,但是技術還在突破,我們現(xiàn)在正在做一個AIUI的智能交互的系統(tǒng)。原來的語音識別技術你可能都用過,點一下再說,說完了再點,這很不方便,那個時候是為了手機設計的,但是在實際智能家居場景是完全不適合這個習慣的。我們現(xiàn)在研發(fā)是完全是脫離式的,和人一樣隨時跟他交流,可以不間斷的,我可以說多次,我還可以隨時打斷你。我們其實去年有發(fā)布AIUI的原形,最近可能會發(fā)布它的產品。希望通過這樣的交互改進,能夠讓大家在這塊的投入更多,讓這個產業(yè)發(fā)展的更快一點。
艾媒網:其實很多技術我們現(xiàn)在在實驗室里面體驗很好,或者感覺到很先進的樣子,當我們具體在生活當中用的時候總是會感覺到有點距離,像語音識別,我還得按一下?拼笥嶏w在最后這種跟用戶對接的人機交互的便利性方面會做一些什么事情?
于繼棟:交互事情上做的第一個是遠場,大概3米以上的距離,第二個是抗噪,一個是家庭里面各種各樣的聲,電視背景,小孩聲音,還有多人的聲音,還有傳輸,就跟人一樣,我說話你可以找到我。
艾媒網:可不可以介紹一下里面的原理,感覺很不可思議,遠場,很多噪聲,不同的人在講話,可能有一個家庭里面的主人,他在發(fā)布命令的人,然后大家一起說話。當主人提到什么事情的時候他可以去做?可以識別呢?
于繼棟:我們4+1麥克風陣列技術,在家里面你叫這個硬件的名字的時候,它會實現(xiàn)聲源定位,那個時間就會只聽你的聲音。其他人都會被抑制掉,這個時候如果有另外一個人再打斷可能就會采集。
上篇:
下篇: