龍騰世紀 > 科幻小說 > 外星代理人

龍騰世紀 第十四章 突破!新輸入法神器 文 / 燕飛

    杜克進入一種入魔一樣的研究狀態,他現的時間非常寶貴,完全沒有多少可以浪費的空間,所以吃完後就迅速回到自己那個小小的家裡。坐24小時不間斷下載的電腦面前,他瘋狂下載各種語音片段資料,交給克裡進行語音語義分析及基礎知識庫的建設。

    自從搬到出租屋後杜克已經瘋狂網上下載了數千各種環境和語境下的語音片段,從電視電台聞片段到影視劇對白、動物世界或是國家地理頻道的科教解說片段,以及各種偷拍、自拍、偽自拍生活現場片段,感謝酷溜土豆、yutub,還有bt和電驢,讓杜克知道原來世界還有如此豐富多彩聲音。

    杜克收集的如此眾多聲音材對於克裡處理能力來說卻彷彿是滄海一粟,往往剛剛輸入進去,克裡就運算解析出來該片段的語音語義特徵,從而為語音識別的語音語義特徵庫增加一份的標本元素,越是不同的語音片段越有價值。

    這就像一個人生活過的地方越多,就越能聽出不同地方口音是一個道理,每個聲音都是有一些特殊特徵和普遍特徵構成的,現的語音識別軟件對於標準音的識別率其實已經很不錯了。

    如ib很多年前就推出語音識別輸入系統iai,安靜環境和標準音情況下軟件識別率可以達到實用級別。

    可惜實際運用環境不會那麼理想,而是就像杜克寢室4個人一樣千差萬別,雖然大家說的都是國話,但是四個來自不同地方的人的口音卻大相逕庭,剛剛住一起的時候四個人溝通經常有些問題,但是大家很快就適應下來。

    人腦強悍的學習能力絕對不是當今電腦所能夠比擬的。而現有的語音識別軟件卻沒有這麼強悍的學習適應能力,也就是說它沒有用來識別這種語音特徵差異的知識庫,當然就無法將一些未知類型的音很好的識別出來。

    不同口音的識別和環境噪音的排除是語音識別倆個難題,要解決這些問題需要大量的第一手語音資料片段來建立一個海量的語音特徵知識庫,或者是開出像克裡這般高智能的超級電腦。

    克裡根據杜克下載的理論資料,結合各種語音片段分析,不斷對語音識別基礎算法進行了,並且生成不同的語音識別模擬器——這是主要考慮到地球現主流電腦的運算水平比起克裡來說實太低級。

    以模擬iphn4的50%運算能力為低基準,克裡模擬出不同性能情況下該語音識別算法的準確率和反應時間,原始版本從初基準性能下5秒內能夠達到90%的識別準確率——當然這個成績已經遠超現地球上所有語音識別軟件水準。

    要知道這個90%準確率是用數千段不同語境的不同口音英語音信息進行模擬識別檢驗,也就是說基本上考慮了各種口音及噪音的過濾處理。

    這個成績已經比現只會聽英的蘋果iri要強多了,畢竟iri現能夠識別的也是比較標準的英音。不信你拿印口音和加坡口音的英語錄音片段試試看iri能夠識別出多少來。

    如果是一台模擬性能接近雙核2g以上主頻電腦上,這個指標的識別水平將會提升到2秒以內達到97%以上準確率,反應時間同識別準確率其實有些衝突,因為要識別加準確必須要原始版本的語音語料庫基礎資料來源加豐富。

    聲音採樣越廣泛識別準確率越高,而語音樣本庫越龐大,用於匹配的時間就會越久導致反應時間的延長,因此語音樣本的抽樣壓縮和語音匹配算法一直是克裡優化的倆個重點。

    克裡一直不停地模擬改進提取語音語義特徵值的算法,通過不斷壓縮冗余值,保持不失真的情況下持續不斷縮小語音樣本語料庫大小,另外一方面也不斷改進對語音語料庫智能匹配算法。

    優化算法杜克幫不了什麼忙,但是收集可能多的語音樣本杜克卻沒有問題,所以杜克的每一天都過著一種非常充實的生活,日復一日地下載不同類型的語音樣本供克裡分析提煉,同時不斷去學習理解克裡所創造的這些全的處理算法,要敲開麻省理工的大門。

    杜克必須要有一篇體現自己能力的世界領先水準的語音識別基礎理論創性論,可是克裡的知識庫並沒有現成的語音識別知識,這些對於克裡來說太老舊了,老舊到比萊姆都沒有為克裡增加這些知識。

    而克裡現做的就是地球上現有語音識別理論和算法基礎上,利用他強悍到無邊的模擬能力,不斷地模擬各種不同的語音處理算法。

    通過模擬來找到一種加有效的——這種方法雖然有些笨拙,但是有了克裡超強的運算能力,畢竟每秒鐘成千上萬種可能算法都可以模擬,使得這種笨拙的方法也有相當的效果,找出了好幾種可能的優化算法,將識別率和反應時間提升到了一個的高。

    可是要將這些成果用地球人能夠理解的語言和理論寫出來,還要讓人能夠看懂,不管是對克裡還是杜克來說都是一個挑戰,因為克裡不是以01為核心的機械二進制思維模式,而是生物多態思維模式。

    管克裡現已經能夠瞬間同時模擬出地球上常見十多種不同性能p機虛擬機——為了讓克裡能夠準確瞭解地球上電腦的運算能力,杜克買了四台不同接口的主機和接近二十塊市面主流p機pu提供給克裡分析和測試性能基準,然後克裡根據這些配置的性能來進行虛擬對應的模擬器。

    可是這些特殊的虛擬機由於不需要讓人理解,所以克裡完全可以按照自己的運算方式來創造,因此性能雖然相當,但是實現模式卻大相逕庭,比起地球上ri和i倆種不同架構的pu來說,複雜程都不是一個數量級的。

    因此克裡完成了按照他自己模式實現的算法後,還要按照地球上01規則來重實現,這個對於克裡來說確實是一種巨大的挑戰了,別說論還要此基礎上再次抽像,不光要有軟件實現算法,還要建立起以地球數學基礎能夠證明的數學模型。

    因此克裡幾乎二十四小時不間斷地不斷運轉著,終模擬算法能夠低基準上面實現1秒內達到97%識別率,而雙核2g主頻電腦上實現1秒內99%以上識別率之後,足足又用了倆個周的時間。

    杜克看完十幾本數學專著,下載研究了好幾個開源語音識別軟件的基礎上,克裡才完成了語音識別算法的論和協助杜克開完成一個地球電腦上運行的語音識別軟件。而這個語音識別軟件的第一個應用就是包裝成為一種語音輸入法。

    海角論壇。完成語音識別軟件和論寫作倆個任務,杜克現是一身的輕鬆。

    他註冊換了一個馬甲加入到一個對克裡的戰爭劇情展討論,為了測試軟件,只見他對著電腦麥,量模仿各種不同的腔調口音說著話,這些話很快就被電腦識別變成字去回復論壇各種青對人物和劇情的分析。

    杜克對劇情瞭若指掌,分析起來當然頭頭是道,往往是一大段一大段的精闢分析,很快就引起了粉絲們的關注,當然有了語音識別輸入,杜克的雖然回復內容實,可是每次回復卻還是比論壇任何人都要快速。

    感覺就算比起專業速記人員也毫不遜色。

    「嘿,哥們你用的是神馬輸入法,怎麼回復那麼快,幾乎是秒回了?」一個青終於忍受不了杜克這種飛一般的回復速的好奇,忍不住問了。

    什麼輸入法?杜克一愣,隨即反應過來,自己為了測試剛剛開出來的語音識別輸入法,一時間沒有注意控制速,沒想到如此拉風的秒回竟然不知不覺就引了關注。

    「一種型的語音輸入法。」杜克變幻著用一種類似老趙的鐵嶺聲音說道,立刻電腦屏幕上準確將他的語音轉換成字,收錄到的老趙語音樣本不少,識別率自然完全沒有問題。

    剛才的討論,杜克已經用他能夠想出來的所有音方式進行了模擬測試,識別準確率分之,雖然他現只是將電視機聲音調小作為背景噪音,離一個複雜噪音環境還有一些距離,但是由於杜克變幻著不同口音和語氣,能夠達到這種水平,幾乎可以看到,鍵盤輸入法的時代結束了,這款語音輸入法的推出將宣告一個輸入時代的開始。

    「嗨,哥們,你逗我玩兒,企鵝語音輸入法我用過,那有你這速和準確率。」那個青不相信的回復道。

    「呵呵,剛拿到的內部測試版本,哦,aa輸入法,不出意外的話很快你就能夠從各大網站下載到預覽版了。」杜克想起蘋果的iri,不禁隨意地杜撰了一個類似軟件名字回復道。

    「真的還是假的?哪家公司研出來這麼牛的輸入法?」

    「這是公司才開出來的作品。正測試,呵呵,不過真的好用。擺脫鍵盤的感覺還真是不錯啊」

    「收費還是免費的?免費的話能不能將你的測試版本傳一個給我,我的郵箱是」

    「大哥,跪求一個到789」

    很快子討論就偏離了方向,開始有越來越多的人關注到這倆個人的對話,到後都加入到求aa輸入法的行業,一時間滿屏都充斥著求aa語音輸入法的回復。

    再創造一個轟動效應的杜克,完全沒有想到一個軟件實測居然會如此演變,由此可見這個語音輸入軟件的適用範圍實太廣泛了。但是杜克這次沒有頭腦熱就答應下來,他就算再缺乏情商,也知道這個時候把軟件免費出去是絕對不合適的,可見隨著智商的激增,尤其是經歷了同倆位編輯的談判後,杜克的情商還是有了那麼一點點的進展跡象。

    實戰試用非常成功,驗證語音識別算法沒有什麼問題,杜克滿懷信心地將論電子稿件投遞到了ja——這可是計算機業界頂級刊物,能這上面表論,可以無可置疑的證明自己強悍的科研能力,比一個知名教授的推薦都要有效,再配合杜克無可挑剔的gr成績,申請麻省理工博士可謂毫無壓力。
上一章    本書目錄    下一章