龍騰世紀 > 科幻小說 > 外星代理人

龍騰世紀 第二百五十章 翻譯器問題 文 / 燕飛

    將那些小的安全漏洞交給趙建武,讓趙建武找人通過各種渠道散出去這些資料,這個事情畢竟不算是什麼光彩的事情,背後輕輕使使絆子就好,沒有必要衝出去肉搏,這樣也太讓人笑話了。

    搞定了這一切,杜克終於感覺神清氣爽,雖然費老大的勁兒將目前的一大危機解除,但是現諾基亞移動仍然元氣大傷,國內市場還行,基本同上個月火爆情況持平,殊為不易,但是現海外市場的銷售禁令解除後,銷售量同之前相比那是一落千丈,現一個月銷量同之前一周差不多。

    這個由於專利阻擊造成長時間停售的負面效應還沒有消停,估計廣告攻勢下,下一個月將有所好轉,不過原本預期到年底銷售6000萬部的目標恐怕有些困難了。

    被逼大熱倒灶,還憋出一身內傷,對於諾基亞移動來說,這是一件非常悲催的事情,好終還是逃過一劫,頑強活過來,就算年底銷售能夠做到5000萬部,相對於以前的諾基亞手機業務已經是好得太多。

    這可是高端機型的銷售量,使得諾基亞品牌手機重擠入高端手機三強行業,不但將獲得一多億美元的稅前利潤,是對於來年機型的布和銷售,將具有強大的提振作用。

    不過這些具體的事務杜克就完全不用去關心了。

    他現需要回過頭整合自己的研方向。

    操作系統研項目,一個月得花三五天功夫過去看看架構上的討論和爭議,把握整個項目的技術方向,具體的編程和子模塊實現杜克則完全不管,要是這些東西都要他操心,全副身心投入進去都幹不完。

    手機研,無論軟件還是硬件現都基本上比較成熟了,杜克差不多完全脫手。

    現投入這個上面的足足幾萬人,基本上算得上是當今各大手機企業為龐大的一股研力量,再加上杜克研出來的強大操作系統,這個基礎上都還幹不過競爭對手,趙建武這個領頭的可以直接找塊豆腐撞死算了。

    麻省理工的倆個博士課程,杜克現不想去上完拿到那倆學位了。畢竟現重要的東西已經得手,物理學上,一篇天然核反應堆原理揭密,足以奠定他宗師級的江湖地位,現回到美國去讀完書,意義不大,風險很高,搞不好被失蹤都有可能。

    剩下的型顯示器工藝研和基地建設,現也緊鑼密鼓進展之,基本上到了建設和研的後半場,如果不出意外的話,到年底之前就能夠實現批量量產,所以也不需要杜克費什麼腦筋了。

    這麼一看,暫時杜克竟然可以清閒下來了。

    這可真是太難得了。

    想到難得有如此清閒,杜克帶著一家直接上寨溝準備呆一段時間,面對神仙境地一般的風光,放鬆心靈,並計劃下一步要走的路線。

    可惜好景不長,杜克才到那裡住了三天時間,就被趙建武叫回來了。

    因為趙建武的翻譯器項目現遇到了一個極大的難題。他們研究了好久還是沒有獲得突破性的進展,所以趙建武不得不向杜克求援了。

    「杜克,事情是這樣的,」趙建武拿著一個像是p3一樣的小東西,對杜克說道。

    「你看我們這個翻譯器現直接識別出和英的語音一點問題都沒有,準確率基本上99%以上,可是我們的翻譯程序卻很弱,將英翻譯為的有效率差不多有分之八十,勉強還湊合,但是翻譯成為英,這個有效率分之五十都不到。」

    「這樣子基本上這個東西實用性就很差,如果雙方僅僅是口語差一些,書面語言能力尚可,那麼對著這個翻譯器的直接語音識別出來的字還能夠勉強交流下去,但是如果雙方對於對方語言完全沒有基礎,那麼這個東西基本還是沒用。

    你看能不能想想辦法,解決這個英智能互譯的問題。」

    聽了趙建武的介紹,敢情這東西現就能夠起到一個語音識別作用,翻譯方面給網上那種不靠譜的翻譯軟件一樣,翻譯出來的東西簡直慘不忍睹。

    杜克隨意試了一下翻譯效果,「白日依山」,杜克說出了一句常見的古詩詞,「thdaythuntaintak」看著這個翻譯出來的結果,杜克直接笑噴了。

    「呵呵,武哥,你這個東東悟性很高,這樣也能夠搞。」杜克笑著說道。

    趙建武到是毫無愧色,「我們這水平也算不錯的了,你試試用g哥來一下,也就是這水平。不過這玩意要拿出去賣錢那是萬萬不能的,所以哥哥才來找你求援。」

    趙建武還真會給杜克找麻煩,老實說杜克對於這個還真沒有什麼研究,只不過開語音識別,杜克對於語音語義一類的東西涉獵甚深,想來翻譯也應該要用到這類東西。

    「行,這個課題我先研究研究,看看有沒有一些好的思路供大家來參考。」杜克爽快地答應道。這個小東西前景非常好,如果能夠做出來,對於a來說,顯然又是一個的金礦,只不過對於那些辛辛苦苦學習翻譯技巧的人來說,這個東西出世就是一場悲劇了。

    杜克拿走了現公司開的翻譯模塊源代碼,帶回去準備讓克裡優化優化,雖然呆公司也能做這件事,但是杜克覺得還是回家舒服安全一些。像克裡這個大殺器,這裡做事人多眼雜,萬一不小心就難免露出一些馬腳。

    現杜克是眾人關注的焦點,有些東西就加不能不小心了。

    自然語言處理技術是一門集語言學、數學、計算機科學和認知科學等於一體的綜合性的交叉學科。研究語音識別的過程,杜克其實已經解決了語言處理一些疑難問題:比如生詞識別問題、歧義消解問題、自動分詞問題、詞性定義規範問題等。

    可以說現已經有了非常雄厚的基礎來進一步,回到家,杜克找到了機器翻譯的一些相關關鍵技術資料,包括對目前國際上機器翻譯研究進展,漢語詞法分析技術、漢語句法分析技術、漢語詞彙語義相似計算、漢英雙語語料庫的詞語對齊、語料庫的結構對齊、基於結構對齊語料庫的翻譯模板抽取、多引擎機器翻譯方法等多方面的研究成果。

    很快,這些研究成果就轉換為克裡開翻譯算法的基礎知識,然後轉換為的代碼,很快,一個的翻譯引擎誕生了。

    杜克再試著輸入「白日依山」,程序翻譯結果「thunfaintthuntain」,雖然意境上差了十萬八千里,但是比原來的翻譯結果來說已經強了一倍都不止。至少勉強有了那麼一點意思上的相近了。

    對於這個結果,杜克也無可奈何,錯非精通英化的資深專家,才可能將雙方的古詩詞進行比較流暢翻譯,但是對於日常口語來說,這些未免要求太高。杜克接著試驗了一下日常所用的句子,找了幾篇英報紙聞翻譯了一下,基本上都能夠將章的大概意思表達清楚。

    這就夠了。做到這個程,杜克停下了,準備過幾天將成果交給趙建武,瞭解這樁事情,不過既然假計劃泡湯,杜克也就認命,準備開始了下一階段的工作。

    p1:第三!提前一點了。這是今天為書友「美人玉」捧場打賞的第一個加。昨天累計11個加,現幹掉了一個,但是書友「樑柱是好人」再次捧場《外星代理人》666縱橫幣,所以,所以……還是有11個加身!小飛還得痛並快樂著去碼字,你們絕壁是故意的啊

    p2:這章了一點資料過渡,可是這章足足2500多,即便去掉這些字數也是足足的,不是灌水啊

    p3:收藏?!收藏也要火起來啊,看完後右邊藍色「加入書籤」上面點一下,這個世界就完美了,你好,我好,大家都好……藍屏的,效果你懂的
上一章    本書目錄    下一章