你是不是正為複雜的電腦中文輸入法而苦惱?是不是恨不得把那令人眼花撩亂的鍵盤打碎?事實上,代替傳統鍵盤輸入法的語音輸入已經出現了,以後使用電腦,說不定根本無需動手,它就能「言聽計從」。
然而,事情卻還沒那麼完美,目前可以輸入語音的電腦還停留在只能聽懂「隻字片語」的階段,想要它接受「長篇大論」,恐怕還得需要一點時間。
如果留心的話,你一定發現最近許多資訊展中,總會有一些「會聽話」的電腦公開展示。人們對著它說一些話,電腦立刻將言語轉變成文字呈現在終端機上。語音輸入打破了人腦與電腦必須用鍵盤溝通的傳統方式,讓畏懼學習各種輸入方式,因而與電腦疏離的人,解除了對電腦的「武裝」心態。
研究電腦語音輸入,分析聲音的頻率特質是很重要的步驟。(邱瑞金)
新聞局?興奮劑?
但你可別高興得太早,如果你以為此後就可以讓電腦對人「言聽計從」,你的算盤可就打得太如意了。
在一個資訊展的攤位上,展示員正興匆匆地告訴大家他們的電腦語音輸入系統有多方便,並且當場要觀眾對麥克風說一個簡單的詞,以測試該系統的功能。這位先生說話可能有點「漏風」,他對著麥克風說:「新聞局」,電腦出現的可變成了「興奮劑」。展示員覺得這位先生的國語不標準,於是自己來一遍。他字正腔圓地重複「新聞局」三個字,這回電腦的答案竟是「性玩具」,看得展示員臉色大變,只好悻悻然以電腦「鬧情緒」為由,自我解嘲一番。
語音電腦還很笨,千萬別對它七嘴八舌,否則電腦會「不知所云」。(李淑玲繪圖)(李淑玲繪圖)
研究成果尚未成熟
別以為上面的笑話太離譜,因為語音輸入的研究成果其實還不太成熟。
從民國七十三年就開始研究電腦中文語音輸入系統的清華大學電機系教授王小川說,目前他的研究已經有的成果如下:如果是單純地辨認專有名詞,像台灣地名、路名、知名建築物等,電腦的正確率約有百分之九十六;但是每個音節的辨認就比較複雜,如果單純地分辨聲調,在民國七十六年以前,電腦分辨國語四個聲調,其正確率就已經可以達到百分之九十八,不過若要辨認每個音節,即國語的每個字音,標出其注音符號及聲調,其正確率就只有百分之九十。
而若在標出注音後,還要選對正確字,那就更不樂觀,因為同音字很多。一個句子如果有十個字,那麼這個句子完全正確的機率就只有百分之九十的十次方,也就是只有三成五左右的正確率而已,這也就是「新聞局」會變成「性玩具」的原因。
一支麥克風,就可以代替繁複的鍵盤,電腦語音輸入法實在誘人。
只聽得懂「隻字片語」
目前市面上雖然也有語音系統的軟體問市,但其實尚無法完全和人們「水乳交融」。這些軟體多半是針對特定功能所設計,比如說台北街道名稱查詢、銀行帳戶語音查詢等,他們共同的特點是查詢的資料固定,而且範圍不至於太大。只要事先輸入所有被查詢的資料,出錯的機率就不大,正確率可達百分之九十八。
然而如果就現時技術想做完整句子的辨識,可能就很難。你說:「我愛你」,電腦可能還聽得懂,可以正確地顯示你的心聲;然而你若說:「我愛你到天荒地老,海枯石爛,此生不渝……」,人腦可能很受用,電腦可就「不知所云」了。
回顧電腦語音輸入系統的發展過程,其實各國的電腦專家都投注了不少心力,然而,相對而言所得到的成果卻不成比例。七○年代美國國防部開始研究電腦語音系統,結果廿年過去了,電腦還是不能完全聽懂人話。而像IBM、AT&T等大研究機構雖曾發展出部分還算好用的實驗系統,但由於需要很大的電腦計算能力,不是一般電腦可以做到的,因此也無法立即商業化。
電腦語音輸入法對雙手忙碌的生產線工人幫助很大,有些機械性的動作只要透過簡單的口令,就可以完全由電腦代勞。
爹爹不疼,奶奶不愛?
中文語音輸入若能研發成功,市場確實潛力可期。台灣早已是個人電腦的製造王國,但本地資訊化程度卻仍然不高。許多人對電腦抱持敬而遠之的態度,主要原因可能就是我們不像歐美、日本等使用拼音文字國家的人,他們從小摸慣了打字機,使用電腦鍵盤自然問題較少;而我們無論要把一個個方塊字拆開輸入,或改記注音符號位置,或羅馬拼音法,都必須痛下決心、努力學習,才能日漸熟捻。因此,無論手寫或語音輸入,都將為中國人的資訊化點燃引信,其中自然又以更方便的語音輸入法最被期待。
國內少數研究電腦語音輸入法之一的台大電機系李琳山教授便說,如果語音輸入法能夠突破技術上的障礙研發成功,將是一個比較適合使用中文者的電腦輸入方式之一。
雖然語音輸入可能是中國人突破電腦障礙的契機,然而「中文語音輸入卻是學界不愛,業界也不歡迎的題目」,李琳山教授說,中文語音輸入的研究成果論文,由於語言背景差異,不可能在國際學術刊物中嶄露頭角,因此減低了有意投入者的興趣;業界方面,台灣電腦產品市場目前主要在美國、歐洲,台灣市場太小,大陸所得又太低,是個尚未成熟的市場,業者投資的意願就低了。
就是這麼一塊小小的PC板,語音輸入系統全包含在內,將來我們希望它能取代鍵盤輸入法。(邱瑞金)
同志還在努力
國內語音輸入系統的研究不但少,起步也晚,最早進入這個領域的王小川教授從民國七十三年開始,至今也不過九年。他承認,當初懷有很大的野心進入這塊處女地,但是九年下來,「有時實在沒什麼成就感」,他說,要突破的地方還是很多。
王教授指出,電腦語音系統最大的困難在電腦不能瞭解人類的思考方式,無法用人類的語言與人溝通,因此想要做出和科幻電影裡的電腦一般聰明的產品,必定要加入人工智慧輔助。然而人工智慧的研究,在資訊界也是仍在努力的階段。
學界想把研究做到十全十美,但是業界卻已迫不急待地推出產品了,只不過這些產品所能處理的資訊都比較簡單。「像簡單的語詞,只要輸入充份的資料,通常會有滿意的成果」,已正式在市場推出中文語音輸入系統的台康資訊公司語音研發部經理劉利誠說,語音系統先要輸入使用者的聲音特質資料,越多人的語音資料輸入讓電腦儲存,電腦「解讀」的能力就越高;此外辦認資訊若較單純,像街道名稱等,那麼正確率就很高。
語音輸入法若研發成功,對視力不良的人會是一大福音,只要對電腦開口,它就會順從地回應你。
便利的「第三隻手」
劉利誠指出,在國外,有許多醫生使用語音系統開藥方;忙碌的工廠裡,工人在雙手不得空閒的情況下,可以用簡單的語言指令指示電腦動作;簡單的銀行電話語音系統供客戶查詢帳戶;雙手不方便,而無法操作電腦鍵盤的人,可以口代手……,電腦語音輸入法的發明可以為大家帶來極大的便利。
不過劉利誠也承認,在現在的技術水準下,他們的產品銷路仍有限,「目前我們賣出去的語音系統軟體只有一、兩百套,主要的顧客以研究單位居多」,他說這顯示買這套軟體的人大多不是拿來「用」的,而是拿來再研究的。
雖然市場仍有限,但劉利誠對語音系統的未來還是充滿信心,畢竟一旦成功,全世界華人人口的市場,可是以「億」計量的。
欠缺資料庫
雖然世界各國都有人在費心鑽研電腦語音輸入系統,然而其間交流卻不多。「各國的語言文法、發音、思考都不同,所以可供參考的經驗其實並不多」,王小川說,研究語音輸入的人,在國際上其實是滿孤單的。
至於在電腦語音輸入系統中,那種語言比較佔優勢?王小川認為:「很難說。」他表示,英文的優勢在於它沒有音調的問題,但是卻有單字太多的麻煩。電腦要先輸入上萬個單字才夠用,而且其單字還在與日俱增中。至於中文常用的音節雖只有千餘個,比英文單純,但卻有四個音調的問題,使電腦系統不易分辨。他說,「其實只要電腦不能了解人類的思考方式,每種語言在語音輸入上都有它難以突破的瓶頸。」
此外,在國內研究語音輸入時,不見得只有技術上的問題,「語音資料庫」的欠缺才是大麻煩。
由於電腦很「笨」,使用的資料都要人們先輸入,因此有一個完備的資料庫供電腦使用,就顯得非常重要。
「愛」你,別「害」你
比如說,電腦「聽」人講話,其實並非像人一樣地用耳朵收音,而是靠分析聲音的聲調、頻率等資料判斷人在說什麼。一位語音輕柔的妙齡小姐說:「我愛你」,與另一位缺牙講話「漏風」的八十歲阿媽同樣也來一句:「我愛你」,你我人類雖然都可以聽懂,但在電腦的聲音分析上,由於欠缺阿媽的聲音資料,它可能把話聽成「我害你」,一之字差,結果卻是南轅北轍。
要讓電腦搞清楚「愛你」不要「害你」,就只有多告訴它「愛」要怎麼說。女孩的愛、阿婆的愛、少男、阿公……,把他們說「愛」的語調都輸進電腦裡,電腦得到「愛」的資訊越多,就能判斷出大家說「愛」的共同特點何在。只要你說的是國語,縱使是「台灣國語」、「浙江國語」、「新疆國語」,電腦習慣了使用者的語調,而且使用者也用正確的國語語法,電腦還是能正確地接受你的「愛」。這點電腦倒比人腦強,沒有語音的「省籍情結」,而且語音資料越多,以後只要有人對它說「愛」,它能正確感受到「愛」的機率就越高。
完美的情人
但是就國內的「語音資料庫」而言,目前只有交通部電信研究所建立了一些語音資料庫,但其中國人聲音特質資料,只收集了一百人左右;而同樣的資料庫在國外收集數目最少要超過一千人才夠用。
「如果資料庫完備,再加上一本語法、詞庫完整的電子詞典輔助,電腦語音輸入應該是很有前途的」,王教授表示,已經有許多教授要合力共同建立一套可用且具公信力的語音資料庫。
電腦語音輸入的研究雖逐步進行,然而卻仍有其瓶頸待突破。不過也別太洩氣,畢竟期待一部會聽話的電腦誕生的心情,可以是很浪漫的。幻想看看——一部聽話的電腦,完全地溫馴服從,就像完美的情人……。
〔圖片說明〕
P.44
給電腦更多人類聲音特質資料,將來它所能辯識的語音正確率就更高。(李淑玲繪圖)
P.45
研究電腦語音輸入,分析聲音的頻率特質是很重要的步驟。
P.46
語音電腦還很笨,千萬別對它七嘴八舌,否則電腦會「不知所云」。(李淑玲繪圖)
P.47
一支麥克風,就可以代替繁複的鍵盤,電腦語音輸入法實在誘人。
P.47
電腦語音輸入法對雙手忙碌的生產線工人幫助很大,有些機械性的動作只要透過簡單的口令,就可以完全由電腦代勞。
P.47
就是這麼一塊小小的PC板,語音輸入系統全包含在內,將來我們希望它能取代鍵盤輸入法。
P.48
語音輸入法若研發成功,對視力不良的人會是一大福音,只要對電腦開口,它就會順從地回應你。