iPhone/Android推波助瀾
行動VoIP/網路視訊掀熱潮 - 封面故事 - 新通訊元件雜誌

iPhone/Android推波助瀾<br>行動VoIP/網路視訊掀熱潮 - 封面故事 - 新通訊元件雜誌

手機關鍵元件再掀激戰
iPhone/Android推波助瀾
行動VoIP/網路視訊掀熱潮
新通訊 201010 月號 116 期《 封面故事 》
文.曾志佳
iPhone及Android等智慧型手機的出現,加上3G和即將到來的4G技術,改變了用戶對於手機的使用習慣,行動網路數據服務取代傳統電信服務一躍而成了主流。網路語音和視訊應用將是新的趨勢,但如何克服技術上的障礙,提供用戶高品質的服務,是業者當前必須先解決的問題。
多媒體行動通訊裝置隨著蘋果(Apple)iPhone及Google Android手機的出現,有了全新的改變,特別是近年iPhone 3G及iPhone 3GS,以及多款Android手機面世,掀起了全球對行動語音及網路視訊應用的一波熱潮。根據市場研究機構Gartner預測,Android手機將於2012年超越iPhone,成為第二大主流智慧型手機,達到14.5%的市場占有率,而iPhone則有13.7%的市占率。研究調查機構AdMob的資料顯示,2010年2月分全球來自iPhone的資料傳輸量占行動網路整體資料傳輸量的50%,而來自Android手機的資料傳輸量則占整體的24%。

隨著未來有更多Android手機推出市場,加上新一代的iPhone 4也已經上市,預計行動網路的資料傳輸量在未來將以倍數增長。而英國Screen Digest的報告也指出,全球手機視訊應用程式的銷售額預計在未來4年增長一倍,達到24.2億美元,其中2010年將有最大的增幅。

現在的手機用戶都期望擁有能夠提供獨特體驗的智慧型手機,而高品質通訊能力正是其中之一。但另一方面,行動網路存在延遲和封包遺失問題,加上行動裝置的中央處理器(CPU)能力有限,很容易導致嚴重回聲,這些都為開發高品質網路語音通訊協定(VoIP)及視訊應用帶來了諸多挑戰,即使是經驗豐富的媒體處理專家也會感到棘手。事實上,行動VoIP應用的成功關鍵就在於開發者必須充分了解如何才能以最佳途徑解決網路和設備的限制問題,而這些問題有可能影響通話品質,甚至最終讓通話無法正常進行。

本文除對上述問題進行探討,並闡釋如何利用iPhone及Android手機等智慧型電話的獨特能力讓應用程式實現VoIP功能。除將討論行動裝置在網際網路存在的一些既有困難,以及行動設備獨有的回聲和作業系統優化等問題,另會介紹如何克服這些障礙,以提供高品質的終端使用者體驗。

行動裝置搭配VoIP為發展趨勢

在90年代,網際網路開始普及,為網際網路的通訊應用創造了巨大商機。VoIP起步之初就被視為電話的替代品,提供一種取代傳統公用交換電話網路(PSTN)通訊的低成本方案。不過當時大多數的音訊編解碼器(Codec)都是為既有的分時多工(TDM)網路而設計的,而視訊編解碼器則處於萌芽階段,因此語音及視訊通訊經常因為不穩定而導致幾乎無法使用。但隨著技術的進步,專門針對網際網路的語音處理解決方案成功面世,音質得到了顯著改善,結果是造成採用寬頻編解碼器等技術的個人電腦應用如Skype和Google Talk的流行。這些應用既可獲得比PSTN更好的品質,同時還能提供免費或低價的通話服務。由於網際網路可以帶來豐富的多媒體通訊體驗,視訊技術領域的進一步發展增強了產業對這類應用的興趣。

雖然個人電腦是公認適用的IP通訊平台,但行動設備的普及性和便利性卻使其非常適合於提供下一代IP語音/視訊應用。行動VoIP最初是應用在比如iPaq的口袋型電腦(Pocket PC)設備,這些設備執行Windows CE,並經由無線區域網路(Wi-Fi)存取網際網路。隨著網際網路通訊需求成長,傳統行動電話也能夠存取網際網路,並內建應用作業系統,這就是所謂的智慧型手機。

這些早期的智慧型手機一般執行Symbian或Windows Mobile,提供「雙模式」功能,除了無線區域網路(Wi-Fi)之外,還可以存取傳統的行動網路。智慧型手機為行動VoIP市場的成長帶來了最具前景的商機,尤其是iPhone和Google的Android平台等解決方案的面世,更有推波助瀾之勢。

儘管智慧型手機提供這樣的機會,但行動設備VoIP的實現仍是一大技術挑戰。首先行動電話乃小型設備,處理能力有限,而且價錢可能會比較昂貴,電池的使用壽命也很短。因此,VoIP處理軟體在記憶體使用和運算複雜性方面必須非常高效。處理器通常需要一定程度的最佳化,而且大多數元件需要訊號處理演算法的定點執行。這些任務的要求非常嚴格,不僅需要程式設計技巧,還要求訊號處理領域的專業知識。

除了設備的限制之外,網路連接的品質也是行動VoIP應用開發面對的獨特挑戰。所謂行動設備,自然是指透過無線網路工作的元件。VoIP通話採用的無線存取方法一般是Wi-Fi、3G或GSM增強數據率演進(EDGE)封包資料連接等。對於這些無線連接而言,許多因素都可能會干擾無線訊號的傳輸。例如當設備遠離無線基地台或存取點時,訊號強度便會降低,而背景雜訊電平變大,因此可能出現訊噪比降低的狀況。使接收品質降低的另一主因,是在相同或相鄰頻率上通訊的其他使用者所造成的干擾,這可能導致位元誤差而出現封包遺失情況。此外,要使VoIP這類即時通訊變得高效,延遲必須被減到最小,避免因須要重發而導致封包遺失。為了對行動VoIP進行高級別的封包遺失補償,接收器端軟體必須採用遺失封包隱藏(Packet Loss Concealment, PLC)技術來補償輸出訊號中的錯誤。對行動解決方案而言,PLC方法必須能夠處理可能高達30%的高峰值封包遺失率。

此外,開發應用時,須要考慮的另一個方面是目前無線VoIP中常見的瓶頸。過多用戶共用同一個頻帶或存取點(尤其是Wi-Fi),會導致輸送量和傳輸時間的變化。這種現象稱為跳動(Jitter),常見於當接收器接收資料包的間隔時間不規則時。圖1所示為Wi-Fi通道跳動測量的實例。

圖1 WiFi通道跳動的延遲變化

對付跳動的最好方法是在接收端增加一個緩 衝器來消除延遲變化。緩衝量應該是自我調整(Adaptive)且大致符合跳動曲線的封包軌跡。最佳也最具自我調整能力的解決方案,能夠把延遲減至最小,同時可消除跳動,提供最清晰和連貫的通話效果。

iPhone引領VoIP邁向普及

iPhone的上市為行動領域帶來了突破性的設計和多媒體能力。iPhone的音訊和視訊處理能力讓它成為極具吸引力的即時IP通訊平台。這種手機的開放式應用程式介面(API)和靈活設計,意味著任何熟悉麥金塔(Mac)作業系統的開發人員都能夠實現高品質語音通話功能,而且未來還有可能增加即時視訊功能。網際網路存取方式包括Wi-Fi和3G/EDGE,故實際上能夠在任何位置進行VoIP通話,使得離IP通訊普及化的目標又邁進了一步。

然而,上述提到的能力是很令人振奮,但iPhone這類設備也增加了VoIP應用設計的複雜性。譬如,除了行動設備慣常存在的跳動問題之外,當終端使用者須要同步執行幾項任務時,iPhone等智慧型手機還會引入額外的跳動。舉例來說,iPhone使用者可能在通話期間收發電子郵件,結果便會使VoIP通話的處理受到延遲。VoIP軟體所受到的影響與網路跳動相同,這時一個可靠的跳動緩衝器就更顯必要。另外,使用者在通話時往往須要存取iPhone螢幕,因此免持聽筒通話是常見的使用情況。不過,使用者離麥克風越遠,揚聲器音量越大,聲學回聲也越多,這進一步增加了對大部分行動設備來說已經很高的高效聲學回聲消除(Acoustic Echo Cancellation, AEC)通話要求。AEC是大多數平台所面臨的一大難題,在處理能力有限的行動設備上尤甚。

這些獨特的要求正是高品質語音和視訊處理能力如此重要的原因所在。由於iPhone應用開發人員一般都並非音訊或視訊專家,故廠商的目標就是為iPhone開發社群提供即時IP多媒體通訊功能。

網路視訊創新智慧手機應用

網際網路需要獨特的解決方案來解決封包遺失、延遲和跳動等問題。為了解決這些問題並提供最佳的音質,廠商開發出了一系列創新解決方案,比如網際網路低速率語言編解碼器iLBC,此為一種網際網路工程任務小組(IETF)制定的標準,和網際網路語音影像編解碼器iSAC及NetEQ跳動緩衝器。另如語音處理套裝軟體VoiceEngine最初是針對個人電腦和微軟(Mocrosoft)Windows作業系統推出,包含一整套完善的VoIP聲音處理軟體,能夠幫助應用開發人員處理所有的語音處理複雜問題。

首個針對iPaq上Windows CE作業系統的語音引擎行動版本是一項突破性的進步,因為它能讓行動設備獲得高品質的Wi-Fi VoIP通訊,語音引擎自此廣泛流行,並推動了Skype、Google Talk和Yahoo Messenger等應用。由於語音引擎在行動領域的長期口碑及廠商在Mac方面擁有的豐富體驗,下一步很自然就是將之移植到iPhone上。而隨著iPhone上的應用程式介面變得開放,開發人員很快就能為iPhone開發即時的語音和視訊解決方案(圖2)。

圖2 VoiceEngine Mobile解決方案

智慧型手機尤其是iPhone的獨特要求,意味著語音引擎處理網路封包遺失和硬體設備限制的能力對行動環境更加重要。獨立於平台的代碼庫,結合了專為iPhone所用安謀國際(ARM)處理器最佳化的代碼元件庫,能讓開發人員替iPhone迅速推出高性能套裝軟體,而不必再擔心CPU的能力限制。此外,語音引擎還包含了被稱為NetEQ的自我調整性跳動緩衝器,用於管理網路封包遺失和由智慧型手機引入的額外跳動。NetEQ採用了新的跳動處理方法和封包遺失隱藏技術,能夠迅速根據具體情況對跳動問題進行處理,同時把緩衝延遲減至最小。

最後,語音引擎還使用了先進的AEC和雜訊抑制解決方案,可把行動環境中極為常見的回聲效應和背景雜訊降至最小。所有這些能力都專門針對iPhone調整至最佳化,使得語音引擎成為行動VoIP應用開發人員的理想解決方案。

此外,針對iPhone開發的語音引擎行動版本尚提供了豐富的應用程式介面,便於開發人員在自己的目標應用中整合極高品質的VoIP,並能夠靈活調整各種參數,比如回聲消除。

另一方面,廠商亦推出用於Android手機作業系統的語音引擎和視訊引擎,為手機開發人員提供了在Android手機作業系統中,用於開發具視訊會議和視訊聊天功能應用程式的重要模組,應用程式開發人員透過在Android應用程式中加入廠商所提供視訊支援功能,便能夠利用既有的即時視訊技術來提供即時語音和視訊功能,節省大量研發投資成本。

隨著行動設備即時語音和視訊通訊市場不斷成長,開發人員必須了解行動設備應用開發的獨特需求。他們必須考慮到跳動、延遲、聲學回聲和CPU限制等因素,以便獲得高品質的語音及視訊體驗。

(本文作者為Global IP Solutions亞太區市務總監)


留言