馬上註冊  |  找回密碼

SAY討論區

查看: 693|回復: 12
打印 上一主題 下一主題

英特爾推感知計算開發包 改變人機互動 [複製鏈接]

Rank: 6Rank: 6

好友
0
帖子
4454
積分
8894
最後登錄
2018-7-25
在線時間
0 小時
跳轉到指定樓層
樓主
發表於 2012-9-24 16:26:24 |只看該作者 |倒序瀏覽
  據國外媒體報道,英特爾在 最近召開的IDF2012開發論壇大會上正式推出瞭感知計算軟件開發工具包 2013(Perceptual Computing SDK 2013)測試版。這種SDK是幫助開發者開發應用程序,使用戶通過將語音和機器視覺與鍵盤、鼠標,直接觸摸屏結合起來的多模式界面,實現與計算設備的互 動。

  據國外媒體報道,英特爾在 最近召開的IDF2012開發論壇大會上正式推出瞭感知計算軟件開發工具包 2013(Perceptual Computing SDK 2013)測試版。這種SDK是幫助開發者開發應用程序,使用戶通過將語音和機器視覺與鍵盤、鼠標,直接觸摸屏結合起來的多模式界面,實現與計算設備的互 動。
180040zmffahkg04j.png
180040wvmjwoqvsyq.png




  這種技術不但可能從根本上改變用戶與手機、平板電腦和PC互動方式,而且是英特爾未來發展的關鍵,因為其需要耗費大量的計算資源,對英特爾的未來非常重要。今天,用戶通過無數方式如直接觸摸屏、鍵盤、鼠標和觸摸板,與計算設備如手機、平板電腦和PC互動。當我們看到微軟通過Kinect和蘋果通過Siri,對機器視覺和語音控制的早期投資,可以發現要改進用戶體驗還要做很多事情。
  語 音識別、機器視覺被廣泛使用子軍事領域,從9/11後因政府的資助過去十年獲得顯著發展,但還沒有成為平常的主流應用。語音識別的出現已經有很長時間,很 多舊版和新版Windows都預裝瞭,但卻從未真正成功,因為其從來就不是真正的自然互動而且也不準確,尤其還需要使用耳機。
  隻有在蘋果iOS和谷歌Android 平臺上,語音識別才得以發展,但仍然不足以精確到可以不要鍵盤,而且還需要連接到互聯網才正常工作。XBOX Kinect語音交互的神奇在於其有限的詞典,即“說你看到什麼”的方法、雙麥克風和“波束成形”。微軟的方法在遊戲環境中使用不錯,但在需要跨不同設備 進行廣泛使用時還是不自然。
  機器視覺是最近通過微軟的Kinect才流行起來。Kinect使用瞭兩個攝像頭,但不能準確地檢測特定手指和關節。雖然處理是在攝像頭和XBOX上完成,但用戶必須呆在房間裡的某個地方,而遊戲僅限於需要最少計算資源的不復雜遊戲。
一些電腦制造商甚至谷歌的Nexus7提供瞭面部識別功能,但這些功能都很慢而容易被圖片、視頻或面具所愚弄。除瞭電視外,對於大多數計算環境這都是不可接受的。
  怎 樣才能使界面更自然?首先,需要以非常低的功耗使用大量本地計算性能才能使用自然用戶界面。讓我們用保護用戶登錄安全的機器視覺為例。最好的方法是要有兩 個高分辨率攝像頭,繪制人臉的三維視圖。可以把這看作是3D遊戲的逆向工程。3D機器視覺不是顯示遊戲的像素和紋理,也是將這些多邊形和紋理輸入計算設 備。挑戰在於,這需要大量的處理性能和大量的電力,不僅是計算引擎而且還有高分辨率和立體攝像頭都需要。
  然後,3D“圖”需要與本地數據庫的圖案匹配,這需要更多的計算性能和電力。這個步驟被叫做“對象識別”,設備需要判斷誰在看。雖然這種安全的、面部識別登錄隻是一個例子,但這種自然用戶界面潛在用途還有很多:
  --在商務會議上主持人可使用手勢來移動幻燈片,而不需要“點擊”。他們隻要搖動下手。
  --手上沾有面粉的廚師在看食譜時,隻要揮下手就能翻頁。
  --服裝設計師可使用自己的雙手、手臂和軀幹,穿戴電腦設計的一對墊肩。
  --通過識別聲音的語調,家庭電腦就知道在你煩惱時避免讓你分心。你回家時就可享受柔和的音樂和暗淡的燈光。
  --當聽到恐慌的聲音時,你汽車上的電腦就知道你有麻煩瞭,然後問是否要打911報警。
  --你的家庭電腦感覺有其無法識別的人在用你的電腦,就會通過短信發送該人的照片。
  --在療養院,租戶電腦能知道療養的人整天沒有起床,就會通知護士或家庭成員。
  --通過結合語音、文本和唇讀,聽寫達到近100%的準確。
  --在你告訴孩子隻有2個客人後,如果房間裡出現5個人,電視能識別並向你發出警告。
  --“手鼠標”取代實物鼠標或觸摸板,手可以在屏幕的任何地方點擊和揮動。攝像頭可實時拍下你的手、關節和指尖。
  --會議記錄可記錄會議上的所有東西,並按不同的人分開記錄。動作和“停頓”都是自動“感知”。
  這種例子是...通過這些非常個性化的例子,需要隱私控制,英特爾在SDK加入瞭“隱私通知”。當指示器顯示當你正在被麥克風或攝像頭記錄時,這變得很簡單。
  如 果說語音和機器視覺都不是直接觸摸觸摸板和顯示器,鍵盤和鼠標將很快消失,就錯瞭。我們將轉到“多模式”界面,設備將根據環境和用戶歷史選擇最好的控制方 式。這就是英特爾的“使用模式協調“,可選擇最好的互動模式。另外,在需要協調時可同時使用兩種不同的模式。唇讀可以與語音、文本結合,從根本上改善語音 互動。
  我們什麼時候可以實現?英特爾的感知計算計劃是一個長期的計劃,逐年看到性能和 可交付成果的進步。今天,攝像頭還太大,要一直使用需要太多電力。即使系統總線和USB都需要太多的電力,很可能被移動總線如MIPI取代。隨著時間的推 移所有這一切都可以解決。除瞭英特爾外,將會有很多不同公司爭奪領先地位,因為這是非常關鍵的領先優勢。
  英特爾處於有利的位置,因為該公司具有很大的規模、影響力和力量,是英偉達之 外唯一跨越從智能手機到超級計算機芯片的公司。如果英特爾可以成功地領先行業,需要在一開始就有大量的高性能芯片,而這正是英特爾的優勢。對英特爾來說時 間是最關鍵的,因為該行業已經一次又一次看到該公司投入瞭大量的時間和精力,在移動芯片的視頻編解碼上,為縮短差距需要固定功能或半可編程芯片。
分享分享0 收藏收藏0 讚好讚好0 Unlike!Unlike!0 分享 傳送 邀請

好友
0
帖子
131296
積分
136939
最後登錄
2019-2-28
在線時間
0 小時
No.1回覆者
發表於 2012-9-24 18:52:02 |只看該作者
支持一下吧

好友
0
帖子
125023
積分
125030
最後登錄
2019-2-28
在線時間
0 小時
跟尾2
發表於 2012-9-24 19:14:52 |只看該作者
哎 怎麼說那~~

好友
0
帖子
124715
積分
124721
最後登錄
2019-2-28
在線時間
0 小時
跟尾3
發表於 2012-9-24 19:16:51 |只看該作者
真是佩服得六體投地啊

好友
0
帖子
125462
積分
125468
最後登錄
2019-2-28
在線時間
0 小時
5#
發表於 2012-9-24 19:30:08 |只看該作者
要是能在多一點就好了

好友
0
帖子
124733
積分
124739
最後登錄
2019-2-28
在線時間
0 小時
6#
發表於 2012-9-24 19:48:47 |只看該作者
這篇帖子,我還是第一次在這看到

好友
0
帖子
123769
積分
123789
最後登錄
2019-2-28
在線時間
0 小時
7#
發表於 2012-9-24 19:55:40 |只看該作者
搶座位來了

好友
0
帖子
130012
積分
135426
最後登錄
2019-2-28
在線時間
0 小時
8#
發表於 2012-9-24 20:08:22 |只看該作者
不錯啊! 一個字牛啊!

好友
0
帖子
123769
積分
123789
最後登錄
2019-2-28
在線時間
0 小時
9#
發表於 2012-9-24 20:16:35 |只看該作者
呵呵,明白了

好友
0
帖子
124624
積分
124680
最後登錄
2019-2-28
在線時間
0 小時
10#
發表於 2012-9-24 22:46:54 |只看該作者
今天沒事來逛逛  
您需要登錄後才可以回帖 登錄 | 馬上註冊 |

Archiver|手機版|SAY討論區

GMT+8, 2026-5-28 22:46 , Processed in 0.777740 second(s), 12 queries .

Powered by go2tutor.comDiscuz! X2

© 2026 Community Networks Limited

回頂部