長期以來,機(jī)器人視覺主要依賴單一攝像頭或簡單圖像識別算法,在光線變化劇烈、遮擋復(fù)雜、目標(biāo)多樣的真實(shí)場景中,往往“力不從心”。面臨識別不穩(wěn)定、誤報(bào)率高、難以理解語義意圖等問題。在機(jī)器人、智能制造和智慧城市加速發(fā)展的今天,視覺能力已經(jīng)成為機(jī)器人“智慧程度”的關(guān)鍵衡量指標(biāo)之一。
構(gòu)建“感知+理解+決策”的綜合處理能力
數(shù)碼視訊(股票代碼:300079)依托多年視頻與AI技術(shù)沉淀,積極推進(jìn)“AI感知多模態(tài)”機(jī)器人視覺解決方案,為各類機(jī)器人提供從“看得見”到“看得懂”的新一代感知底座。公司研發(fā)中的AI感知多模態(tài)方案,通過融合視覺、語音、深度信息以及各類環(huán)境傳感器數(shù)據(jù),讓機(jī)器人不再只依賴“單一畫面”,而是擁有一套更接近人類的“感知+理解+決策”的綜合處理能力。
從感知層上,方案支持多類型攝像頭、相機(jī)、麥克風(fēng)陣列、雷達(dá)等多種傳感器接入,實(shí)現(xiàn)圖像、語音、距離、運(yùn)動(dòng)狀態(tài)等多源數(shù)據(jù)采集;在理解層,基于多模態(tài)融合模型,將視覺、語音指令和場景語義進(jìn)行統(tǒng)一特征對齊與融合,完成目標(biāo)識別、場景解析、行為理解等任務(wù),為上層業(yè)務(wù)提供結(jié)構(gòu)化感知結(jié)果;在決策層,結(jié)合機(jī)器人運(yùn)動(dòng)控制與業(yè)務(wù)邏輯,對路徑規(guī)劃、抓取動(dòng)作、人機(jī)交互策略進(jìn)行智能決策,使機(jī)器人在復(fù)雜環(huán)境中保持穩(wěn)定、可靠的執(zhí)行能力。

(數(shù)碼視訊AI感知多模態(tài)應(yīng)用解決方案)
推動(dòng)多場景落地,助力機(jī)器人成為真正的“伙伴”
依托數(shù)碼視訊在邊緣計(jì)算和視頻AI算法上的深厚積累,該方案可靈活部署于多類型終端或平臺(tái),在保障實(shí)時(shí)性的同時(shí),兼顧功耗與成本,在眾多應(yīng)用場景中都具備發(fā)展?jié)摿Α?/p>
服務(wù)與陪護(hù)機(jī)器人:融合視覺與語音識別,實(shí)現(xiàn)對用戶身份、表情和語言指令的綜合理解。機(jī)器人可以根據(jù)場景(如家庭、養(yǎng)老機(jī)構(gòu)、商場)自動(dòng)調(diào)整交互策略,提供更自然、更人性化的服務(wù)體驗(yàn)。
安防與巡檢機(jī)器人:在弱光、雨霧、逆光等場景下,通過多模態(tài)融合進(jìn)行目標(biāo)識別與行為分析,并結(jié)合傳感器數(shù)據(jù)實(shí)現(xiàn)溫度異常檢測、設(shè)備狀態(tài)監(jiān)測等,為園區(qū)、廠區(qū)、交通樞紐提供全天候智能巡檢能力。
工業(yè)與倉儲(chǔ)機(jī)器人:在復(fù)雜工位和混合貨物環(huán)境中,通過多模態(tài)感知實(shí)現(xiàn)精準(zhǔn)定位、智能抓取與動(dòng)態(tài)避障,顯著降低人工干預(yù)頻次,提升作業(yè)效率與安全性。
特種與戶外機(jī)器人:在戶外復(fù)雜地形、無GPS或弱信號環(huán)境中,利用視覺、深度和環(huán)境傳感數(shù)據(jù)的融合,提高對地形、障礙物的辨別能力,為應(yīng)急救援、危險(xiǎn)環(huán)境作業(yè)提供更高的安全保障。
此外,數(shù)碼視訊的AI感知多模態(tài)機(jī)器人視覺解決方案,可為機(jī)器人廠商、系統(tǒng)集成商等提供標(biāo)準(zhǔn)化接口與定制化算法服務(wù),實(shí)現(xiàn)降低自研多模態(tài)算法與系統(tǒng)集成的門檻和成本、幫助合作伙伴快速構(gòu)建差異化產(chǎn)品,縮短從方案設(shè)計(jì)到量產(chǎn)落地的周期等積極效果。未來,公司還將持續(xù)推進(jìn)多模態(tài)感知與具身智能、端云協(xié)同大模型的深度結(jié)合,攜手生態(tài)伙伴共同打造新一代機(jī)器人智能感知平臺(tái),讓機(jī)器人真正成為人類在生產(chǎn)生活中的“智慧伙伴”,為智能制造、智慧城市等行業(yè)注入新的發(fā)展動(dòng)力。
