大模型賦能機器狗 西工大離線具身智能研究取得新突破
中新網(wǎng)西安3月20日電(記者 阿琳娜)一只機器狗在街上邁著規(guī)律的步伐,拉著牽引繩的盲人在它的帶領(lǐng)下越過沿路障礙,平穩(wěn)地行走著。電子導盲犬能否取代傳統(tǒng)導盲犬,解決視障人士一犬難求的困境?記者20日從西北工業(yè)大學獲悉,該校團隊在此方面開展研究攻關(guān)并取得了新的突破。
據(jù)了解,西北工業(yè)大學光電與智能研究院聯(lián)合中國電信人工智能研究院在探索離線具身智能應用方面取得階段性進展。具身智能,即具有物理實體,能夠通過傳感器和執(zhí)行器與環(huán)境進行實時互動,執(zhí)行相應指令或進行決策的智能機器。
李學龍教授團隊將機器狗搭載離線大模型,應用在智能導盲場景,開發(fā)出大模型離線具身智能導盲犬,并實現(xiàn)了其智能人機交互、智能乘梯引導、智能過街引導、智能室內(nèi)引導等功能。
該成果進一步展示了使用離線具身智能導盲犬代替?zhèn)鹘y(tǒng)導盲犬的可能性,同時驗證了離線具身智能范式的可行性,使大模型具身智能機器人可以脫離互聯(lián)網(wǎng)環(huán)境,應用在無網(wǎng)或網(wǎng)絡信號不佳的工況環(huán)境,進一步拓展了臨地安防的應用場景。
近年來,隨著機器人技術(shù)和SLAM導航技術(shù)的快速發(fā)展,針對電子導盲犬的探索也層出不窮。然而受制于自然語言處理技術(shù)的限制,上一代電子導盲犬仍然欠缺和人類“自由對話”的能力,也難以為視障人士提供情感陪伴。
大模型及具身智能技術(shù)的出現(xiàn)使電子導盲犬實現(xiàn)這種高級能力成為可能。但機器狗的低算力計算平臺難以支撐大模型運行所需的海量計算資源,通常只能通過請求云服務的“在線具身智能”范式獲得大模型的高級能力,這嚴重限制了電子導盲犬的場景應用范圍。
為此,李學龍教授團隊結(jié)合目前最新的大模型量化壓縮和加速推理技術(shù),成功將大模型部署至機器狗的低算力計算平臺,驗證了“離線具身智能”范式的可行性。
目前通過實驗,團隊開發(fā)的離線具身智能導盲犬已能夠與視障人士流暢溝通指令,并帶領(lǐng)其通過馬路、樓梯、電梯等多樣復雜環(huán)境,驗證了離線具身智能導盲犬的智能人機交互能力、電梯弱網(wǎng)絡環(huán)境下的智能乘梯引導能力、實時性要求較高的智能過街引導能力和智能室內(nèi)引導能力等。
該成果證明了離線具身智能導盲犬代替?zhèn)鹘y(tǒng)導盲犬的可能性,同時驗證了離線具身智能范式的可行性,使大模型具身智能機器人可以脫離互聯(lián)網(wǎng),應用在無網(wǎng)或網(wǎng)絡信號不佳的工況環(huán)境,提供更加實時的智能響應以及更好的人機交互體驗。
未來,團隊將進一步優(yōu)化具身智能導盲犬技術(shù)方案,與電信星辰大模型相結(jié)合,探索在線與離線相融合的分布式異構(gòu)具身智能方案,進一步拓寬離線具身智能導盲犬及更多智能機器人平臺的應用場景,有效賦能工業(yè)生產(chǎn)智能化,加快形成新質(zhì)生產(chǎn)力。(完)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責任。