5 月 20 日消息,微信员工 @客村小蒋 昨晚分享了一则好消息,微信 AI 团队的模式识别中心凭借论文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》,在 5 月份西班牙巴塞罗那举行的 ICASSP 2026 上拿下了最佳工业论文奖。
注:ICASSP 全称是 IEEE 国际声学、语音与信号处理会议,是全球最大、最综合的信号处理技术会议,过去的最佳工业论文奖,一般是 META、微软、Spotify 这样的国外公司拿下。此次微信团队获奖也是这个奖项自 2016 年设立以来,首次颁给中国企业团队。
据介绍,微信 AI 团队的工作人员提出了 WalkVLM-LR —— 一个为视障人士行走辅助设计的视觉语言模型,核心创新是减少冗余:既减少“说得太多”(输出冗余),也减少“说得太频繁”(时间冗余)。同时,这个模型解决了“什么时候该提醒”的问题,视觉语言模型不应该无时无刻每帧提醒,而更应该在需要提醒的时候再开口。
有网友询问延迟情况如何,微信员工 @客村小蒋 表示:“目前延迟整体控制在百毫秒量级,主要依赖环境感知判断器和 VLM 共享视觉编码器来减少等待,离真实落地还有优化空间,但实时性已经比较可用。”



还木有评论哦,快来抢沙发吧~