京东开源实时视觉语言交互模型JoyAI-VL-Interaction

发布时间：2026-06-22 17:54

　　传统模型通常要等用户发起问题，才开始处理当前画面，而 JoyAI-VL-Interaction 可以持续观察流，自主判断什么时候该说话，什么时候该沉默。

　　传统理解更多是上传完整后再分析，但在安防预警、实时翻译、直播解说、操作指导等场景里，晚几秒，体验和价值都会不同。JoyAI-VL-Interaction 面向正在发生的流，画面变化时就能响应。

　　JoyAI-VL-Interaction 具备后台任务委派能力与相关机制。当模型遇到生成代码、调用工具、复杂推理等任务时，可以交给后台大模型或 Agent。前台模型继续观察现场，后台模型处理复杂任务，结果返回后再自然接回对话。

　　官方表示，JoyAI-VL-Interaction支持摄像头、直播流、监控流等多种输入，也支持语音输入输出、可视化界面、长期记忆、后台模型接口和 vLLM 部署方案。ASR、TTS、可视化界面、后台模型、外部工具和业务模块，都可以按需替换。

　　开发者可以接入自己的语音服务、Agent、API、业务系统或前端界面。它既可以用于研究，也可以改造成安防监控、老人小孩看护、直播讲解、电商导购、操作指导、AI 眼镜、无障碍辅助等实时 AI 助手。

　　在评测中，JoyAI-VL-Interaction 覆盖监控预警、实时计数、实时翻译、时间感知、直播导览解说等真实流式场景。在这些与

上一篇：集邦咨询：6月电视、笔电面板价格与前月一致显示器面板价格上涨

下一篇：深天马A子公司拟与关联方签订分布式光伏电站合同能源管理协议

排行

1Clubhouse首席执行官表示该平台未遭到黑客

2尽管全球半导体芯片短缺，但PC市场第一

3微信支付分怎么关闭微信支付分关闭方法

4索尼推出Bravia X80J电视系列，屏幕尺寸从

5Facebook为马克·扎克伯格的安全花费了23

6微信医保怎么查询缴费记录

7苹果拒绝要求为参议院应用商店听证会作

8联想Legion Phone Duel 2具有两个电池，两个

9宏碁推出配备AMD Ryzen 5000系列芯片组和N

10Google的新型AR玩具可让您在地球的另一端

精选

新股暗盘星源材质暗盘收涨逾41% 每手赚

中国白银集团完成发行 8.45亿股认购股份

东风全新奕派M8官宣搭载同级唯一搅拌摩

大昌微线日起变更为“金安智能”

易方达香港两只MPF ETF6月23日于港交所上市

生数Vidu Q3多模态大模型上线华为云：双版

大摩：维持东鹏饮料“增持”评级目标价

摩根大通减持中远海能约726.15万股每股作

亿咖通科技拟18亿元收购Flyme软件业务

一品红：子公司获得盐酸丙卡特罗口服溶

全球首个获批双抗ADC上市，百利天恒加速

长春高新子公司注射用醋酸曲普瑞林获得

永升服务6月22日斥资34万港元回购20万股

雷军谈小米自动驾驶征战纽北：历史性时

通威股份拟向全资子公司通威太阳能增资

我国拟制定标准，推动人形机器人走进变

ETF日报丨受资本市场改革信号提振证券

全新一代宝马X5被曝6月30日全球首秀，汽

天宇股份子公司阿帕他胺片获得药品注册

联想百应NUC AI Max+395工作站图赏：金属外

推荐

Google的新型AR玩具可让您在地球的另一端

Facebook创造了与Clubhouse竞争的产品

三星Galaxy Buds Pro已添加到三星网站

Jio为PUBG LITE玩家提供免费礼物Jio订阅者可

　

联系我们版权声明晋ICP备2025056884号-1