京东开源JoyAI-Echo长音生成框架,宣称“进入全球第一梯队”

发布时间:2026-06-03 23:38

  京东今日宣布推出 JoyAI-Echo 长音生成框架,号称直接解决行业头疼已久的三大难题 —— 角色易崩、声音乱变、生成缓慢。

  据介绍,JoyAI-Echo 框架内置了一个专门的记忆库,能在多镜头生成过程中,持续保存并调用角色的外观特征和说话人音色信息。实测结果显示,长达 5 分钟的里,角色身份、

  团队提出了记忆驱动后训练流程,结合 SFT、跨模态 RLHF 和 Distribution Matching Distillation技术,不仅提升了生成质量,还实现了推理加速,DMD 一项技术就带来约 7.5 倍的速度提升。JoyAI-Echo 还加入了智能“导演助理”——Director Agent,支持自然语言说需求,自动拆分成剧本、角色、场景和镜头。

  另外,JoyAI-Echo 还配套了专门的实时超分模块,通过单步超分就能生成高分辨率和精细化音频,并支持两档分辨率提升:736×1280 → 1152×1920 和 736×1280 → 1472×2560。

  特别

  “机密”文件竟在群中传播!查明:档案局服务人员发现涉密文件与儿子工作有关,遂拍照发家庭群,已被辞退;相关负责人被党内严重警告

  退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

  白天辉受贿被判[*]刑已执行,案件入选人民法院案例库,法院释明裁判理由:有重大立功表现,但属于罪行极其严重的犯罪分子,不足以从宽处罚

  ✨闪闪小葵花,成长正当时✨高光时刻上线!舞台尽展童真风采,镌刻岁岁成长高光。

排行

精选