豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界
据豆包大模型团队发布,视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。团队实验发现,仅300M参数量下,VideoWorld已取得可观的模型表现。作为一种通用视频生成实验模型,VideoWorld去掉语言模型,实现了统一执行理解和推理任务。(第一财经)
往期推荐
- 比亚迪全系车型将搭载高阶智驾2025-02-11
- 杭州:加大支持力度激励人工智能等领域创新企业2025-02-11
- 小米股价创历史新高,市值破万亿港元2025-02-10