DeepMind让大模型学AlphaGo自我博弈,解决数据限制
近日,一篇Google DeepMind的论文引发关注。研究者引入了“苏格拉底式学习”,这是AI中递归自我完善的一种新方法。这种方法使系统能够自主增强其能力,超越初始训练数据的限制。新方法的核心是进行“语言游戏”,即智能体之间结构化的交互、解决问题并以分数的形式接收反馈。这些游戏允许人工智能进行自我博弈,生成数据并完善技能,也无需人工输入。最终的创新在于AI自我改造,智能体不仅可以从环境中学习,还可以重新配置其内部系统。这样可以消除固定架构带来的限制,为超过以往的性能改进奠定基础。(新浪网)
往期推荐
- Word Labs推出AI“造物主”:一张图片生成可互动3D世界2024-12-04
- 高瓴旗下新一期30亿元保护型策略基金完成首关2024-12-03
- 上海深圳11月二手房成交量齐创近4年新高2024-12-03