腾讯研发全新框架:用AI打,让DeepSeek学会战略性思考
来源:
发布时间:2025-10-05 15:12:02

电竞资讯10月05日称 据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让 AI 在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 网站和 arXiv 平台。

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。
团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。
具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。
随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。
最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。
相关阅读
最新录像
11月03日NBA常规赛公牛尼克斯全场录像
11-03
11月03日NBA常规赛76人篮网全场录像
11-03
11月03日西甲第11轮皇家贝蒂斯vs马洛卡全场录像
11-03
11月03日法甲第11轮布雷斯特vs里昂全场录像
11-03
11月03日意甲第10轮AC米兰vs罗马全场录像
11-03
11月03日西甲第11轮巴塞罗那vs埃尔切全场录像
11-03
11月03日意甲第10轮帕尔马vs博洛尼亚全场录像
11-03
11月03日英超第10轮曼城vs伯恩茅斯全场录像
11-03
11月03日德甲第9轮沃尔夫斯堡vs霍芬海姆全场录像
11-03
11月03日法甲第11轮图卢兹vs勒阿弗尔全场录像
11-03
最新集锦
湖人浇灭热火迎3连胜东契奇三双里夫斯26+11哈克斯31+8
11-03
太阳19记三分送马刺首败!文班14中4&9+9+6失误布克28+13
11-03
尼克斯3人20+终结公牛开季5连胜布伦森31分吉迪空砍三双
11-03
骑士击退老鹰米切尔复出8记三分砍37分杰伦约翰逊23+13
11-03
猛龙击败灰熊英格拉姆26+7巴恩斯19+12+8+5帽莫兰特缺阵
11-03
黄蜂大胜爵士三球缺阵布里奇斯29+4+6马尔卡宁空砍29+7
11-03
76人送篮网6连败恩比德缺阵马克西26+6+7乌布雷29分
11-03
雷霆大胜鹈鹕豪取7连胜亚历山大三节30+7锡安20+9+6
11-03
西甲安东尼神级世界波双响+助攻贝蒂斯30马洛卡
11-03
法甲哈特鲍尔7分钟染红里昂客场00布雷斯特
11-03
热词推荐
热门TAG
-
音乐
售卖
曝光
完成
遭遇
准确
天神
退出
意外
安装
绝境
斯特利费宁
基地
浪漫
师兄
太平洋FC
福建浔兴股份
自行车
古典
比霍爾貝尤什
CSO图尔塞尼
邀请赛
老道
销售
深浅
亚冠联赛
nba录播
罗纳尔多视频
cctv5在线直播360
腾讯体育直播在线观看
快船VS鹈鹕直播
快船VS太阳直播
cctw1
掘金vs湖人
皇家马德里vs巴塞罗那
cctv1
围棋直播
中国体育直播tv
斯诺克大师赛直播
cba今日赛程表
中央台CCTV-1直播在线观看
巴萨欧冠赛程
中央2
NBA最新录像回放
沙特阿拉伯U20VS中国U20直播
光州FCVS武里南直播
乐球直播无插件直播今日赛事
澳网直播在线直播免费观看高清
红球直播nba
澳大利亚网球直播