去年,与瑞士等离子体中心合作,成功利用人工智能控制托卡马克内部的核聚变等离子体。 最近,新的研究表明,它将等离子体形状的模拟精度提高了65%,将学习新任务所需的训练时间减少了3倍甚至更多。
实验将等离子体形状模拟精度提高了65%。
从人工智能机器人与围棋世界冠军李世石对战,到人工智能程序预测蛋白质折叠,再到去年《自然》杂志上用AI控制核聚变反应,谷歌旗下人工智能公司人工智能算法有足够深的一个改变世界的领域。
7月26日,其表示与瑞士等离子体中心合作,去年利用人工智能成功控制了托卡马克内部的核聚变等离子体。 “从那时起,我们的实验将等离子体形状的模拟精度提高了 65%。” 相关研究于7月21日提交到预印本网站ArXiv上,论文标题为“ for ”。 学习”。
托卡马克是一个环形容器,利用磁约束来实现受控核聚变。 中心有一个环形真空室,外面缠绕有线圈。 当通电时,托卡马克内部会产生巨大的螺旋磁场,将里面的等离子体加热到很高的温度,从而达到核聚变的目的。
反馈控制对于托卡马克装置的运行至关重要。 控制系统主动管理磁线圈以抑制拉长等离子体的不稳定性。 此外,对等离子体电流、位置和形状的精确控制使得热量去除和等离子体能量管理成为可能。 传统等离子体的精确控制是通过不断关闭等离子体电流、形状和位置来实现的,但等离子体形状和位置无法直接测量,必须通过磁测量间接实时估计。 虽然此类系统已成功稳定大规模放电,但此类设计具有挑战性且耗时。
强化学习最近已成为构建实时控制系统的另一个范例。 强化学习在包括等离子体磁控制领域在内的实时控制系统中表现出了良好的效果,但与传统的磁约束反馈控制方法相比,仍然存在明显的缺陷。
在这项研究中,研究团队重点关注策略准确性和整体训练速度,解决强化学习方法的主要缺点,包括对所需等离子体特性实现更高的控制精度、减少稳态误差、减少学习新任务所需的时间,提出了对代理架构和训练过程的算法改进。 仿真结果显示,等离子体形状精度提高了 65%,大大减少了等离子体电流的长期偏差,并将学习新任务所需的训练时间减少了 3 倍或更多。
研究团队表示,虽然这些结果显着减少了强化学习控制器的局限性,但仍有很大的改进空间。 未来不仅需要提高仿真性能,还需要在硬件上匹配真实等离子体放电的性能水平,而当前仿真和硬件之间的精度差距几乎主导了仿真中的任何剩余改进。 同样,有很多机会可以继续减少培训所需的时间。