MIT 李巨教授组发布「贾维斯助手 CRESt」：实验科学家秒变钢铁侠，全自动化实验 + 主动学习

吴厣人工智能 2023-07-19 568

【新智元导读】让 AI 负责实验操作，科学家负责思考。

MIT 李巨教授组发布「贾维斯助手 CRESt」：实验科学家秒变钢铁侠，全自动化实验 + 主动学习-第1张图片-小猪号

人工智能以及自主实验目前主要由 Python 等语言编写，但并非所有实验科学工作者都擅长这类编程语言，在真实世界实验中的影响力还是比较有限。

不过，基于 OpenAI 最近发布的 ChatGPT API 函数调用功能 [1]，现有的技术已经足够支撑打造一个曾经只能在钢铁侠电影中看到的贾维斯智能助手。

MIT 李巨教授组发布「贾维斯助手 CRESt」：实验科学家秒变钢铁侠，全自动化实验 + 主动学习-第2张图片-小猪号

近日，MIT 李巨教授组开发了一个实验科学家的人工智能助手 CRESt（Copilot for Real-world Experimental Scientist），其后端是用 ChatGPT 作为核心串联起：

1. 真实世界的机械臂进行自动化实验

2. 本地或网上专业的材料数据库

3. 优化材料配方的主动学习算法

视频地址：https://youtu.be/ POPPVtGueb0

目前 CRESt 的前端已经实现了 voice-in voice-out，AI 生成语音，以及多平台无缝切换。

有了 CRESt 之后，即使没有任何代码经验，科研工作者都能通过与其口头对话来利用自动化实验平台帮自己做实验。

MIT 李巨教授组发布「贾维斯助手 CRESt」：实验科学家秒变钢铁侠，全自动化实验 + 主动学习-第3张图片-小猪号

论文链接：https://doi.org/ 10.26434 / chemrxiv-2023-tnz1x

项目介绍

「CRESt 操作系统」主要由四部分组成：用户界面，ChatGPT 后端，主动学习和末端执行器。

其中用户界面基于一个支持语音转文本和文本转语音交互的 Github 项目 chatgpt-voice [2]。其便捷的网络框架使得用户可以在离开实验室后在他们的手机上无缝地继续对话。

并且后端是独立运行的，即使前端改变也不会受到影响。

此外，作者还将可以实时生成非常逼真的人声的 ElevenLabs AI 语音集成到了前端中 [3]

从前端收到的文本消息随后将被传输到建立在 CallingGPT 基础之上的 ChatGPT 后端。

CallingGPT 是另一个 Github 项目，其能将 Google docstring 样式记录的 Python 函数转换成 ChatGPT API 可以识别的 JSON 格式，以供在 ChatGPT 认为需要时调用。

此外，它在 ChatGPT 和本地 Python 函数库之间闭合了一个反馈回路：ChatGPT 所建议调用的函数将立即在本地执行，并且其返回值将被发送回 ChatGPT。

除此之外，作者还在 CRESt 中嵌入了主动学习算法，得益于在小数据集上不错的性能，主动学习被认为是最适合实验科学的机器学习算法之一 [5-7]。

在涉及真实物理世界实验的机器学习项目中，数据采集往往是最大的挑战。

与虚拟世界不同，真实物理世界中的每一个数据点可能都需要花费大量的时间和金钱。

一般来说，1000 个点的数据集就已经是相当不错的了，在这样的条件下，如何对设计空间进行高效取样变得至关重要。

主动学习的主要功能是交互式地建议在下一批实验中测试的参数组合，比如在视频中展示的合金配方推荐。

在 CRESt 中内嵌的是由 Meta 团队开发的基于 BoTorch 的 Ax 平台 [8, 9]，Ax 有着优秀的 SQL 存储功能：即使 GPT 后端重置，也可以通过调取数据库中存储的记录来继续之前的主动学习。

末端执行器是一系列通过 HTTP 请求调用的子程序。其中一些可能涉及信息检索任务（本地或公共数据库查询，如 Materials Project [10]），而其他一些可能会对物理世界产生真实的影响，就像在视频中展示的那样（液体处理机器人、激光切割机、泵、气阀、机械臂等），主要是用于做实验的一些自动化的硬件。

这些设备的自动化主要由 PyAutoGUI 实现，一个可以模拟人类鼠标和键盘动作的 Python 库 [11]。

然而，作者预期这个冗余步骤最终将失去其必要性，因为在不久的将来大多数实验室设备都应该会在人类交互界面之外提供一个专用的 AI 通信接口。