自从向公众发布以来,ChatGPT 在过去几个月里席卷了整个世界。其实才几个月?它所产生的影响让人感觉它已经存在多年了。
但是,尽管它具有所有优点,但它有一个不那么小的小缺陷;它无法获得最近的信息。它拥有的唯一信息是到 2021 年年中。但 OpenAI 终于开始改变这种状况。不,它还没有接受过更新数据的训练。然而,OpenAI 终于在 ChatGPT 中实现了对插件的早期支持,使其能够连接到互联网以及一些第三方服务!
什么是 ChatGPT 插件?
插件是专门为语言模型设计的工具。它们增强了聊天机器人的能力,让它承担了以前不可能完成的任务。例如,它现在可以检索实时信息,如体育比分、股票价格,代表用户执行操作,如预订航班,以及检索知识库信息,如公司文件等。
自ChatGPT上线以来,插件一直是用户需求量最大的项目,而OpenAI终于做到了。但他们的发布将是一个渐进的、迭代的推出。最初,OpenAI 只发布了几个第三方插件和几个自己的插件。
用户以及想要构建插件的开发人员的访问权限目前也受到限制。此外,作为最终用户,目前仅向 ChatGPT Plus 用户授予访问权限,但 ChatGPT 表示他们确实计划在未来扩大推广范围。
只有在加入他们的等候名单后才能请求访问权限,这需要填写一份小问卷,说明您为什么想要访问权限以及您是否愿意提供反馈。
第三方插件列表包括:
- Expedia – 这个插件将允许您使用 ChatGPT 计划您的下一次旅行,其中包含有关酒店、航班等的可用性和价格的完整信息。
- FiscalNote – 此 ChatGPT 插件可让您访问实时法律、政治和监管信息和数据。
- Instacart – 使用 ChatGPT 从附近的杂货店和超市订购杂货。
- KAYAK – 在 ChatGPT 中使用 KAYAK 查找您定义预算内的汽车、酒店、租赁等。
- Klarna Shopping – 在您的 ChatGPT 对话中搜索和比较来自不同在线商店的价格。
- Milo Family AI – 父母加强育儿的插件。
- OpenTable – 在聊天中获取餐厅推荐和预订链接。
- 从 Shopify 购物– 搜索不同品牌的产品。
- Slack – 将 ChatGPT 与 Slack 结合使用以简化通信
- 说话——找一位人工智能语言导师
- Wolfram – 获取 ChatGPT 以访问计算、数学知识等。
- Zapier – 使用此插件可与 ChatGPT 中的 5000 多个应用程序进行交互。
OpenAI 本身还有两个插件:Browsing(网络浏览器)和代码解释器,以及一个名为 Retriever 的开源插件。所有插件目前都处于 Alpha 测试阶段。
这些插件如何工作?
根据 OpenAI 的说法,插件是 ChatGPT 等语言模型的“耳目”。关于语言模型的事实是,它们只能从训练数据中学习,而且学习是有限的。ChatGPT 只能自行提供基于文本的说明。这些插件可以使其遵循这些说明,并提供太新、太个人化或太具体且无法包含在训练数据中的信息。
但是,当您考虑 AI 模型遵循说明并代表您执行操作时,就会出现安全问题。这就是插件推出缓慢的原因。OpenAI 正在以安全为核心原则构建它们,并将监控它们在现实世界中的使用情况。
让我们来看看其中一些插件模型是如何工作的。
浏览
这是将 ChatGPT 连接到互联网的插件,是 OpenAI 本身的两个插件之一。该插件使用 Microsoft 的 Bing 搜索 API,事件并不那么令人好奇;这两家公司早在几年前就有过交易。除了最初的投资,微软现在还使用 OpenAI 技术为其新的 Bing AI 提供支持。
该模型不仅知道如何浏览互联网,而且还知道何时浏览互联网,何时不浏览互联网。例如,当用户向 ChatGPT 询问有关 2023 年奥斯卡颁奖典礼的信息时,它会准确地在互联网上搜索查询。但当被问及举办过的第一届奥斯卡颁奖典礼时,它并没有搜索互联网,因为该信息是其训练数据的一部分。
因此,要让 ChatGPT 浏览互联网,您必须选择“浏览”模型/插件。
现在,当用户输入要求其浏览互联网的提示时,它就会这样做;该过程需要一些时间,因为机器人需要时间来熟悉这些信息。您可以看到 ChatGPT 的操作流程,直到它通过展开“浏览网络..”磁贴生成响应。
在那里,您可以看到它搜索了哪些查询、点击了哪些链接以及实时阅读的时间。它使用基于文本的网络浏览器,因此它可以超越搜索结果并实际阅读和浏览网站。
一旦 ChatGPT 赶上事件,它会像以前一样用自然语言模型给你答案。但是当使用浏览模型生成答案时,答案将包括引用。单击引文会将您带到该网站。这个特定方面与 Bing Chat AI 相同。
从安全的角度来看,基于文本的浏览器只能进行GET请求,降低了一定的风险。例如,该模型只能从互联网上检索信息,但不能执行“事务性”操作,例如提交表单。
代码解释器
代码解释器模型是 OpenAI 的第二个插件,它为 ChatGPT 提供了一个 Python 解释器。它还为其提供了一些短暂的磁盘空间。
会话在单次聊天期间处于活动状态,因此下一次通话可以建立在上一次通话的基础上,但存在时间上限。此外,代码解释器还支持上传文件和下载结果文件。
为了保证它的安全,OpenAI 将其保存在一个沙盒、防火墙的执行环境中。代码解释器也禁用互联网访问。根据 OpenAI 的说法,尽管此举限制了模型的功能,但他们认为最初这是正确的举动。
在开始对话之前必须选择“代码解释器”模型。
一旦用户输入需要使用代码解释器插件的提示,ChatGPT 就会开始使用它来执行所需的计算。与浏览一样,用户可以通过单击“显示工作”来查看 ChatGPT 的计算流程,并且计算中的所有步骤都是可见的。
在最初的测试中,OpenAI 发现这个插件在某些情况下很有用。这些包括:
- 解决定量和定性的数学问题,坦率地说,用户发现 ChatGPT 以前是垃圾。
- 做数据分析和可视化,这让很多用户兴奋不已。
- 在格式之间转换文件
OpenAI 希望用户在尝试时发现代码解释器可以执行的更有用的任务。
第三方插件
其余插件属于插件模型。这还包括开发人员可以使用的 OpenAI 开源 Retriever 插件和 12 个第三方插件。
从下拉列表中选择插件模型后,用户可以从商店安装所需的插件。
简而言之,插件的工作方式如下:
一旦用户通过安装插件激活插件(他们不会自动激活)并开始对话,OpenAI 将在消息中向 ChatGPT 注入插件的简洁描述。此消息对最终用户不可见,但它将包括插件的描述、端点和示例。因此,除非您选择在对话中使用插件,否则 ChatGPT 不会对此有任何了解。您必须激活要在每次对话中使用的插件。
现在,您可以将查询发送到 ChatGPT。如果机器人发现它与调用插件相关,它将使用 API 调用来实现。换句话说,它可以自行决定是否需要调用插件。
然后它将在为您生成的响应中包含从插件获得的结果。
下面是 ChatGPT 如何使用来自 OpenTable、Wolfram 和 Instacart 的插件的示例。一位用户要求 ChatGPT 推荐周六的素食餐厅和周日的素食食谱。他们还要求它使用 Wolfram 计算推荐食谱的卡路里,并从 Instacart 订购食谱的配料。人工智能机器人正是这样做的。
首先,它使用 OpenTable 推荐餐厅和预订链接。
它推荐素食食谱(它以前可以这样做),然后使用 Wolfram 计算食谱的卡路里。
最后,它将所有必需的原料添加到 Instacart 上的购物车中,并向用户显示链接,用户只需单击该链接即可完成订单!
插件将彻底改变 ChatGPT 的工作方式。人工智能在过去几个月中的发展速度使它成为一个同样可怕和美好的活着的时代,不是吗?
发表回复