精准误差,输入价格打骨折!官宣支持结构化输出,准确率%

新智元报道

编辑:编辑部

【新智元导读】

程序员福音!OpenAI新推出的模型API全部支持结构化输出,JSONSchema匹配率高达100%,成本还立减一半。

还在绞尽脑汁想一堆提示词,为一顿操作后五花八门的输出结果而头疼?

OpenAI终于听到了群众的呼声,为广大开发者送上渴望已久的第一大功能。

OpenAI今日宣布新功能上线,ChatGPTAPI现已支持JSON结构化输出。

JSON(JavaScriptObjectNotation)是文件和数据交换格式的行业标准,因为它既易于人类读取又易于机器解析。

然而,LLM常常与JSON对着干,经常会产生幻觉,要不生成仅部分遵循指令的响应,要不就生成一堆「天书」,根本无法完全解析。

这就需要开发人员使用多种开源工具、尝试不同的提示或重复请求等来生成理想的输出结果,耗时耗力。

结构化输出功能于今天发布,以上棘手的难题迎刃而解,确保模型生成的输出与JSON中规定的schema相匹配。

一直以来,结构化输出功能是开发人员呼声最高的头号功能,奥特曼在推文中也表示,该版本是应广大用户的要求发布的。

OpenAI发布的新功能确实击中了许多开发者的心,他们一致认为「Thisisabigdeal」。

纷纷留言表示赞叹,直呼「Excellent!」。

几家欢喜几家愁,OpenAI的这次更新,又让人担心会吞噬初创公司。

然而,对于更多的普通用户来说,他们更关心的问题是GPT-5到底什么时候发布,至于JSONSchema,「那是什么?」

毕竟,没有GPT-5的消息,OpenAI今年秋季的DevDay,可能与去年相比,将会显得安静了许多。

轻松确保模式一致性

有了结构化输出,只需要定义一个JSONSchema,AI就会不再「任性」,精准误差,输入价格打骨折!官宣支持结构化输出,准确率%乖乖按照指令要求输出数据。

并且,新功能不仅仅让AI变得更加听话,还能大大提高输出内容的可靠性。

在对复杂的JSONschema的跟踪评估中,带有结构化输出的新模型gpt-4o-2024-08-06获得了100%的满分。相比之下,gpt-4-0613的得分不到40%。

实际上,JSONSchema功能就是OpenAI在去年的DevDay上推出的。

现在,OpenAI在API中扩展了这项功能,确保模型生成的输出与开发人员提供的JSONSchema完全匹配。

从非结构化输入生成结构化数据是当今应用中人工智能的核心用例之一。

开发人员使用OpenAIAPI构建强大的助手,能够通过函数调用获取数据和回答问题,提取结构化数据以进行数据输入,并构建多步骤的智能体工作流(multi-stepagenticworkflows),从而允许LLM采取行动。

技术原理

OpenAI采用了一种双管齐下的方法来提高模型输出与JSONSchema的匹配度。

尽管模型性能已显著提升,在基准测试中达到了93%的准确性,但固有不确定性仍然存在。

为了确保开发者构建应用的稳定性,OpenAI提供了一种更高准确度的方法来约束模型的输出,从而实现100%的可靠性。

约束解码

OpenAI采用了一种称为约束采样或约束解码的技术,默认情况下,模型生成输出时完全不受约束,可能从词汇表中选择任何token作为下一个输出。

这种灵活性可能导致错误,例如,在生成有效JSON时随意插入无效字符。

为了避免此类错误,OpenAI使用动态约束解码的方法,确保生成的输出token始终符合提供的schema。

为了实现这一点,OpenAI将提供的JSONSchema转换为上下文无关文法(CFG)。

对于每个JSONSchema,OpenAI计算出一个代表该模式的语法,并在采样期间高效地访问预处理的组件。

这种方法不仅使生成的输出更准确,还减少了不必要的延迟。首次请求新模式可能会有额外的处理时间,但随后的请求通过缓存机制实现快速响应。

备选方案

除了CFG方法,其他方法通常使用有限状态机(FSM)或正则表达式来进行约束解码。

然而,这些方法在动态更新有效token时能力有限。特别是对于复杂的嵌套或递归数据结构,FSM通常难以处理。

OpenAI的CFG方法在表达复杂schema时表现出色。例如,支持递归模式的JSONschema在OpenAIAPI上已得到实现,但无法通过FSM方法表达。

输入成本节省一半

支持函数调用的所有模型均可实现结构化输出,包括最新的GPT-4o和GPT-4o-mini模型,以及微调模型。

此功能可在ChatCompletionsAPI、AssistantsAPI和BatchAPI上使用,并兼容视觉输入。

与gpt-4o-2024-05-13版本相比,gpt-4o-2024-08-06版本在成本上也更具优势,开发者可以在输入端节省50%的成本(2.50美元/1Moken),在输出端节省33%的成本(10.00美元/1Mtoken)。

如何使用结构化输出

在API中可以使用两种形式引入结构化输出:

函数调用

通过在函数定义中设置strict:true,可以实现通过工具的结构化输出。

此功能适用于支持工具的所有型号,包括所有型号gpt-4-0613和gpt-3.5-turbo-0613及更高版本。

启用结构化输出后,模型输出将与提供的工具定义匹配。

示例请求:

示例输出:

{

"table_name":"orders",

"columns":["id","status","expected_delivery_date","delivered_at"],

"conditions":[

"column":"status",

"operator":"=",

"value":"fulfilled"

},

"column":"ordered_at",

"operator":">=",

"value":"2023-05-01"

"operator":"",

"value":{

"column_name":"expected_delivery_date"

}

],

"order_by":"asc"

response_format参数的新选项

开发人员现在可以通过response_format的新选项json_schema选择是否需要规定格式的输出。

当模型不调用工具,而是以结构化方式响应用户时,这一功能非常有用。

此功能适用于最新的GPT-4o型号:今天发布的gpt-4o-2024-08-06和gpt-4o-mini-2024-07-18。

将response_format设置为strict:true时,模型输出将与提供的schema匹配。

"steps":[

"explanation":"Subtract31frombothsidestoisolatethetermwithx.",

"output":"8x 31-31=2-31"

"explanation":"Thissimplifiesto8x=-29.",

"output":"8x=-29"

"explanation":"Dividebothsidesby8tosolveforx.",

"output":"x=-29/8"

"final_answer":"x=-29/8"

开发人员可以使用结构化输出逐步生成答案,以引导达到预期的输出。

根据OpenAI的说法,开发人员不需要验证或重试格式不正确的响应,并且该功能允许更简单的提示。

原生SDK支持

OpenAI称他们的Python和NodeSDK已更新,原生支持结构化输出。

为工具提供架构或响应格式就像提供Pydantic或Zod对象一样简单,OpenAI的SDK能将数据类型转换为支持的JSON模式、自动将JSON响应反序列化为类型化数据结构以及解析拒绝。

而且,本机结构化输出支持也可用于response_format。

其他用例

开发人员经常使用OpenAI的模型为各种用例生成结构化数据。

其他一些例子包括:

-根据用户意图动态生成用户界面

开发人员可以使用结构化输出来创建代码或UI生成应用程序。

使用相同的response_format,可根据用户输入生成不同的UI。

例如,创建「园丁的登录界面」:

就是用以下代码生成的:

"type":"div",

"label":"",

"children":[

"type":"header",

"label":"GreenThumbGardening",

"children":[],

"attributes":[{"name":"className","value":"site-title"}]

"label":"BringingLifetoYourGarden",

"attributes":[{"name":"className","value":"site-tagline"}]

"attributes":[{"name":"className","value":"header"}]

"type":"section",

"label":"AboutUs",

"label":"AtGreenThumbGardening,wespecializeintransformingyouroutdoorspacesintobeautiful,thrivinggardens.Ourteamhasdecadesofexperienceinhorticultureandlandscapedesign.",

"attributes":[

{"name":"className","value":"about-description"}

]

"attributes":[{"name":"className","value":"about-section"}]

"attributes":[{"name":"className","value":"content"}]

"attributes":[{"name":"className","value":"about-container"}]

"label":"OurServices",

"label":"GardenDesign",

{"name":"className","value":"service-item"}

"label":"PlantCare&Maintenance",

"label":"SeasonalCleanup",

"label":"CustomLandscaping",

"attributes":[{"name":"className","value":"services-list"}]

"attributes":[{"name":"className","value":"services-container"}]

"attributes":[{"name":"className","value":"landing-page"}]

-将最终答案与支撑性的推理或附加评论分开

为模型提供一个单独的思维链字段可以提高响应的最终质量。

请求:

结构化输出:

"reasoning_steps":[

"Firststepistocomparethenumbers9.11and9.9.",

"Bothnumbershavethesamewholenumberpart,whichis9.",

"Tocomparethedecimalparts,convertthemtothesamenumberofdecimalplaces.",

"9.11hastwodecimalplaces:itis9.11.",

"9.9hasonedecimalplace:itcanberewrittenas9.90.",

"Now,compare9.11and9.90bylookingatthedecimalparts.",

"Compare11with90.",

"90isgreaterthan11,so9.90isgreaterthan9.11."

"answer":"9.9isbiggerthan9.11."

-从非结构化数据中提取结构化数据

例如,指示模型从会议记录中提取待办事项、截止日期和作业等内容。

"action_items":[

"description":"Collaborateonoptimizingthepathplanningalgorithm",

"due_date":"2024-06-30",

"owner":"JasonLi"

"description":"Reachouttoindustrypartnersforadditionaldatasets",

"due_date":"2024-06-25",

"owner":"AishaPatel"

"description":"ExplorealternativeLIDARsensorconfigurationsandreportfindings",

"due_date":"2024-06-27",

"owner":"KevinNguyen"

"description":"Scheduleextendedstresstestsfortheintegratednavigationsystem",

"due_date":"2024-06-28",

"owner":"EmilyChen"

"description":"Retestthesystemafterbugfixesandupdatetheteam",

"due_date":"2024-07-01",

"owner":"DavidPark"

安全的结构化输出

安全是OpenAI的首要任务——新的结构化输出功能将遵守OpenAI现有的安全政策,并且仍然允许模型拒绝不安全的请求。

为了使开发更简单,API响应上有一个新的refusal字符串值,它允许开发人员以编程方式检测模型是否生成拒绝而不是与架构匹配的输出。

当响应不包含拒绝并且模型的响应没有过早中断(如finish_reason所示)时,模型的响应将可靠地生成与提供的schema匹配的有效JSON。

参考资料:

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

允霆科技

允霆科技网是一家以科技创新为核心,为客户提供各类科技新闻、科技资讯、科技产品评测、科技解决方案等科技行业服务的高科技企业。

最近发表