OpenAI更新新版的Assistant API接口到Assistant API v2版本,现在你可以让GPT-4同时搜索1万个文件
Assistant API是OpenAI提供的一个大模型助手类的接口,可以让开发者更加自由、准确地构建类AI Assitant系统。一个AI Assistant可以利用大模型、工具和文件来响应用户的问题。

简单来说,AssistantAPI允许你将你的接口、数据、指令交给GPT-4,GPT-4根据你的数据和接口,自动规划使用你提供的工具来回复用户的问题。
OpenAI Assistant API v2更新内容
今天,OpenAI官方宣布AssitantAPI升级到了v2版本,相比此前的版本,最大的特点是将支持的检索的文件数量提高到了1万个,比v1版本增长500倍!
除了这个特性外,OpenAI的Assitant API v2版本还有如下变化:
改进的检索工具:file_search能力升级,每个助手可以处理多达 10,000 个文件,比之前的能力大得多。它更快速,支持并行查询,并具有增强的重新排名和查询重写功能。
向量存储对象:除了 file_search,API 还添加了 vector_store 对象。这些对象自动解析、分块和嵌入文件,简化了跨助手和线程的文件管理。
tokens使用控制:用户现在可以控制每次运行中使用的最大tokens数量,有助于管理tokens使用成本。他们还可以设置先前或最近使用的消息数量的限制。
工具选择参数:支持 tool_choice 参数,允许用户指定在特定运行中使用哪个工具,例如 file_search 或 code_interpreter。
自定义会话历史:现在可以创建带有助手角色的消息,以定制 Threads 中的会话历史记录。
模型配置参数:助手和运行对象现在支持流行的模型配置参数,如温度、response_format(JSON 模式)和 top_p。
支持微调模型:现在可以在助手 API 中使用微调模型,目前仅限于 gpt-3.5-turbo-0125。
流式支持:助手 API 现在支持流式处理。
SDK 增强:Node 和 Python SDK 中添加了几个流式处理和轮询辅助工具。
详情情况参考:https://platform.openai.com/docs/assistants/whats-new
OpenAI的AssistantAPI的文件向量化处理
这其中向量处理的模式可以关注一下:
默认的文件块大小是800个tokens,重复的tokens是400个
默认向量块(chunk)的重复是50%
可以支持元数据过滤
支持CSV文件的提取
Assistant API与GPTs的区别
Assistant API面向普通用户的版本就是界面化的GPTs,而Assistant API可以说是面向开发者的GPTs了。
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
