Anthropic推出Claude 2.1：AI模型新突破与企业应用前景

<h1 id="h1-anthropic-claude-2-1-ai-"><a name="Anthropic推出Claude 2.1：AI模型新突破与企业应用前景" class="reference-link"></a><span class="header-link octicon octicon-link"></span>Anthropic推出Claude 2.1：AI模型新突破与企业应用前景</h1><p>2023年11月21日，Anthropic宣布其最新人工智能模型Claude 2.1现已通过API在其控制台上提供，并且正在支持其claude.ai聊天体验。Claude 2.1在关键能力上取得了进步，包括行业领先的200K令牌上下文窗口、显著降低的模型幻觉率、系统提示以及新的测试功能：工具使用。同时，Anthropic更新了定价策略，以提高客户跨模型的成本效率。</p>
<h2 id="h2-200k-"><a name="200K上下文窗口" class="reference-link"></a><span class="header-link octicon octicon-link"></span>200K上下文窗口</h2><p>自今年早些时候推出以来，Claude已被数百万人用于从翻译学术论文到起草商业计划和分析复杂合同的广泛应用。用户要求更大的上下文窗口和在处理长文档时更准确的输出。</p>
<p>为此，Anthropic将可以传达给Claude的信息量翻倍，限制为200,000令牌，相当于大约150,000个单词或超过500页的材料。用户现在可以上传技术文档、财务报表或长篇文学作品。Claude可以对大量内容或数据进行总结、进行问答、预测趋势、比较和对比多个文档等。</p>
<p>处理200K长度的消息是一个复杂的壮举，也是行业首创。尽管将这一强大的新能力交到用户手中令人兴奋，但通常需要数小时人工努力完成的任务可能只需几分钟。随着技术的进步，我们预计延迟时间将大幅减少。</p>
<h2 id="h2-u5E7Bu89C9u7387u4E0Bu964Du4E24u500D"><a name="幻觉率下降两倍" class="reference-link"></a><span class="header-link octicon octicon-link"></span>幻觉率下降两倍</h2><p>与先前的Claude 2.0模型相比，Claude 2.1在诚实度方面也取得了重大进步，虚假陈述的比例下降了两倍。这使企业能够构建高性能的AI应用程序，解决具体的商业问题，并在其运营中更可靠地部署AI。</p>
<p>我们通过策划一系列复杂的、事实性的问题来测试Claude 2.1的诚实度，这些问题探究了当前模型的已知弱点。使用区分不正确声明和不确定性表达的评分标准，Claude 2.1更倾向于表达不确定而不是提供错误信息。</p>
<h2 id="h2-u63D0u9AD8u7406u89E3u548Cu603Bu7ED3u80FDu529B"><a name="提高理解和总结能力" class="reference-link"></a><span class="header-link octicon octicon-link"></span>提高理解和总结能力</h2><p>Claude 2.1还在理解和总结方面取得了有意义的进步，尤其是对于需要高精度的长篇复杂文档，如法律文件、财务报告和技术规格。在我们的评估中，Claude 2.1在错误回答上显示出30%的减少，并且在错误地得出文档支持特定主张的结论上的比率降低了3-4倍。</p>
<p>虽然我们对这些准确性改进感到鼓舞，但提高输出的精确性和可靠性仍然是我们产品和研究团队的首要任务。</p>
<h2 id="h2-api-"><a name="API工具使用" class="reference-link"></a><span class="header-link octicon octicon-link"></span>API工具使用</h2><p>应广大需求，我们还添加了工具使用这一新的测试功能，允许Claude与用户现有的流程、产品和API集成。这种扩展的互操作性旨在使Claude在用户的日常运营中更加有用。</p>
<p>Claude现在可以跨开发者定义的函数或API进行编排，搜索网络资源，并从私有知识库中检索信息。用户可以为Claude定义一组工具，并指定一个请求。然后模型将决定完成任务所需的工具，并代表用户执行操作，例如：</p>
<ul>
<li>使用计算器进行复杂的数值推理</li><li>将自然语言请求转换为结构化API调用</li><li>通过搜索数据库或使用网络搜索API回答问题</li><li>通过私有API在软件中执行简单操作</li><li>连接到产品数据集，以便提出建议并帮助用户完成购买</li></ul>
<p>工具使用目前处于早期开发阶段——我们正在构建开发者功能和提示指南，以便更容易地集成到您的应用程序中。我们鼓励用户分享工具使用的反馈，以帮助塑造和改进产品。</p>
<h2 id="h2-u5F00u53D1u8005u4F53u9A8C"><a name="开发者体验" class="reference-link"></a><span class="header-link octicon octicon-link"></span>开发者体验</h2><p>我们一直在努力简化开发者控制台体验，同时使测试新提示变得更加容易，以便更快速地学习。我们的新Workbench产品使开发者能够在类似游乐场的体验中迭代提示，并访问新的模型设置以优化Claude的行为。他们可以为不同的项目创建多个提示，并在它们之间导航，并且随着他们的保存，修订被保存以保留历史上下文。开发者还可以生成代码片段，直接在我们的SDK中使用他们的提示。</p>
<p>我们还引入了系统提示，允许用户提供自定义指令给Claude以提高性能。系统提示设置有用的上下文，增强了Claude扮演指定个性和角色的能力，或以一种更可定制、一致的方式结构化响应，以符合用户需求。</p>
<p>Claude 2.1现已在我们的API中可用，并且也在claude.ai的免费和专业层面为我们的聊天界面提供支持。200K令牌上下文窗口的使用为Claude Pro用户保留，他们现在可以上传比以往任何时候都大的文件。我们迫不及待地想看到这些新功能激发的用例，因为我们致力于构建业界最安全、技术最先进的AI系统。</p>

Anthropic推出Claude 2.1：AI模型新突破与企业应用前景

欢迎大家关注DataLearner官方微信，接受最新的AI技术推送

相关博客

最热博客