加载中，请稍候...

加州伯克利通用AI

Gorilla

Gorilla：连接海量 API 的大型语言模型

Gorilla详情

什么是Gorilla（大猩猩）模型

研发背景：在自然语言处理领域，大型语言模型虽在诸多任务上表现出色，但在通过 API 调用有效使用工具方面存在局限，如生成准确输入参数的能力不足以及 API 调用时的幻觉问题，且现有的语言模型需要重新训练来更新知识和推理能力，为解决这些问题，Gorilla 模型被提出。
研发团队及时间：2023 年 5 月 24 日，由加州大学伯克利分校等发布。微软研究院也参与了相关研究。
核心技术：

基于 Llama 微调：Gorilla 是在 Llama-7b 模型的基础上进行检索式微调得到的语言模型。检索器感知训练：采用 “检索器感知训练”（retriever-aware training）技术，让模型学习 API 调用的语义，从而能够生成语义和语法正确的 API 调用内容。即使 API 文档发生更改，它依然能生成正确的语义和语法。

性能优势：

高 API 调用准确性：在各种 API 调用任务上表现优于 GPT-4 等模型，例如在一项研究中，GPT-4 的 API 调用准确率为 85%，而 Gorilla 的准确率可以达到 95%。
减少幻觉问题：显著减轻了直接提示语言模型时常遇到的幻觉问题，提高了输出的可靠性和适用性。
适应文档变化：结合文档检索器，能够适应测试时文档的变化，实现灵活的用户更新或版本变更，可跟上频繁更新的文档。

应用领域：

软件开发：帮助开发者更准确地调用各种 API，提高开发效率，减少因 API 调用错误导致的问题。
自动化流程：可用于构建自动化的工作流程，通过调用不同的 API 实现各种任务的自动化执行。
智能助手：为智能助手提供更强大的功能，使其能够通过 API 调用与更多的外部服务和工具进行交互，提供更丰富的服务和信息。

相关AI

360自研认知型通用大模型，依托360多年积累的大算力、大数据、工程化等关键优势，集成360GPT大模型、360CV大模型、360多模态大模型技术能力，具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能，重塑人机协作新范式。为服务产业数字化，360发布企业级AI大模型战略，以人为本，构建安全可信大模型。

AI对话，内容创作，通用AI，AI搜索引擎

AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力，是继谷歌的Gemini Ultra之后的又一个令人瞩目的作品，性能上与GPT-4不相上下！

内容生成，通用AI，多模态语言模型

由 Anthropic 公司开发，擅长处理自然语言任务，如文本生成、问答、对话等，具有较高的语言理解和生成能力，可用于多种应用场景。

通用AI，文本生成，知识问答

Gemini可同时识别文本、图像、音频、视频和代码五种类型信息，还可以理解并生成主流编程语言的高质量代码，并拥有全面的安全性评估。前身为Bard。

聊天机器人，通用AI，内容生成，AI搜索引擎

智源研究院发布的首个支持中英双语知识、开源商用许可的“悟道·天鹰（Aquila）”语言大模型系列，以及提供“能力-任务-指标”三维评测框架的“天秤（FlagEval）”大模型评测体系，力求打造大模型时代“新Linux”生态的FlagOpen大模型开源技术体系，以及6项“悟道·视界”视觉大模型研究成果。

开源大模型，学术研究，生命模拟，智能计算

Poe 是一个性价比高的 AI 整合网站，同时整合了ChatGPT、Sage、GPT-4、Claude+、Claude-instant 和 NeevaAI等常用AI，除了 GPT-4和 Claude+有使用次数限制以外，其他模型均免费无限使用。

聊天机器人，通用AI，搜索引擎，聊天助手

CPM-Bee是面壁智能联合OpenBMB发布的一个最高有100亿参数规模的开源大语言模型。该模型从零开始自主训练，基于Transformer架构，中英双语表现优秀，拥有百亿量级参数、万亿级高质量语料。是一个完全开源、允许商用的百亿参数中英文基座模型。

开源大模型，通用AI，AI问答，内容生成

MPT系列模型

MPT是MosaicML发布的一系列大模型。尽管业界已经发布了很多大模型，但是这些模型通常都比较难以训练和部署。而MosaicML发布这样的大模型的目的就是为了解决上述限制，提供一个完全开源且可商用的一个大模型。

开源大模型，可商用，通用AI，内容生成

请启用javascript