加载中，请稍候...

MPT系列模型

MosaicML 通用AI

MPT系列模型

MPT是MosaicML发布的一系列大模型。尽管业界已经发布了很多大模型，但是这些模型通常都比较难以训练和部署。而MosaicML发布这样的大模型的目的就是为了解决上述限制，提供一个完全开源且可商用的一个大模型。

MPT系列模型详情

什么是MTP系列模型

Meta开源了LLama，不过有很多限制，很难商业运用。于是现在MosaicML开发了MPT-7B模型，它是一个基于Transformer在1T文本/代码Token上训练出来的模型。该模型开源，与LLaMA-7B模型效果相匹配，而且可用于商业用途

MTP系列模型特点

有商用许可
基于大量的数据训练
目标是解决长输入（最高支持65K的输入，84K的处理）
训练与推理速度的优化
高效的开源训练代码

MTP系列模型版本

注意：并不是每一个版本都是授权商用的

模型/地址	上下文长度	商用授权
MPT-30B	8192	Yes
MPT-30B-Instruct	8192	Yes
MPT-30B-Chat	8192	No
MPT-7b-8k	8192	Yes
MPT-7b-8k-Chat	8192	No
MPT-7B	2048	Yes
MPT-7B-Instruct	2048	Yes
MPT-7B-Chat	2048	No
MPT-7B-StoryWriter	65536	Yes

相关AI

智源研究院发布的首个支持中英双语知识、开源商用许可的“悟道·天鹰（Aquila）”语言大模型系列，以及提供“能力-任务-指标”三维评测框架的“天秤（FlagEval）”大模型评测体系，力求打造大模型时代“新Linux”生态的FlagOpen大模型开源技术体系，以及6项“悟道·视界”视觉大模型研究成果。

开源大模型，学术研究，生命模拟，智能计算

Aurora Gen AI是英特尔是与阿贡国家实验室和 HPE 合作开发的，它是一个纯粹以科学为中心的生成式 AI 模型，它将潜在应用于系统生物学、癌症研究、气候科学、宇宙学、高分子化学与材料和科学等领域。除了科研之外，Aurora genAI 还具有在自然语言处理、机器翻译、图像识别、语音识别、金融建模等商业领域的应用潜力。

通用AI，科研实验，内容生成，AI对话

Poe 是一个性价比高的 AI 整合网站，同时整合了ChatGPT、Sage、GPT-4、Claude+、Claude-instant 和 NeevaAI等常用AI，除了 GPT-4和 Claude+有使用次数限制以外，其他模型均免费无限使用。

聊天机器人，通用AI，搜索引擎，聊天助手

Gorilla：连接海量 API 的大型语言模型

API调用，人工智能工具，通用AI，人工智能接口

Bing AI(Bing Chat) / Copilot是微软推出的人工智能，基于大量数据和先进算法，不仅能提供高质量搜索结果，还能与用户进行交互，帮助用户解决问题、获取信息，在搜索和智能交互方面表现出色。

AI搜索引擎，通用AI，聊天机器人，内容生成

讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互，该模型对标ChatGPT

内容创作，知识问答，代码生成

AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力，是继谷歌的Gemini Ultra之后的又一个令人瞩目的作品，性能上与GPT-4不相上下！

内容生成，通用AI，多模态语言模型

百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动、回答问题、协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调、人类反馈强化学习、提示等技术，具备知识增强、检索增强和对话增强的技术优势。

通用AI，聊天机器人，大语言模型，AI搜索引擎

请启用javascript