💖Grok-1，马斯克旗下开源模型来袭。

haoxyz 国内chatGPT 2024-10-17 40 0

文章目录

🎈开源 AI 大模型有哪些🎈
💡一、LLaMA 系列

LLaMA 3.1 ：由 Meta 公司推出，2024 年 7 月发布💡其中参数规模最大的是 LLaMA 3.1 - 405b 版本，拥有 4050 亿个参数，在多项 AI 基准测试中表现出色，为开发者提供了强大的基础模型💯其上下文窗口涵盖 128000 个标记，方便处理长文本💡
LLaMA 3 ：2024 年 4 月推出，其中 LLaMA 3 - 8b 和 LLaMA 3 - 70b 为该系列中具有代表性的版本，为同等规模的大模型树立了新的基准💡

💡二、Grok-1
由特斯拉 CEO 埃隆・马斯克旗下的人工智能初创公司 XAI 推出💡这是迄今为止全球参数量最大的开源大语言模型，参数量达到 3140 亿，遵循 Apache 2.0 协议开放模型权重和架构，在语言理解等方面有较强的能力💯
💡三、Gemini
谷歌推出的开源模型💡使用了和 Google Gemini 同源的技术，总共有 20 亿参数和 70 亿参数两种规模，每个规模又分预训练和指令微调两个版本💯该模型主打轻量高性能，在一些标准测试中表现优异，能在较低配置的设备上运行💡
💡四、通义千问
阿里云推出的开源大模型💡参数规模横跨 5 亿到 1100 亿，并且迅速成为开源大模型社区最受欢迎的开源大模型之一💯其具有多种尺寸的模型，小尺寸的可以在手机、PC 等设备端侧部署运行，大尺寸模型则更多运行在服务器和数据中心，支持更大规模、更专业的 AI 应用💡

💡五、Databricks DBRX
一个建立在 Megablocks 研究和开源项目之上的专家混合（MOE）模型💡它在语言理解、编程、数学和逻辑方面有较好的表现，在多数基准测试中击败了 GPT - 3.5，并且在每秒的代币数方面速度较快💯
💡六、Firefly
一个为 AI 开发者提供的一站式大模型训练工具💡支持对多种主流大模型进行预训练、指令微调和 DPO，这些大模型包括 Gemma、Qwen1.5、Minicpm、Llama、Internlm、Baichuan、Chatglm、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral - 8x7b、Zephyr、Vicuna 和 Bloom 等💯