💖Grok-1,马斯克旗下开源模型来袭。

adminhaoxyz 国内chatGPT 2024-10-17 40 0

文章目录

🎈开源 AI 大模型有哪些🎈
💡一、LLaMA 系列
  1. LLaMA 3.1 :由 Meta 公司推出,2024 年 7 月发布💡其中参数规模最大的是 LLaMA 3.1 - 405b 版本,拥有 4050 亿个参数,在多项 AI 基准测试中表现出色,为开发者提供了强大的基础模型💯其上下文窗口涵盖 128000 个标记,方便处理长文本💡
  2. LLaMA 3 :2024 年 4 月推出,其中 LLaMA 3 - 8b 和 LLaMA 3 - 70b 为该系列中具有代表性的版本,为同等规模的大模型树立了新的基准💡

💡二、Grok-1
由特斯拉 CEO 埃隆・马斯克旗下的人工智能初创公司 XAI 推出💡这是迄今为止全球参数量最大的开源大语言模型,参数量达到 3140 亿,遵循 Apache 2.0 协议开放模型权重和架构,在语言理解等方面有较强的能力💯
💡三、Gemini
谷歌推出的开源模型💡使用了和 Google Gemini 同源的技术,总共有 20 亿参数和 70 亿参数两种规模,每个规模又分预训练和指令微调两个版本💯该模型主打轻量高性能,在一些标准测试中表现优异,能在较低配置的设备上运行💡
💡四、通义千问
阿里云推出的开源大模型💡参数规模横跨 5 亿到 1100 亿,并且迅速成为开源大模型社区最受欢迎的开源大模型之一💯其具有多种尺寸的模型,小尺寸的可以在手机、PC 等设备端侧部署运行,大尺寸模型则更多运行在服务器和数据中心,支持更大规模、更专业的 AI 应用💡


💡五、Databricks DBRX
一个建立在 Megablocks 研究和开源项目之上的专家混合(MOE)模型💡它在语言理解、编程、数学和逻辑方面有较好的表现,在多数基准测试中击败了 GPT - 3.5,并且在每秒的代币数方面速度较快💯
💡六、Firefly
一个为 AI 开发者提供的一站式大模型训练工具💡支持对多种主流大模型进行预训练、指令微调和 DPO,这些大模型包括 Gemma、Qwen1.5、Minicpm、Llama、Internlm、Baichuan、Chatglm、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral - 8x7b、Zephyr、Vicuna 和 Bloom 等💯
版权声明

本文由ChatGPT生成,图片来源互联网,如有侵权,请联系删除

喜欢0 发布评论

发表评论

  • 昵称(必填)
  • 邮箱
  • 网址