Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
2024-10-21 【 字体:大 中 小 】
站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。
据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」
这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。
配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。
Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。
剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。
猜你喜欢
佳创视讯:3月11日召开董事会会议
Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
百利保控股(00617HK)将于3月27日举行董事会会议以审批全年业绩
特斯拉2023年在美国加州电动汽车市场的销量占比大幅下滑
金价暴涨创历史新高后如何交易?两张图看黄金技术前景 多头瞄准这些目标
华夏时代领航两年持有混合A基金经理变动:增聘金安达为基金经理
广东仅剩3家店!网红茶饮伏小桃大规模闭店,已暂停对外加盟
恒光股份:下游新能源市场需求旺盛 新增产能预计年底后释放
全球首台无人驾驶“空中的士”上架售卖
港股地产股走高 旭辉控股集团涨近11%
西部证券交易客户端手机版:随时随地掌控投资
股票分时图入门图解:新手必备指南
2024年最新股票配资平台:助力投资,稳健获利
奥运会开幕式里的巴黎文化,在深圳就能感受!
宜人配资:安全可靠的网上登录平台
揭阳一中学反欺凌承诺书中“不拍照不录像”内容遭质疑,教育局回应
这台模拟驾驶器为你科普车联网防黑客攻击
炒股加杠杆的必备条件:风险承受能力、资金管理、交易策略
2024年铁路暑运收官,累计发送旅客887亿人次创历史新高
新宝配资:虚拟盘还是真实交易?揭秘真相