当前所在位置:首页 > 专业在线配资

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

4202

2024-10-21 【 字体:

站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。

阅读全文
相关推荐

利德曼(300289)2024年中报简析:净利润减9632%,公司应收账款体量较大

利德曼(300289)2024年中报简析:净利润减9632%,公司应收账款体量较大
据证券之星公开数据整理,近期利德曼(300289)发布2024年中报。截至本报告...

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型...

辉煌科技(002296SZ):上半年净利润113亿元 同比增长8540%

辉煌科技(002296SZ):上半年净利润113亿元 同比增长8540%
格隆汇7月30日丨辉煌科技(002296)(002296.SZ)公布2024年半...

解放军会让美国明白,美军主力入台之日,就是台海全面摊牌之时

解放军会让美国明白,美军主力入台之日,就是台海全面摊牌之时
美国国会众议院议员的米歇尔·斯蒂尔日前致信美国国防部长奥斯汀,表示美国不能继续放...

港股异动 宜搜科技(02550)涨超16% 股价刷新上市新高 公司有望9月入围港股通

港股异动  宜搜科技(02550)涨超16% 股价刷新上市新高 公司有望9月入围港股通
宜搜科技(02550)涨超16%,高见24港元刷新上市新高,较招股价5.8港元已...

在千篇一律的城市里香港依然保持着它的独有的魅力,复古、繁华、随意、烟

在千篇一律的城市里香港依然保持着它的独有的魅力,复古、繁华、随意、烟
在千篇一律的城市里香港依然保持着它的独有的魅力,复古、繁华、随意、烟火市井气等,...

5岁的他在四楼点火,一楼的家人欲哭无泪……

5岁的他在四楼点火,一楼的家人欲哭无泪……
据福建消防消息 近日 福建漳州市 一民房发生火灾 接警后 消防立即赶赴...

老古点金:黄金先多后空!原油看跌

老古点金:黄金先多后空!原油看跌
黄金行情分析这两个交易日的黄金的多空博弈的比较厉害,它不是单边行情,也不是一个见...

欧福蛋业北交所上市首日涨696% 募资113亿元

欧福蛋业北交所上市首日涨696% 募资113亿元
中国经济网北京1月18日讯今日,苏州欧福蛋业股份有限公司(以下简称“欧福蛋业”,...

逛“夜市”把工作找了,南沙倾听企业诉求服务“一呼万应”

逛“夜市”把工作找了,南沙倾听企业诉求服务“一呼万应”
“这次招聘会让我可以利用晚上休息时间来挑选自己心仪的工作,我感觉这种模式很新颖,...