IBM上线全新Granite系列语言模型
发布时间:2023-09-09 11:31:48 所属栏目:外闻 来源:转载
导读: 最近, IBM发布了全新的 Granite 系列自然语言处理模型,它们将是 IBM watson x 产品套装中的一员,可供使用客户选择。
Granite系列是与其他几个新功能一起推出的。据IBM称,
Granite系列是与其他几个新功能一起推出的。据IBM称,
最近, IBM发布了全新的 Granite 系列自然语言处理模型,它们将是 IBM watson x 产品套装中的一员,可供使用客户选择。 Granite系列是与其他几个新功能一起推出的。据IBM称,watsonx将增加一款新的工具可以让企业更轻松地创建AI训练数据集,另一项新增功能则会让神经网络更容易适应新的任务。 IBM在今年5月推出了watsonx软件产品,旨在帮助企业构建生成式AI模型,并有望简化例如确保神经网络满足安全要求等相关任务。 IBM这次推出的Granite模型将通过watsonx一个名为watsonx.ai的组件提供给用户。据IBM公司称,后者提供的工具可以更轻松地构建定制神经网络。此外,Watsonx.ai还包括了一系列预先打包的AI模型,这些模型将在本季度晚些时候通过Granite系列得到增强。 Granite系列包括了两种语言模型,分别是Granite.13b.instruct和Granite.13b.chat。IBM 表示,这两种语言模型可以总结文档、执行“洞察提取”以及生成文本,是IBM工程师通过2.4 TB训练数据集构建的。 这两个Granite模型都有130亿个参数,这使其足够紧凑,可以运行在Nvidia单个V100 GPU上。V100比Nvidia的旗舰产品H100要便宜得多,因此从理论上讲,Granite系列应该比那些需要更复杂硬件才能运行的大型语言模型更容易部署。 IBM公司软件高级副总裁Dinesh Nirmal在今天的博客文章中这样写道:“最初的Granite模型只是一个开始:更多的模型还将采用其他语言,更多IBM训练的模型也在准备之中。” 除了Granite系列之后,IBM还在watsonx.ai上推出了两个开源AI模型。第一个是Llama-2,这是Meta Platforms的通用大型语言模型;以及StarCoder,这是ServiceNow和Hugging Face在5月份发布的针对编程任务优化的神经网络。 除了更大的分布式的预打包深度学习神经网络技术目录之外,最新版本的watsonx.ai还包括了大量的新的人工智能计算机开发过程中的功能。 创建自定义人工智能模型往往需要大量的训练数据。在很多情况下,手动聚合这些信息可能需要大量的时间和精力,企业简化这个工作流程的方法之一,就是使用软件自动生成训练数据。 众所周知,此类合成数据并不总是像手动创建的记录那么准确,但对于AI训练来说通常是适合的。 据IBM称,watsonx.ai将增加一个内置的合成数据生成工具。要使用该公司,企业就必须上传示例数据集,例如购买日志的集合,watson.ai可以分析这些日志并生成具有类似特征的综合记录。 让已经训练好的AI模型适应新的任务,这通常需要对其进行重新训练,而且这可能是一个资源密集型的过程。为了应对这一挑战,IBM为watsonx.ai配备了参数调整工具,该工具可以针对新任务优化神经网络,而无需重新训练。 开发人员通过参数调整创建第二个起到支持作用的神经网络来优化AI模型。第二个神经网络向AI模型提供如何执行给定任务的指令,当这些指令与用户的自然语言提示相结合的时候,AI就能够比其他方式更有效地执行手头上的任务。 IBM还详细介绍了有关于watsonx.data的增强,watsonx.data是watsonx产品套件的一个组件,旨在帮助企业管理他们的AI训练数据集。这个套件包括一个基于云的平台,可以在任何地方运行,并且支持多种语言。 (编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐