本文作者:Rohit Badlaney, IBM 云计算产业平台业务总经理
【资料图】
在全球范围内,AI的采用正在稳步增长。最近,我们看到“性能密集型计算即服务”(Performance-intensive computing-as-a-service,PICaaS)开始更多地支持基础模型工作负载。基础模型意味着企业的AI开发和扩展出现了巨大变化,但很少有企业拥有构建或利用基础模型所需的技能和基础设施。结合我们的AI能力、云计算技术以及行业专长,IBM致力于将基础模型的强大功能带给企业客户,帮助他们优化业务成果,以负责任的方式借助AI进行数字化转型。
如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网。
性能密集型计算:IBM的成功路线图
IBM研究院(IBM Research)正将性能密集型计算解决方案应用于基础模型的训练和任务执行。最近,我们将Vela引入了IBM的研发团队,并得到了英伟达等行业领军企业的支持。Vela是IBM首款基于AI优化、云原生并部署在IBM Cloud上的超级计算机,其设计初衷是实现按需扩展,并将类似的基础设施部署在IBM Cloud的数据中心。Vela已成为IBM AI研发团队的首选环境,服务于IBM在基础模型方面的研发工作,以及与合作伙伴共同执行的多种模型训练。
Vela借助IBM Cloud来满足其GPU需求,有望加速科学、健康、制造业等领域的各种现实问题的解决。例如,IBM最近基于Vela实现了对watsonx.ai地理空间模型的训练(注:IBM watsonx.ai是IBM最新推出的下一代企业级AI开发平台,用于训练、测试、调整和部署基于基础模型的机器学习和生成式AI 等功能)。该watsonx.ai模型由IBM与美国航天局(NASA)合作开发,旨在将卫星数据转换为洪水、火灾等气象和气候变化的高分辨率地图,作为相关研究和监测的重要补充。
随着Vela的成功部署,IBM正在聚焦企业级AI的未来,为基于GPU的计算能力和GPU加速的watsonx服务带给更多客户。就在今年的Think大会期间,IBM发布了数款基于IBM Cloud并搭载英伟达GPU产品的GPU解决方案,旨在打造创新的GPU基础设施,实现企业工作负载中的基础模型训练,并通过watsonx服务支持企业级基础模型。IBM的GPU产品可用于多种工作负载,包括分析、训练和服务大型语言模型(Large Language Models,LLMs)。在今年晚些时候,IBM将在IBM Cloud上以“即服务”的方式交付全栈高性能、灵活、AI优化的基础设施,用于训练和服务于基础模型。这一全栈式路径旨在为企业级基础模型的构建提供一站式支持,包括软件、中间件和基础设施。
携手共创,帮助客户提高创新速度
近年来,市场对“性能密集型计算即服务”的兴趣持续增长。然而,许多企业仍受困于与基础模型相关的成本、性能需求和可扩展性等问题。这就是为什么我们推出端到端的性能密集型计算即服务解决方案,并部署在兼具客户所需的弹性、性能和安全性的基础设施上,尤其适用于受监管行业的客户(如金融服务)。
这一切都离不开与技术伙伴们的协作。比如,我们在该解决方案中使用了PyTorch,这是一个用于构建深度学习模型的机器学习框架。得益于和Ray.io(一个开源的统一计算框架)的合作,IBM研究院简化了AI工作流程的数据预处理和后处理,包括数据清洗,以及简化模型训练后的模型适应和验证。
加速各行业客户的AI应用
IBM针对AI应用开发的基础模型解决方案将帮助全球各地和各行业的企业,包括受到严格监管的行业,改善业务成果,从而更好地满足客户需求。例如:
· 金融服务:金融服务机构拥有大量与客户互动的数据。他们可以使用这些数据来调校基础模型,提供更好的客户体验,并识别交易欺诈。基础模型还可以将历史数据用于改善运营和合规。IBM Cloud for Financial Services旨在帮助受监管行业管理数据隐私、安全性、弹性及合规在内的复杂需求。IBM的GPU基础设施可以帮助金融机构更快地处理复杂交易,并通过基础模型为其客户提供风险规避应用。
· 制造业:人工智能可以对制造业产生积极影响,比如改善交货时间和质量检验。制造业企业可以借助IBM的基础模型解决方案,加快产品上市时间和更快速的创新,这对于保持供应链运营的竞争力至关重要。
了解更多
IBM最新发布的watsonx平台包括上述基于IBM Cloud的GPU解决方案。如需了解更多详情,请点击此处。
有关IBM未来方向和意图的声明可随时更改或撤回,恕不另行通知。
如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网
或扫描以下二维码进行访问: