释放数据潜能 赋能生成式AI新范式
2024/01/10
“生成式AI有望为全球经济贡献约7万亿美元的价值,并将AI的总体经济效益提高50%左右。”这是在ChatGPT引发生成式AI热潮近一年后,麦肯锡对于这一前沿领域的预判。麦肯锡还进一步预判了生成式AI为中国带来的重大机遇—随着生成式AI的推广,自动化时代将提前10年到来;预计到2030年,中国有50%左右的工作内容将实现自动化,这意味着约2亿劳动者必须实现技能转型或升级。
与机遇伴随而来的是企业对于相关技术能力的巨大需求,我国企业亟须提高技术变现能力,将AI技术的潜力转化为切实的经济效益。日前,在亚马逊云科技生成式AI构建者大会上,亚马逊云科技大中华区产品部总经理陈晓建介绍了亚马逊云科技在生成式AI浪潮中的布局—亚马逊云科技在发掘应用场景、建设工具和基础设施、夯实数据基座、开发AI原生应用和构建生成式AI服务五个方面助力企业和开发者全面释放生成式AI潜力。
1、夯实数据基座 打造差异化竞争优势
不同领域的专有数据是将通用大模型转化为行业大模型的关键。想要有效协调内外部数据,企业需要找到数据融合的方法,进一步优化生成式AI;设计明确的数据基础设施战略;构建面向生成式AI的数据基座,构建全面的服务体系,存储构建和调整模型所需的数据;集成服务并打破数据孤岛;确保生成式AI应用整个生命周期中的数据安全。
亚马逊云科技针对生成式AI领域的用户个人信息、会话信息、私域知识等提供了专门构建的数据库;针对检索增强生成(RAG)需要处理的向量数据,亚马逊云科技在Amazon OpenSearch Service、Amazon Aurora PostgreSQL和Amazon RDS for PostgreSQL等服务中加入了向量数据库功能,通过这些功能,用户能够查看和存储其应用中使用的数据,更轻松地获取数据,并筛除重复数据。
在数据集成方面,数据的ETL(抽取、转换、加载)是连接端到端数据的关键,亚马逊云科技提出“Zero-ETL”的概念并进行了创新,如推出Aurora Zero ETL for Redshift Integration,允许存储在Amazon Aurora中产生的实时业务数据自动汇聚到数据仓库Amazon Redshift中进行聚合分析。在数据治理方面,亚马逊云科技推出了Amazon DataZone数据治理服务,让客户能够跨越组织边界,发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时的工作量。
2、建设基础设施 降低生成式AI应用成本
目前,基础模型高速发展和迭代,而新出现的大模型在性能和特定领域都展现出了独特的优势。如何在众多基础模型中快速选择便捷、安全且适合自身的模型是每一家企业在构建生成式AI应用时必须考虑的重点。为了满足这种需求,亚马逊云科技推出了可以与Amazon SageMaker Jumpstart结合的Amazon Bedrock,能够帮助用户轻松、安全地选择基础模型。Amazon Bedrock是一项无服务器服务,能够帮助企业使用基础模型构建和扩展生成式AI应用程序,并辅助企业在不管理基础设施的前提下自定义模型。此外,Amazon Bedrock还具备代理功能,开发人员能够更轻松地创建基于生成式AI的应用程序,根据专有知识源提供答案。与Amazon Bedrock相比,Amazon SageMaker需要用户管理应用程序架构中的模型部署、配置和托管行为,但用户拥有更大的灵活度和自由度,能够在Amazon SageMaker Jumpstart中选择开源的基础模型,定制自身的基础模型,并根据自身需求调整模型。
3、加速应用构建 助力业务敏捷创新
在生成式AI蓬勃发展的当下,亚马逊云科技服务客户现代化应用转型过程中积累的经验得到进一步拓展:一是构建以微服务化和事件驱动为核心的设计框架,松耦合地连接每个功能模块;二是通过Serverless First简化运维,提升效率;三是将数据能力作为应用的核心竞争力,并将其纳入生成式AI应用设计理念中,像保护资产一样保护数据;四是构建安全围栏,减小威胁半径,重视数据的合规与保护;五是避免重复“造轮子”,持续融入现代应用治理理念,促进企业内部的经验分享。
如今,很多软件开发者需要花费大量时间编写浅显的代码,真正用于创新的时间少之又少,从网上复制代码片段可能无意中复制无效代码或有安全隐患的代码,而开源代码的使用难以进行有效追溯。因此,陈晓建认为,编程是生成式AI技术快速落地的领域之一。亚马逊云科技推出了一款人工智能编码伙伴Amazon CodeWhisperer,可以实时生成代码建议,提高开发人员的生产力。“在我们的生产力测试中,与未使用Amazon CodeWhisperer的参与者相比,使用该编码工具的参与者完成任务的速度平均快57%,成功率高27%。”陈晓建如是说。
4、降低准入门槛 生成式AI普惠之道
随着数据量激增、算力高速提升、大模型创新加速,生成式AI的准入门槛不断降低。受到不同行业、不同领域、不同规模企业的广泛关注,企业正在思考如何借助生成式AI创新业务,快速获得竞争优势。“构建生成式AI的核心是利用机器学习基础模型,学习复杂概念并执行多种任务,如今,用户已经可以通过一个预训练基础模型完成多项任务,也可以通过少量私有数据集自定义模型,不用再像从前那样从头训练传统机器学习模型。”陈晓建说道。
陈晓建表示,亚马逊云科技的目标是让任何人都能够获得和大型企业一样先进的基础设施来支撑创新。在生成式AI领域,亚马逊云科技希望通过自身的产品和服务,实现生成式AI技术的普惠化,赋能更多的企业和个人开发者。此外,“负责任的人工智能”同样是亚马逊云科技在生成式AI构建过程中的核心。“我们承诺以负责任的方式设计AI相关服务,同时考虑到公平和偏见、稳定性、可解释性、治理、透明度、隐私和安全性。”陈晓建表示
5、探索典型场景 创新企业业务模式
麦肯锡发布的《2023年人工智能发展现状:生成式AI的突破之年》报告显示,人工智能应用最多的职能部门是企业中的营销和销售、产品服务开发、软件工程、客户服务和后台支持等服务运营部门。作为一家始终关注用户需求,致力于为企业提供完善IT服务的云上“先行者”,亚马逊云科技通过增强用户体验、提升员工生产力与创造力、优化业务流程等手段,在典型的应用场景中助力企业提升业务价值。
软件服务提供商Salesforce将Amazon Bedrock和Amazon Titan集成到其生成式AI产品中,使客户能够在Salesforce Data Cloud上快捷、安全地使用其数据,以构建生成式AI应用;通过与亚马逊云科技一同应用生成式AI,海尔创新设计中心在文生图、图生图、定量图和全场景图四方面进行了相关实践,并通过自动化设计系统应用让相关业务的操作周期缩短了20%;游戏厂商沐瞳科技通过Amazon Bedrock优化游戏开发业务流程,通过生成式AI创造出满足客户需求的创新游戏体验。
陈晓建介绍了亚马逊云科技在生成式AI领域做出的努力:“开发生成式AI应用并不是单纯地将产品和服务拼接在一起,而是一个充满挑战的系统工程。在助推用户生成式AI应用商业化落地的过程中,除了汇聚自身资源外,亚马逊云科技还通过构建合作伙伴生态体系,解决用户在AI应用开发流程中的问题。此外,我们还聘请了解决方案架构师、产品技术专家;建立了人工智能实验室、数据实验室;提供快速原型团队、专业服务团队、培训与认证团队,帮助生态合作伙伴共同构建生成式AI服务体系,进一步加速相关技术和应用的落地。”