随着腾讯的入局,国内生成式AI大模型赛道集齐BAT三大巨头,竞争日趋白热化。
4月14日,腾讯云发布面向大模型训练的新一代高性能计算集群,搭载英伟达最新一代H800 GPU,服务器互联带宽高达3.2T,算力性能较上一代提升3倍,号称目前国内性能最强的大模型计算集群。
除了算力基础设施,腾讯去年6月发布混元大模型,微信也在去年10月发布WeML大模型。在上月底的财报电话会议上,腾讯总裁刘炽平表示,对于腾讯整个业务来说,AI及大模型是一个增长的扩大器。
(资料图)
在腾讯下场之前,百度、阿里和华为等公司已经先后落子这一领域。
3月中旬,百度推出“文心一言”;半个多月后,华为在一场行业峰会上披露了“盘古”大模型的研发及落地情况;4月11日,阿里大模型“通义千问”高调亮相,未来将接入阿里全线业务。
与此同时,360、网易、知乎、科大讯飞、昆仑万维等先后公布自己的大模型;此前淡出中心舞台的王慧文和王小川重出江湖,迅速敲定数千万美元的融资,正在四处招兵买马。
掀起新技术浪潮的AI大模型,已经成为科技公司必须参加的一场大考。在AI领域深耕多年的商汤科技,也在本月交出自己的答卷。
Part 1 入局AI大模型“马拉松”
4月10日,商汤公布以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并发布“日日新SenseNova”大模型体系,涵盖自然语言处理、图片视频及3D内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
其中,最引人关注的是“商量SenseChat”,一款千亿级参数的自然语言处理大模型。在现场演示中,SenseChat能够结合上下文语境,流畅准确地回答各类问题,还具备超长文本理解能力,可以从复杂文档中提取和概括信息,帮助开发者编程,提供个性化的健康咨询等。
此外,商汤还展示了多款基于大模型体系的生成式AI模型及应用:“秒画SenseMirage”AI内容创作社区平台可以根据文本生成图片,拥有超10亿参数,支持二次元、三次元等多种生成风格,最高支持6K分辨率,还可支持自行上传数据集进行finetune、自训练等功能,定制训练属于自己风格的LoRA模型,显著降低模型的训练门槛;“如影SenseAvatar”AI数字人视频生成平台仅需一段5分钟的真人视频素材,即可生成数字人分身;“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台能够生成大模型3D场景和精细3D物件,为搭建元宇宙虚拟空间提供高效、低成本的工具。
秒画SenseMirage可根据文本生成多种风格的高清图片
AI大模型是中国科技企业的又一块兵家必争之地。随着BAT等互联网公司,以及商汤、科大讯飞等AI老兵的入局,每个人都摩拳擦掌、跃跃欲试,准备大干一场。
业内人士普遍认为,国产大模型与GPT至少有2~3年的差距。怎样尽快赶上世界先进水平,是摆在大大小小玩家面前的命题。将这一命题拆解开来,最关键的是数据、算法和算力三大要素。
三要素中,算法的研发难度相对较低,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距;但在数据和算力方面,想要拉近与OpenAI的距离要困难得多。它需要更漫长的积累沉淀,也需要企业持之以恒地拿出真金白银,投入到AI相关的“硬科技”中。
这也意味着,大模型之争不是一场停留在应用层面的百米赛跑,而是一场由综合能力定胜负的马拉松。谁能在数据和算力上建立壁垒,谁就有望率先踏入生成式AI的新时代,在新技术浪潮中吃到更多红利。
Part 2 数据和算力,AI大模型两大根基
ChatGPT之所以一鸣惊人、经受住了上亿用户不同场景下的考验,首先得益于OpenAI给它“投喂”了大量数据。
OpenAI此前披露,为了AI像人类那样流畅交谈,研发人员给GPT-3.5提供多达45TB的文本语料,相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台Github纳入其中。
丰富而庞大的语料库,让ChatGPT不仅能够聊天、讲故事,还会回答专业问题、帮学生写作业、给码农写代码。在一些读写测试中,ChatGPT展现出来的能力不亚于高中生。
与之类似,商汤语言大模型SenseChat也使用了大量数据进行训练,并充分考虑中文语境,能够更好地理解和处理中文文本。在发布会上,SenseChat一问一答应对自如,甚至还能够根据《专利法》答疑解惑,结合法条和最新资讯给出合理答案。
可以看出,足够多、足够丰富的数据,是生成式AI大模型的根基。商汤在这方面有自己的独特优势。
商汤的AI技术和产品已经在众多领域得到应用,在长期实践中,商汤积累了大量真实世界的高质量视觉数据,视觉信息可以转化为更多结构化的表达,形成丰富的多模态语料库,为大模型研发奠定基础。正如商汤董事长兼CEO徐立所言,“商汤积累了大量视觉类信息,这类信息作为知识,输入我们的多模态网络中,会带来完全不一样的数据基础。”不断增长的多模态数据池,让商汤从源头上建立了壁垒。
视觉大模型是商汤的核心技术突破点。早在2019年,商汤就发布了10亿参数的视觉大模型,2022年扩大至320亿参数,为迄今为止全球最大的视觉模型。而在自然语言处理、多模态和生成式AI大模型方面,商汤也已有产品落地。这些大模型的迭代生长和融合汇聚,最终造就了商汤SenseNova大模型体系。
除了海量数据,大算力是大模型的另一个根基。
AI大模型所需要的计算量,大致上相当于参数量与数据量的乘积。而大模型之所以“大”,就是因为参数众多和数据量庞大。过去5年,AI大模型的参数量几乎每年提升一个数量级,例如GPT-4参数量是GPT-3的16倍,达到1.6万亿个;而随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。
这意味着,想要玩转大模型,必须拥有大算力。OpenAI在生成式AI赛道上一骑绝尘,关键能力之一就是空前强大的算力底座。仅仅是为了跑出GPT-3.5模型,OpenAI就使用了约1万颗英伟达GPU来训练。
商汤很早就开始建设自己的算力底座。2018年前后,商汤就着手筹备大模型所需的算力、算法、数据等方面的工作;2022年1月,造价数十亿元的商汤人工智能计算中心(AIDC)交付使用,初始峰值算力达到3740 Petaflops,已具备完整训练万亿参数规模的大模型的能力。再加上数据层和模型层,商汤AI大装置逐渐成型。
如今,商汤的AI大装置SenseCore,依靠2.7万块GPU,其算力达到5000 Petaflops,可支持20个千亿参数超大模型同时训练,并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。
不过,AI大装置的效能如何,总算力并不是唯一指标。在日常应用中,AI大装置需要尽可能提高多卡并行状态下的算力利用率,尽可能保持长时间稳定运行。目前,SenseCore支持最大4000卡并行单任务训练,实现了多卡并行状态下的高算力利用率,还能持续7天以上不间断稳定训练。
此外,SenseCore提供了模块化、全链条的数据、训练及推理能力,可实现百亿级数据管理及检索、人工标注服务,一键量化、一键部署、一键应用,实现大模型快速上线验证。
自研自建的算力底座,为商汤在大模型领域施展手脚提供了舞台。
像SenseCore这样的AI大装置,其价值不仅体现在对于商汤现有大模型的支撑上,更指向未来发展。在源源不断的数据浇灌下,AI大装置能够以更高效、更经济的方式批量训练大模型,并缩短从研发到部署再到应用的链条,成为商汤大模型体系应用落地的推力引擎。
Part 3 政策指引行业发展,AI大模型加速落地
目前,生成式AI大模型已经成为全球各国的关注焦点。作为下一代互联网的关键基础设施,中国科技行业正在积极自主研发大模型,而配套的监管政策也已在路上。
近日,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》。征求意见稿指出,国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。
同时,征求意见稿对于生成式AI产品及服务的提供者做出多项明确要求,包括遵守法律法规的要求,尊重社会公德、公序良俗等,为其发展路径指明方向、划定红线。
上述文件有望成为国内生成式AI产业的首份监管文件。它在释放鼓励发展的积极信号的同时,也设置了一系列监管规则,目标是促进生成式AI的健康发展和规范应用。
各领域企业正在积极拥抱生成式AI,利用新技术实现降本增效,并把AI能力输出给第三方企业,勾勒出充满想象空间的商业化图景。
以阿里为例,除了通义千问接入阿里的所有产品外,阿里云的AI能力和算力也已经在多个企业和机构落地,包括OPPO、南方电网、复旦大学等。此外,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
商汤最新发布的日日新SenseNova大模型体系,同样应用于诸多行业和场景,目前已落地20多个业务场景。
比如,智能汽车是商汤长期布局的赛道。2022年,商汤智能汽车板块量产交付数超50万辆,新增定点数超800万辆,覆盖30多家车企的80多款车型。如今,随着SenseNova大模型体系的推出,商汤正通过AI大模型进一步赋能自动驾驶和智能车舱的产品研发。
在本周的上海车展上,商汤展示了与SenseNova深入融合的绝影未来展示舱。在展示舱内,商量SenseChat可以与用户交流、推荐个性化内容,甚至自动提炼邮件信息,帮助节省阅读时间,如果是儿童上车后还会自动推荐进入儿童模式;而秒画SenseMirage能够为用户自动生成各种风格的照片,为出行增添乐趣。
商汤绝影未来展示舱
借助大模型能力,商汤实现了BEV环视感知在国内首批量产落地,还首创自动驾驶GOP感知体系。此外,商汤绝影通过大模型进行自动化数据标注和产品检测,搭建的完整数据闭环体系,将模型迭代效率提升数百倍,目前已获得知名车企的定点。
此外,在生物制药领域,商汤与企业合作,利用AI大装置为蛋白质结构大模型提供AI推理算力,并为蛋白质相互作用模型,提供研发平台及训练算力,使得抗体筛选效率提升60%。
商汤以AI赋能实体经济的能力矩阵进一步扩充。SenseNova一方面服务商汤自身业务,另一方面,向政企客户开放了多种API(应用程序接口)。客户可根据自身需求调用SenseNova的各项AI技术能力,比如文本生成、图片生成、视觉感知、标注服务等,从而低门槛、低成本、高效率地实现各类AI应用。
基于商汤大装置和SenseNova大模型体系,商汤面向行业提供 “大模型即服务(Model-as-a-Service)”,涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多项能力。
可以说,商汤已经实现了“技术-产品-应用”的商业化内外双循环。长期重注AI的商汤,正站在新一波技术革新的潮头之上继续前行。
关键词: