9月12日—16日,以“数字引擎 贸易未来”为主题的上海城市形象展区将亮相2024年中国国际服务贸易交易会,重点展示在国家战略引领下,上海在更高起点上全面深化改革开放,建设上海DEPA合作区、“丝路电商”合作先行区,争创国家服务贸易创新发展示范区,推动服务贸易高质量发展的成果和亮点。下面让我们探营上海城市形象展区的服务贸易企业。
MiniMax副总裁刘华:让国产大模型走出去,与海内外用户共创智能
如何随时随地创造语言环境学英语?前两个月,90后小华为了学英语,用起了一款名为“海螺AI”的APP,“比如你可以提出,想要练习在咖啡店场景下的口语,然后你就能和AI对话,还可以主动问AI自己哪些表述不妥当,让它纠正。”
实际上,这并不是一款专门用来学外语的APP,但因其智能助手的特性,被用户“开发”出各种用法。
据了解,海螺AI来自一家上海人工智能科创企业——稀宇科技(MiniMax)。从2021年成立至今,MiniMax已获得IDG、高瓴、国寿、阿里、腾讯、米哈游、红杉等多家海内外知名机构的超过10亿美金融资。今年服贸会,它也将带着最新大模型成果来到现场,展现人工智能的前沿魅力。
MiniMax副总裁刘华告诉记者,虽然起步较晚,但MiniMax在创立之初就坚定全栈自研大模型的道路,无论2B还是2C业务,都是为了能让其自研大模型触达更多用户,希望用人工智能技术让大家的生活更便捷,践行公司“与用户共创智能”的宗旨。
自研大模型,技术和心理的双重考验
除了海螺AI,小华还用过MiniMax旗下另一款软件“星野”——和自定义的虚拟伙伴聊天,用户可以在星野APP上设定智能体的形象、声音和人设,并与之进行实时沟通互动,建立感情连接。
在2B业务端,MiniMax开放平台至今也服务超3万家企业客户,是国内公有云上调用量最大的大模型开放平台。譬如,MiniMax为金山办公提供文本生成、要点总结、任务分发、表格和演示文稿生成等能力,帮助其打造“WPS AI”产品;MiniMax还作为联想指定大模型供应商,与其联合打造AIPC个人智能体联想小天。
这些成绩背后,依靠的是MiniMax自研模型。作为中国首个研发万亿参数MoE大语言模型并成功上线的AI企业,MiniMax持续在模型算法上做创新,并最新推出基于MOE+ Linear Attention的新一代模型技术。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。
“Abab其实是‘阿巴阿巴’的意思,就像婴儿牙牙学语时的状态,有点像是为了自嘲,因为那时候OpenAI已经做出GPT3,感觉人家已经比较成熟了。”刘华说,全栈自研是一条很艰难的道路。技术方面,不仅模型代码要自己写,训练数据要自己找,就连训练模型的集群也要自己和算力厂家一起打造。
心理层面上同样承压。在研发的过程中,团队需要在一次次面对糟糕结果的同时,还要坚持认定研发方向的正确性。“大家都知道,大模型需要训练到一定参数量后,才会有智能涌现的展示,我们中间有很长一段时间看不到这个,但我们还是得相信走下去是对的,如果在半路坚持不下去换赛道,就没有现在的成果了。”刘华说。
8月31日,MiniMax音乐模型与视频模型已经在MiniMax开放平台和海螺AI网页版上线。此外,abab 7系列文本模型将于未来数周内正式发布,并采用新一代创新技术。
大模型出海,有需求也有迭代动力
在国内,海螺AI和星野APP的月活总用户已达到千万级。而在海外,有着星野“海外版”之称的Talkie也深受国外用户的欢迎。据SensorTower数据,Talkie的月活跃用户数量已达1100万。在2B业务方面,MiniMax则积极在“一带一路”国家地区进行拓展。
让国产大模型走出去,是MiniMax近年来一直在推进的方向,“我希望我们是一家全球化企业,在海内外都能开展业务。”刘华说,出海不仅可以服务更多国外客户,还能直接面对海外竞争,拥有更大迭代的动力。
在他看来,移动互联网时代时,中国有许多互联网企业产品都成功走到海外,并在当地具有一定影响力,“这样的故事在大模型时代,为什么不能复制呢?”
事实上不只是MiniMax,大模型出海已经形成一种趋势。5月23日,阿里云宣布,大模型服务平台百炼国际版即将上线,提供一站式、全托管的大模型定制与应用服务;科大讯飞在2024年世界移动通信大会上宣布,旗下讯飞听见同传、讯飞智作等产品在海外市场落地,登陆沙特、新加坡、马来西亚等市场。
清华大学新闻学院教授、人工智能学院教授沈阳在接受《环球时报》记者采访时表示,四大因素驱动中国AI大模型走向国际市场。
第一,为扩大市场份额,企业要寻求更大的产业空间;第二,国内AI技术发展较快,而海外许多国家仍处于起步阶段,AI大模型可以进入到这些市场进行产品验证和改进;第三,全球市场特别是东南亚、北非、北美和南美,为AI技术提供了更丰富的应用场景;第四,AI大模型出海也有助于深化与友好国家的经贸合作。
人工智能,新质生产力的驱动力
不过,大模型虽然席“卷”全球,但在海内外所面对的发展环境却不尽相同。
刘华说,比如在大洋彼岸,更多是产业界、资本界和学界在对大模型进行追捧,当地的普通民众其实对大模型并没有太熟悉。但在国内可以明显感受到,全社会对大模型的认可度和接受度都很高,大家很愿意尝试大模型产品,这给大模型行业的发展奠定了非常好的发展基础。
政策层面,2024年政府工作报告中就首次提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。具体到上海,人工智能作为上海三大先导产业之一,正在积极推进“人工智能+”发展,并发挥示范引领作用。
“我觉得对我们现在中国的大模型行业来说,提供了一个非常好的去做技术,同时去做产品的社会条件。”刘华说。
人工智能是新质生产力的驱动力。目前,MiniMax还在积极研发下一代更大参数的大模型,能让文本、语音、视觉三个模态更加自然的融合到下一代的这个模型里面。同时,也在通过算法的优化,来降低模型落地调用的成本。
具体来看,语音模型亟待攻克的难点是交互延时,也就是用户在和智能体对话时,大模型的停顿时间,延时缩短,才能更像日常生活中人与人之间的自然沟通。值得一提的是,MiniMax新一代语音模型已实现对粤语、日语、韩语、西班牙语等多语种支持的升级。
“可能大家看到的,是我们在通过大模型提高个人生产力,提高大家的工作效率,其实这一波以大模型为代表的人工智能技术,是在引领一波新的科技革命。”刘华表示,随着模型能力的提高,现在它可以充当大家的语音助手,以后还能成为科学家们的科研助手。
“随着视觉模态模型的能力提高,我们相信大模型能够在一线生产制造环节发挥更大的作用,这是一个循序渐进的过程。”