传统产业是否会迎来GPT时刻？

WePuu

2024-5-10

资讯评论

2024年3月28日，在e-works数字化企业网主办的“第十三届中国智能制造高峰论坛”上，阿里云智能集团副总裁安筱鹏博士深入探讨了关于“AI大模型与商业、传统产业之间的关系”。本文根据安筱鹏博士的演讲内容整理而成，已经本人确认。

阿里云智能集团副总裁安筱鹏博士

AI大模型引发的三场革命

过去这段时间一直在研究大模型，如果讲以GPT为代表的AI大模型对于今天来说意味着什么？个人理解的是三场革命：

◉ 人机交互革命。从物理设备、软件编程、图形界面交互到今天的自然语言对话交互。

◉ 认知协作革命。什么叫认知协作革命？就是从问题到答案的最短路径实现了新的突破。

◉ 计算范式革命。即“以CPU为核心的计算体系”向“以GPU为核心的计算体系”的切换，这种切换首先从云计算、服务器开始，并逐步拓展到普通人使用的手机、电脑等等。未来计算的芯片、架构、存储、网络、通信、调度等，以及与之相关的协议和软件开发范式，都会迎来一次巨大的变革。

AI大模型引发的革命驱动着软硬件系统进行变革与重构，即“AI大模型驱动一切智能硬件”与“AI大模型重构一切软件系统”。其关键是“一切”，只不过是需要3年、5年、10年还是20年就不确定了，但是这一天肯定会到来。

AI大模型正在驱动一切智能硬件，包括手机、PC、家电、汽车、眼镜、机器人、工程机械等。

假设今天我们在一个教室里，这个教室里安装了两、三个摄像头，会议结束后，我可以问一下摄像头：今天在座的各位谁听讲最认真？它会告诉我；谁老在看手机呢？它也会告诉我。

假设你家里面有5个房间，你养了3只猫，此时此刻你可以看看猫在干什么，你可以问它，它可以告诉你，也可以给你一张图片。

而这些并不是短时间内就可以实现的。

AI大模型正在重构一切软件系统。手机软件正在被AI大模型改造，钉钉有几十个、几百个功能组件；PC的Windows 、Office、Photoshop等已经被AI大模型改造；ERP、CRM、MES乃至于PLC的编码方式也正在被AI大模型改造。

GPT时刻重构核心竞争力

我们会迎来一个GPT时刻，什么叫做GPT时刻？我将其定义为：技术范式的变革带来产业核心竞争力的重构。

换而言之，今天新的技术对于企业最重要的价值在于会重新定义其产品、服务、解决方案的竞争力。在此，我提出三个非常重要的判断：

判断1：AI大模型是数字技术体系的竞争

如果说ChatGPT是美国数字创新森林里的一棵树上的一片叶子，那么Sora是另外一片叶子。

美国的数字创新森林里会源源不断地生长出各种各样的新的场景、新的服务和新的模型。为什么又是美国在这一轮的AI大模型浪潮中引领全球呢？因为美国具备了孕育孵化AI大模型的5个关键要素：

01AI基础理论模型的突破。2017年谷歌发布了Transformer模型，成为这一轮大模型突破发展的基础。

02“AI+GPU”算力新Wintel体系的崛起。“AI教父”Geoffrey Hinton的学生在2012年的ImageNet大规模视觉识别挑战赛（ILSVRC）上获得了冠军，重要的是他将模型的训练从CPU切换到了GPU，大幅提高模型训练效率的同时，降低了训练成本，引发了新的深度学习革命，此后GPU成为学术界、产业界训练AI模型的“标配”。

03云计算大规模地推广和普及。大模型需要大算力，大算力需要新技术和低成本，云计算为大模型的训练创造了条件。云计算的发展为这些大模型大规模大算力创造了条件。

04过去近20年互联网的发展为今天AI在数据、工具、人才、场景等方面奠定了基础。

05美国开源社区的发展重构了AI商业化模式。因为开源开放生态很大程度上还决定了今天AI大模型的推广速度、广度和深度，也将深度影响今天AI大模型的商业模式。

判断2：AI基础大模型是1，行业垂直大模型是0

AI基础（通用）大模型的能力是决定性的，是所有数字前面的“1”，而行业垂直应用的AI大模型是后面的“0”。垂直行业模型的能力取决于AI基础大模型的能力。

7年前，我曾经去过全球最大的农业和工程机械公司约翰迪尔，它的总部位于一片玉米地后面的原始森林里，令人印象非常深刻。当时，约翰迪尔就在跟我们讲述如何将AI应用到农业生产中，并以“See and Spray”喷雾系统为例，解析了目标识别摄像头指导喷洒除草剂的概念：即在喷洒除草剂前，你首先要分清楚什么是草，什么是苗。

美国在7、8年前就已经出现了行业垂直大模型的应用，并且遥遥领先。今天，我们要思考的一个问题，就是行业垂直大模型，无论是在工程机械行业，还是在矿山行业的应用模型，它是一个8年前的模型，还是今天的基于AI的大模型，这是两个完全不同的物种。

关于AI大模型：有人说，AI大模型只会对话、生成文字图片，不能服务实体经济；有人说，只有行业垂直模型才有价值和意义；还有人说，中国在AI大模型领域与美国差距较大，但中国在垂直行业领域已经超过美国。

这些都是错误的，没有AI基础（通用）大模型支撑的行业垂直应用AI模型，要么是浑水摸鱼，要么是混淆视听。

今天，我们一定要重视通用人工智能，通用人工智能才是关键。这个关键是什么？好比人形机器人，不是因为它长得像人，而是因为它的大脑、它的智力水平更像人，才被称之为人形机器人。而决定其智力水平的一定是通用人工智能，之前的人工智能是没有意义的。

判断3：中国AI大模型面临“加拉帕戈斯隐忧”

中国AI大模型面临的最大挑战是“加拉帕戈斯隐忧”。何谓“加拉帕戈斯隐忧”？加拉帕戈斯是太平洋上的一个群岛，达尔文在一百多年前写的《物种起源》中提到，这个岛上有很多物种，每个物种都在这个封闭的环境中自我进化、自我迭代、自我演进，但它们一旦离开了这座岛，就会因为无法适应环境而死掉。

我们今天也经常在讲，产业在一个封闭的、碎片化的环境中形成的时候是没有竞争力的。企业所需要的是如何从项目公司进化到产品公司、从产品公司进化到平台公司的核心竞争力。无论是做AI大模型，还是做SaaS，还是做工业互联网，都需要理解一个基本问题，即公司是属于项目公司、产品公司还是平台公司。只有对此有一个清晰的定位，你才能真正理解什么叫做新质生产力，什么叫做先进的商业模式和技术解决方案。

AI大模型的典型应用场景

面向未来，AI大模型可以在4个方向上发挥作用，即消费者领域、生产制造、公共服务和科学赛道。这4个领域按照商业化技术解决方案的诉求、难点分成ToC和ToB/G两个场景。

目前，AI大模型的商业化发展到了什么阶段？结论是AI大模型距离大规模商业化拐点的到来还需要一段时间。

如何判断AI大模型商业拐点、技术拐点的到来有两个标志：

① AI大模型的能力需要提高两个数量级；

② AI大模型的算力成本需要降低两个数量级。

当这两个条件同时满足时，才有可能真正地出现AI大模型的原生应用。

对于ToC场景而言，面临着推理成本如何降低、基础模型效果如何提升等问题；对于ToB/G场景而言，面临着碎片化场景微调需求以及更加稀缺的算法专家资源等挑战。

谈几个与AI大模型应用有关的例子：

01 / 视频影视行业

2024年3月6日，时长达90分钟的电影《终结者2：审判日》上映，这是一部由50位AI电影艺术家利用Midjourney、Runway等多个AIGC工具创作而成；还有由Stable Diffusion、Topaz Photo AI等文生图及视频工具制作而成的AI版《沙丘2》，人们通过AI制作方式参与得更多。

大家有一个错觉，好像Sora只能生成一些图片、视频。对此，王坚院士关于Sora的经典言论对我非常有启发，他表示：“如果谈到Sora，只说它可能会影响短视频等行业，那我觉得是对它极大的羞辱，它的意义远超这种事情。”

因为从Sora的发布会中可以了解到，它未来的目标是“世界模型”，意为“在比特世界中还原原子运行轨道，用数字化的方式模拟物理世界的运行规律。”目前，Sora距离“世界模型”的目标还有很长的路要走，但它在这条道路上已经迈出了重要的步伐，这是其核心价值所在，它的意义远超过生成视频。

02 / 软件行业

去年4月份ChatGPT-4发布的时候，机构研究表明，ChatGPT-4的软件编程能力，在中国相当于月薪3万元的软件工程师的水平，在美国相当于年薪18万美元的谷歌L3级软件工程师的水平。

前段时间，我看到美国的互联网上在讨论一件事情：某企业要招聘一个工程师来创建最小可行性产品（MVP），有两个人去面试，一个有4年编程经验，一个有19年编程经验。但是4年编程经验的工程师，他利用ChatGPT-4、Copilot、Bubble等工具，他的工作效率相当于19年编程经验工程师的5倍，而他的工作成本仅相当于19年编程经验工程师的1/20。

大家可能没有感觉，我前段时间去到了一家央企，了解到它每年软件外包的预算高达6亿元。2024年，这家央企要求将6亿元的预算压缩到3亿元。为什么要压缩预算呢？因为今天有了一个新的工具，ChatGPT-4或者说阿里的通义灵码，可以帮助公司去编写软件、生成代码，软件的开发效率会提高、开发成本会降低，就可以帮助公司将6亿元的预算压缩到3亿元。

03 / 芯片行业

2024年2月23日，英伟达市值涨了2770亿美元；英伟达的市值从1万亿美元到2万亿美元只用了9个月时间，这创造了华尔街历史上的两项记录。英伟达有一天的成交量突破1000亿美元，这是什么概念？一家公司一只股票一天的成交量几乎相当于整个A股市场5000家公司一天的成交量。

这主要归功于计算范式的变革，从CPU （通用计算芯片）到GPU/xPU（半专用计算芯片），再到ASIC（专用计算芯片），计算效率越来越高。我们可能没有去关注芯片，大家可以体会一下通用芯片与专用芯片的区别。

什么叫CPU？它好比一辆皮卡，既可以拉货，也可以拉人；

什么叫GPU？它好比一辆小轿车，可以拉人，既可以走高速公路，也可以走农村一级公路；

什么叫专用计算芯片？大家可能有注意到一个成立时间不长的AI芯片初创公司Groq，它开发出了一种新的 AI 专用计算芯片——LPU（Language Processing Unit），其推理速度相较于英伟达GPU 提高了7-8倍，成本却不到其十分之一。

所以，计算范式也正在发生变革。

04 / 无人驾驶行业

特斯拉的自动驾驶FSD V11版本有30万行代码，其技术路线是基于“海量标注+规则代码”，即将“红灯停绿灯行”等图像标注转化为规则代码给到自动驾驶系统。而FSD V12版本只有2000+行代码，其技术路线是基于“海量数据+BEV+Transformer”，即无需再将“红灯停绿灯行”给到自动驾驶系统，它可以通过图片、视频自行学习。

2023年9月2日，1200万人围观马斯克特斯拉自动驾驶，他试驾后讲的最重要的一句话是，“没有一行代码，让特斯拉在停车标志处停车”。AI大模型带来了自动驾驶研发模式的跃升：从规则代码输出的驾驶决策,到基于AI大模型生成的驾驶决策。

05 / 机器人行业

2023年7月28日，谷歌Deep Mind推出了一款新的机器人模型Robotics Transformer 2（RT-2），这是一个全新的视觉-语言-动作（VLA）模型。例如，对AI机器人说“捡起已灭绝的动物”，机械臂会在一堆塑料玩具中精准的选择恐龙，“灭绝的动物”很多，在此之前，机器人无法做到把“灭绝的动物”和“塑料恐龙玩具”联系在一起。

近期，很多人也关注到了OpenAI在今年2月投资了一家机器人公司Figure AI，获得投资的13天后，Figure AI公司就推出了OpenAI大模型加持的机器人产品——Figure 01，它基本可以完全理解人类的自然语言指令和意图并执行相应动作。通过Figure 公司公布的视频，我们能看到Figure 01已经具备很好的理解能力（什么是可以吃的东西）、分析能力（在桌子上找到可以被人类吃的东西）、规划调度能力（苹果和碟子的抓取手指动作的不同）和执行能力（将苹果拿给人类）。更重要的是，Figure 01模型的开发只用了12天。

机器人产业的核心竞争力正在被重构。浙江有一家机器人公司叫有鹿机器人，它的路面清洁机器人集成了通义千问开源模型，使机器人能以自然语言与用户进行实时交互，理解用户提出的需求，完成用户交办的任务。比如，物业经理说“一号楼门前有个可乐瓶，你过来扫一扫”，机器人就能找到这个位置、完成清扫任务。

可以看出，未来机器人产业的核心竞争力在于是否植入AI大模型。比如码垛机器人，过去工程师现场调试可能需要一周时间，而现在植入AI大模型后操作人员可能只需要几分钟的时间，打开知识库文件，通过语音/文字输入需求参数，一键下发指令后码垛机器人就可以开始执行任务。

06 / 智能终端行业

在今年1月的美国拉斯维加斯消费电子展上（CES）上，最重要的一个概念就是AI。尽管是消费电子展，但是可以看到PC、手机、汽车、家电、可穿戴设备等都在不断被AI化。

昨天在跟智库机构交流的时候，我说今天要思考一个问题，什么叫做AI大模型驱动的竞争力敏感行业？我们需要定义AI大模型竞争力的敏感行业：哪些产品和企业的竞争力在短期内会被AI大模型重构？哪些是长期？哪些永远不会被重构？

中国的手机、PC、汽车出货量的全球占比很高，而很多企业都在开发自己的AI大模型。在此，我有几个非常重要的判断：

判断1：AI手机将成为继功能机、智能手机之后，手机行业的第三阶段

判断2：我们不知道的是，AI会给手机增加多少新功能；我们知道的是，没有AI大模型驱动的手机会在市场消失。

判断3：2024年是‘具车智能’元年，‘具车智能’一定会发生在‘具身智能’之前，并且会首先诞生在中国车企，而强大的基础模型是‘具车智能’的关键。

判断4：模型上机并与云端协同，将成为智能终端大模型商业化的重要形态，AI开源大模型的重要性进一步凸显。

最近，联发科（MediaTek）携手阿里云已成功在天玑9300等旗舰芯片上部署通义千问大模型，首次实现大模型在手机芯片端深度适配，大模型在手机芯片上的探索从验证走向商业化落地。

07 / 科学行业

今天，AI已经成为芯片设计的“器”，AI与EDA的双向奔赴，推动着芯片设计开启下一场革命。英伟达用AI设计GPU，比传统EDA减少25%芯片面积，功耗更低。英伟达研究人员提出了PrefixRL——用深度强化学习优化并行前缀电路。英伟达Hopper架构H100就拥有13000个AI设计电路。EDA设计公司Synopsys和Cadence等公司积极拥抱AI设计。

2022年底，Deep Mind通过Alpha Fold2模型，预测了2.2亿种蛋白质结构，几乎覆盖DNA数据库中所有已知生物体的蛋白质，解决了长期困扰生物医学研究领域的难题，为加速生物医学研究打开了大门。生物医药公司通常会聘请博士处理专利分析的工作，但我们发现AI大模型工作10分钟相当于2个博士1周时间的专利分析成果。

斯坦福大学报告中指出：算力已成为科研的大型装置。2022年，美国科技公司创造了32个重要的机器学习模型，而学术界只产生了3个，这与2014年形成了明显的反转，当时大部分AI突破都来自高校；近70%拥有AI博士学位的人才最终进入私营公司就业，而20年前这个比例只有21%。今天在AI大模型的理论创新方面，美国的企业也已成为了主力军。

以上就是未来AI大模型可能给产业带来的影响。（本文完）

(￣▽￣)"本网站为公益网站，内容来源于网络，如侵犯到您的权益，请留言联系站长删除！

THE END