《方略》|方三文对话智谱CEO张鹏：大模型不会只剩一家，多样性是技术革新的源动力

导语

在人工智能技术快速迭代、大模型成为产业焦点的背景下，全球AI竞争格局逐渐清晰，技术多样性与商业化落地成为行业的核心议题。在这一背景下，中国大模型企业的技术选择、组织路径与长期判断，逐渐成为观察全球AI竞争格局的重要样本。

在雪球出品的投资类专业对话栏目《方略》第三季第二期中，雪球创始人、董事长方三文对话智谱CEO张鹏，围绕AI发展历程、AI应用的边界、智谱商业模式等核心话题展开。张鹏表示，模型体系的多样性是技术持续进步的重要动力。以下是对话精选：

《方略》|方三文对话智谱CEO张鹏：大模型不会只剩一家，多样性是技术革新的源动力第1张

大众对AI的问题没有超越图灵九问

方三文：什么是AI？

张鹏：AI是一个缩写，它叫做Artificial Intelligence，直译过来就是人工智能。最简单直白的一个描述就是，用技术的方法，不管是计算机还是其他的方法，去模拟人类的智能，进而来服务人。

方三文：图灵在1950年的论文《计算机器与智能》里面提出了智能这个概念，后来在达特茅斯会议里面直接定义了人工智能。我们今天谈论的AI，和图灵说的智能或者是1956年提出的人工智能之间有什么关系？

张鹏：如果按照逻辑学或数学的概念来描述，智能是更大的一个圈，人工智能是智能当中的一部分，就是我们怎么去模拟人类的智能。所以现在我们说的AI或者人工智能，其实就是1956年达特茅斯会议上提出来的那个定义。但是，随着时间不断演进，技术和市场的变化，AI的内涵在不断变化。现在的人工智能包含的事情比当年范围更广，但核心目标没变。

方三文：大模型和AI，是一回事吗？

张鹏：大模型只是我们实现人工智能的技术方法中的一种。

方三文：从1950年代到现在，AI发展经历了什么重要的节点？

张鹏：从1950年代到现在大概70多年，不到80年。这几十年来，AI的发展并不是一帆风顺的。大家公认的有三次人工智能浪潮，或者严格划分也可以说现在是第四次。为什么会起起落落？我觉得这也是一个历史的必然规律。一件事情的发展不会永远是增长的曲线，过程中会碰到各种挑战、困难，结合当时的社会经济情况，会有起伏，都很正常。

方三文：1958年提出的感知机是什么？

张鹏：感知机是一个数学上的方法，简单理解就是尝试在数据的空间中找到所谓的“超平面”，把这个空间一分为二，平面的一侧是我们想要的结果，另一侧是不想要的，这其实是个分类问题。感知机就是找到这个“超平面”的一种方法，通过机器设定一个模型，让它通过数据迭代的方式准确定位超平面。它对AI的作用是奠定了一个基础，通过机器学习，让机器从数据中学习的方法去解决具体问题。就像人通过学习解决问题，不断实践，通过数据反馈来迭代求解，而不是设定一个公式算一遍就结束。这个和现在的大模型、深度学习的思想完全一致。可以说它是机器学习的源头、鼻祖。

方三文：1966年MIT开发了第一个真正意义上的聊天机器人，叫Eliza。你看现在大家特别热衷的ChatGPT，都在聊天。为什么人工智能跟聊天有这么密切的关系？

张鹏：我觉得最重要的还是回归到人工智能的本质目标，就是用机器或技术的方法实现类人的智能。但你如何确定你做出来的东西具备类人的智能？它需要一个检验方式。对于人来说最自然的检验方式就是聊天，看我能不能识别出你是不是个人。所以从最开始的出发点，就影响到后续很多工作。

方三文：1973年出了一个莱特希尔报告，提出AI的局限性，导致AI投资下降。当时AI局限性主要指什么？

张鹏：莱特希尔报告里举出的AI局限性有几个方面。首先最明显的是当时整个AI研究界乐观情绪占上风，在那个年代就喊出口号说未来20年要实现通用人工智能。大家的理想很好，目标远大，但路径中困难太大。那时计算机的计算能力很差。第二，当时对数据也没有很好的整理。第三，早期的人工智能方法基本上都基于符号学派，它能解决的问题非常局限，比如数学物理这种能用完备符号系统表达的，稍微扩大到知识、常识就不行了。所以导致大家重新冷静审视AI的投入，引起第一次AI寒冬。

方三文：是不是任何科学的终极目标或愿望，和现在可用的资源、路径总是存在着较大差距？

张鹏：这是一个行业或技术往前发展的源动力。就像物理化学里的渗透压，两边浓度不同会产生渗透动力，来自于不均衡。当你远大目标和当下拥有的资源、技术能达到的效果之间有差距时，这个差距会刺激大家不断研究、找到新方法、投入新资源。这很正常，只是看差距有多大。

方三文：这个渗透压达成的平衡是不是一个相对动态的平衡？

张鹏：是，肯定是动态平衡。就像AI的发展起起落落，为什么第一次寒冬后会有第二波？因为大家重新看到了动态平衡的可能性，有新资源加入，渗透压变化，好像能克服或利用这个差距，于是投入新方法、新资源去做。所以它永远是动态变化的。

方三文：1981年产生了第一台带GPU的电脑。GPU是什么？它今天很热，跟AI是什么关系？

张鹏：GPU跟CPU相对。CPU是计算机的核心处理单元，中央处理器。GPU叫图形处理器，当时专门设计出来帮CPU分担图形处理能力。GPU和AI的关系挺有意思。因为它做图像处理时更偏重浮点计算，CPU偏重整数计算。GPU专门加强了浮点数计算的能力。这一点恰恰跟AI或科学计算类似，科学计算里有大量浮点计算。有些科学家就说，能不能用硬件加速的方法来加速科学计算的算法程序？英伟达敏锐捕捉到这点，黄仁勋当时给很多科学家送GPU卡，唯一要求是把算法在上面跑，收集效果来宣传。

方三文：1980年代末1990年代初，AI又进入第二次寒冬。这个中间发生了什么？和第一次有什么区别？

张鹏：第二次AI起来是因为大家找到了一个新方法――专家系统。在第一代感知机等方法基础上，通过结构化知识表示，让计算机具备像专家一样的专业知识来解答问题。这是第二代人工智能成功的点。但到一定程度后发现，虽然理论上比第一代好，有完备方法论，可以把人类规则用if/else方式写下来交给机器用。但这种方式到一定规模后，知识能不能穷举？比如医疗领域所有病症和治疗方案能不能穷举？把所有知识写出来，可能是天文数字。这是实现成本和周期的问题。第二，虽然计算能力增加了，但巨大量的专家知识输入后，计算量是指数级爆炸增长，仍然不能满足需求。水位永远是动态的，看到计算能力提升投入新方法，加了很多东西后计算能力又不够了。所以是动态互相促进的过程。

方三文：1997年深蓝击败国际象棋世界冠军，有什么意义？

张鹏：这是非常标志性的事件。大家会觉得聊天简单，下棋比聊天复杂，智能水平高很多。如果机器在下棋上胜过人类，说明智力水平到一定程度了。深蓝战胜卡斯帕罗夫的意义就在这。

方三文：后来过了将近20年，2016年AlphaGo击败李世石。AlphaGo和深蓝在技术上不同？

张鹏：实现路径上不一样。深蓝主要是搜索式的方法，在已知棋谱或当前棋盘状态中搜索下一步，可能往前搜索几步，用蒙特卡洛树搜索剪枝，不搜索所有空间，只搜索一部分，预测有限步数，在有限时间内找到最接近最好的解法。AlphaGo也沿着这个路径，但实现方式不同，用了神经网络，用大量数据训练来逼近搜索和预测算法。目标都是搜索空间预测最好方法，但预测方式不同。可以理解为AlphaGo是端到端的方法，深蓝更多是基于规则、一环套一环的工作流水线。

方三文：简单说说深度学习是什么？

张鹏：深度学习指有比较深的算法层次。比如一层神经元或基本计算单元，能解决非常简单的问题。复杂问题就叠很多层，一层一层往上叠，层数越多能模拟的情况越多，计算越复杂。

方三文：就是函数套函数？

张鹏：对，一层套一层，不断垒起来。

方三文：从终端角度看，1995年前后PC普及，2000年前后互联网普及，把机器和数据连起来。这对深度学习发展有关系吗？

张鹏：深度学习需要非常大的计算能力。刚才讲GPU就是因为它浮点计算能力强，所以火起来。计算设备能力的提升是深度学习快速发展的前提条件，算力相当于发动机，越强大输出马力越大。数据相当于燃料，要有优良、大量的燃料才能让发动机跑更长时间，输出更大功率。PC和互联网提供了大量数据。

方三文：Google 2016年发表了Transformer论文，论文发表后短时间内OpenAI发布了ChatGPT，这两个事情有联系吗？

张鹏：肯定有联系。OpenAI真正转做大模型就在这篇论文发布之后。OpenAI 2015年成立，到2018年左右一直不是走这条路，而是走强化学习路线。Transformer论文后不久，2018年开始，以伊利亚为首的科学家果断转向，基于它做GPT相关研究。

方三文：第一个版本ChatGPT出来时你关注了吗？

张鹏：分两个阶段。2018年他们开始做GPT，没引起太大关注，效果不太好。从GPT-2开始有一定关注，学界有讨论，褒贬不一，有人说它只是大力出奇迹，不是算法革新，也有人说是好范式。那时关注到讨论，在国外比较多，国内相对少。得益清华环境，接触国外学术圈方便。真正让大家觉得很牛是2020年GPT-3发布。从GPT-3发布我们就关注到，并且认知到它可能就是未来的范式变化转折点。

方三文：为什么做出这种判断？当时出现什么现象或重要突破？

张鹏：之前我们用传统机器学习方法做NLP任务，包括对话、QA等，一直没做到让人满意。传统NLP方法需要很长算法流水线处理句子，找到结构、名词、动词，理解句子。但GPT出现后，发现不用这么做，只要把句子扔进去，它就能答，而且答得很好。这就是端到端解决，不需要复杂拆解。效果很多时候碾压传统流水线方法。所以大家看到这个方法有优势，觉得这可能就是下个阶段的技术范式。

方三文：DeepSeek-R1的发布，好像颠覆了大家认知。你认为从原理和效果上它有什么突破？

张鹏：DeepSeek引起行业内重大关注，但它还是沿着这条路走，没有像GPT相对于传统机器学习有那样迥异的方法论。它不是方法论级别的，更多是在怎么降低成本、怎么把工程优化，把原来“力大砖飞”简单堆参数量或数据量的逻辑拉回来，告诉大家不用堆那么多，可以在算法上优化，把成本压下来，效果同时提升。更重要的原因是，它在那个时间点用开源方式把技术全部交给社区、研究界、工业界，让大家无偿免费使用最新技术，对当时的市场冲击很大。

方三文：AI发展涉及算力、数据、算法。现在这三个因素哪个最卡住AI发展？哪个突破可能带来进一步发展？

张鹏：不同时间段认知不一样。最早大家觉得算法重要，可以直达AGI。过一段时间模型参数量大，又觉得互联网上能拿到的数据不够了，担心数据用尽、预训练撞墙。然后大家琢磨解决数据问题，到现在数据问题也能解决掉，又担心算力不够。后来技术进步，英伟达拼命生产，算力也能搞到。大家又会觉得算法本身有问题，效率不高，灾难性遗忘等问题解不了，很多人预测Transformer也要被革新。所以它是个动态循环、螺旋式上升的过程。

方三文：你觉得AGI是抽象目标还是具体目标？是最终可以实现还是只能无限接近？

张鹏：AGI定义不像AI那么清晰，它的内涵外延从没有非常明确权威的定义。但AGI能不能实现？只要我们能把这个目标定义好，不太离谱的定义，大概率能实现，时间长短问题。智谱从成立第一天目标就是AGI，我们有自己定义。

方三文：对普罗大众来说，AGI是不是有点像科学中的终极真理，不容易具体化？

张鹏：终极真理很难描绘，因为谁也不知道。但科学界有多种方法描绘，比如图灵测试用行为学定义智能。AGI很多时候大家也用行为学定义，比如有一派说，AI取得人各项能力的平均水平就叫AGI。有了行为定义，倒推技术要做到哪些事情，匹配人的水平。所以跟定义方式有关，实现路径参照这个一步步走上去。

方三文：今天大众对AI争论，有没有超出图灵提出的那九个反问？

张鹏：基本上没有超出那个范围。AI行业70多年，起起伏伏好几次，但问题回到原点，哲学上的思考很早就有了，不是新鲜东西。我们不断演进的是用什么路径、方法去接近当初定义的最高目标。

AI应用的边界

方三文：大模型具体是什么东西？

张鹏：首先“模型”大家可能容易理解，是一种算法的载体。传统机器学习里也有模型，不稀奇。关键是前面加了“大”字。为什么叫大模型？回到深度神经网络，你可以想象它是一个非常大的计算矩阵，矩阵里每个元素是一个参数，输入数据经过矩阵乘加得到结果。中间这个矩阵就是模型核心。大模型的矩阵规模非常大，体现在参数量非常大。传统感知机可能只有两三个参数，大模型可能有几千万、几亿、几十亿、上千亿参数，所以叫大模型。

方三文：业余人士也大概知道大模型有分类：一种通用大模型，类似ChatGPT、Grok、Gemini、智谱GLM；还有一些在特定领域的特定场景模型。是不是可以分成这两大类？

张鹏： ChatGPT火起来后国内争论过，有没有通用模型和专业/垂直模型这个分类？我们回到第一性原理，为什么要分这两类？原因是什么？我们是通用模型派。当时有人说通用模型拿通用数据训练，参数量大成本高，但不能解决专业问题。另一派说训练参数量小点的，用专用数据训练，解决专业问题。这叫垂直或专业模型。但后来发现有个悖论：如果你能拿到专业数据，为什么不把它加到通用模型里训练？它是不是也能解决专业问题？为什么要单独弄专业模型？第二个问题，专业小模型用少量数据训练，能力就一定会比通用模型强吗？通用模型加专业数据后能力超过专业模型。所以专业模型存在的两个根本起点塌了，从实践中大家看到这是个伪命题。

方三文：那导向一个可怕结论：所有大模型公司都在通用大模型业务模式下竞争。最后竞争格局会是怎样？会始终存在很多通用大模型，还是会越来越少？

张鹏：收敛是肯定的。首先做这个事情成本挺高，算力、数据、人力需求非常高。如果大家都从零开始做，是资源重复投入。从资源最优化角度，一定会收敛到头部那几家，其他家做别的事。这是大势。现在越来越细分，不一定是应用，还有模型的基础设施、平台、具体细分场景的应用、服务等，形成大的生态。但大模型本身的参与门槛不是一般公司能参与的。

方三文：世界上通用大模型主要玩家大概四五家，主要在中美两国，欧洲有Mistral。你觉得会不会最后只剩一家？

张鹏：我直觉上认为不会只剩一家。因为技术发展需要多样性，尤其在早中期，技术革新可能性多，研究方向多，大家会有差异，各自有生存空间。加上市场很大，蓬勃发展，空间足够大，不会快速收敛。早中期会有多样化生态，不会因为一家取得优势就一家通吃。只剩下一家的情况只会出现在技术相对稳定的状态，技术革新不快速时，会有马太效应。现在阶段暂时不会出现一家通吃，目前也看不到一家通吃的前景。

方三文：造成各家大模型差异的主要是算力、数据还是算法？

张鹏：我觉得都有。算力是资源投入，能获取什么样的算力、多大量、什么成本，决定了后续投入效率、速度、创新比例。数据也一样，能获取什么样的高质量数据，在细分方面就有优势。算法更根本，谁算法创新更快更持续，行业排位就更靠前。

方三文：有人认为，对普通人来说AI除了方便信息获取整理，没引起生活太大变化。你认为这个变化会不会发生？

张鹏：它一定会发生，而且正在发生。日常办公、工作、生活场景中，AI已经能帮我们做很多事。我不太喜欢逛商场，很多事情希望AI帮我一键做完。我们发布AutoGLM产品就是这个目的。手机上有电商平台，我要买东西，可能有个想法，让AI帮我挑几样东西扔到购物篮，要求挑最便宜或性价比最好的，我只要最后确认付款。类似这样的事已经在生活中慢慢发生。

方三文：能否举一些AI已经改变行业的案例？

张鹏：有些大家看不到的地方，比如工业界、医药行业。原来发明一款药周期非常长，要筛选很多化合物，做实验，成本高。现在可以用AI帮助药物设计，筛选分子。比如蛋白质结构要找小分子契合，大量筛选工作通过AI做。还有AlphaFold，人体内蛋白质结构原来靠实验一点点拼凑，现在AlphaFold可以根据历史数据快速预测，用计算方法找出候选方案，再实验确定。这些领域发生很大变化，最终会给普通人带来很大变化，以后药可能没那么贵。

方三文：医生环节，AI有帮助或替代作用吗？

张鹏：肯定有。国内外都有。国外有大量研究文献、临床数据，用AI分析研判，帮助医生解决疑难杂症，或给医学研究提供知识支持。国内也有医疗机构和商业化公司在做类似产品，帮助基层医生提供知识辅助、培训等。

方三文：辅助驾驶或自动驾驶是不是AI的应用方向？

张鹏：自动驾驶做了十几年，替代人驾驶有可能做到，但跟AGI类似，首先得定义我们希望达到的完全自动驾驶的本质是什么，要解决什么问题。描绘清楚才知道现有方法能做到什么程度，缺陷是什么，下一步方法是什么。取决于定义。只能不断逼近已知认知的部分，从行为学定义上越来越像它。但本质没拆解开，不知道智能怎么形成的，所以没法确保100%做到。

方三文：如果一个东西是模仿游戏，它就是不断接近？

张鹏：对，不断逼近。

方三文：如果完全破解了它，知道演绎过程，就可以无限制复制？

张鹏：就是黑盒、白盒的区别。AI演化过程，第一、二代都是白盒，但发现白盒走得很累。到第三代深度学习出现，慢慢向黑盒转换，因为白盒解决问题太多不知道怎么弄。有人说不用管里面原理，人的大脑也是黑盒，用黑盒对黑盒，从输入输出结果看，效果出奇的好，大家就转到端到端。

方三文：黑盒虽然无限接近，但要说它能无限制准确复制不一定？

张鹏：有两个事情。第一，如果把黑盒模型无限接近人，那它是可复制的，就是一坨数据，复制就好。但不可复制的是你没办法把它拆解开，说它为什么能做到，它某部分能力能不能单独拆出来，用白盒方式复现。所以问题分两面。

方三文：人和AI到底是什么关系？很多人说AI越能干，我失业了。你怎么看？

张鹏：挺复杂的，这是所有人都要面对的问题。这一代AI跟之前不一样，它终于有能力跟人平等对话，知识水平可能超出一般人。这就带来很大问题，人只跟人打过交道，没跟AI打过交道，不知道怎么和谐相处。但我不觉得人类智能会停滞，人类适应和进化能力非常强。历史上技术变革、社会变革，都讨论过人类面临巨大危机，会被取代，但都挺过来了，过得越来越好。人本身也在进步进化。所以AI未必是绝对危机，可能刺激人类进化加速。

方三文：人这种生物或智能，跟计算机智能最大的区别可能是什么？

张鹏：我们曾把AGI路径分为L1到L5：知识学习压缩、推理、自我学习、初步意识、完整意识。现在大模型大概发展到自我学习这个中间阶段。差别在于后面两个阶段：人有自我意识，知道自己是我，AI目前显然做不到。

方三文：全球AI行业最大竞争体是美国和中国。你觉得它们在竞争什么？

张鹏：个人感觉是两种AI发展路径或思路的竞争。

方三文：美国思路是什么？中国思路是什么？

张鹏：美国在AI发展上求极致创新，追求高度，通过头部玩家、资本聚集，在小范围内大量投入，不断追求极限创新。中国不一样，中国很难像美国那样集中巨大资源在少数玩家砸出来。中国很多事情要求确定性和普惠。所以中国路径是稳扎稳打，首先技术创新要跟上，不能太落后；其次过程中追求现有成果不断转化成生产力、经济价值，改善生活。政策制定者强调AI+千行百业，AI赋能，改善民生经济。中国不是一味脱开，而是沿途下蛋，每个阶段结果在各行各业落地。这个过程效率驱动、ROI驱动，更强调成本效益收益核算。

方三文：跟过去很多行业一样，中国更侧重落地、应用、产业化、商业化，讲究用户体验和商业效率。之后很长一段时间AI竞争都会这样分工？

张鹏：可能会这样，至少我们国家还会这样做下去，历史文化决定的。美国头部公司在搞0到1，中国在搞10到100，更看重1到10和10到100，因为这毕竟是普惠的，更大范围的。

智谱的商业模式与护城河

方三文：智谱是AI落地、产业化、商业化的一个案例。简单说说智谱的商业模式？

张鹏：智谱思考得比较清晰。2020、2021年左右我们在琢磨这件事。技术不起源于我们，但我们追得很快。那时我们想这个技术怎么变成一门生意，商业化路径是什么。我们提出MaaS，Model as a Service，把模型本身变成一种服务，让大家能理解、使用，嵌入到产品、系统、生活中。这就是我们的商业模式。

方三文：这个模式是创立时定的还是慢慢摸索的？

张鹏：慢慢摸索的。2019年公司成立早期做学术运用，探索一些服务。后来有一个体外独立团队探索MaaS商业化，服务更多类型客户。到一定阶段，我们认为模式是正确的，就合并进来一起做。现在做得很大，增长很好，也证明了这种模式是当下大模型商业化比较靠谱的路径。

方三文：现在这种模式是阶段性最优解，还是长期稳定形态？

张鹏：目前MaaS模式在相当长一段时间会比较稳定，但绝不是终局。终局变数多，有待验证。大模型未来有个确定性方向是越来越向基础设施演进，像水电燃气，成为社会运转所需的智能基础设施。基础设施必须标准化、便宜、易于获取的。MaaS符合这种形态。另一个方向是模型作为基础设施以外，从应用角度会有不同形态，加上硬件，在手机或终端里，形成不同产品。就像电和电器，两端都有大市场前景。

方三文：一边是基础大模型，一边是基于大模型的应用。你们比较确定做后面这个？

张鹏：也不是后面，两件事同时做。更主要的是MaaS这个基础模型部分。上面的应用我们也有一些。

方三文：请举一个具体例子，你们为你们的客户MaaS提供什么服务，解决什么问题？

张鹏：挺多例子。主要客户像中国前十互联网公司，九个是我们的客户。有一个客户，去年发生国际事件，某海外社交平台大批用户迁移到国内一个社交平台，但语言不通，外国人看不懂中文，国内用户看不懂外文。我们就用模型辅助解决大量内容翻译工作。第二个例子，我们跟三星合作，把模型能力植入手机终端，在端侧可以用，解决数据隐私问题，聊天记录、图片不用传到云上，本地可搜索、编辑。这些都是解决现实世界的问题。

方三文：你觉得AI应用市场规模多大？

张鹏：Gartner预计在万亿美金级别，有报告说到2033年全球AI市场规模4.8万亿美金。国内至少万亿以上。

方三文：你们目前业务主要竞争对手是什么人？

张鹏：我们是独立通用大模型厂商，这类玩家国内不多。但大厂也在做同样的事，做基础模型和AI相关业务，他们是我们的友商、竞争对手、合作伙伴。

方三文：相对这些竞争对手，你们公司长期持续的优势是什么？

张鹏：我们足够聚焦。第一，对AI的认知从第一天就领先市场平均水平。第二，我们把自己定位成通用大模型厂商，目标AGI，其他事可以选择不做，聚焦在这。这是最大优势。依靠这种定位和专注，在技术创新、产品迭代上创造市场，创造更多商业化机会。通用模型能力不是虚的，不同阶段有切实的落地。最近我们聚焦在编程能力上，这是个通用能力，聚焦后产生的技术、产品、商业化价值很大。来源于我们对这事认知够早、够准，技术能力能达到最顶尖水平。

方三文：优势在模型本身还是落地应用？

张鹏：这两件事分不开。这次AI革命，从算法研究到工程实现、产品化、应用反馈整个闭环压缩得非常紧密。不像以前实验室发论文，几年后才做成Demo、产品、迭代。大模型这波从算法创新到类似ChatGPT上线只用了五年，用户一下过几亿。时间周期和闭环压缩得很厉害。你说把算法研究到顶尖再考虑交付，做不到。这是一体化的。我们一边研究一边输出，让大家用反馈，往好用方向加深。

方三文：通用大模型厂商会越来越少，但把大模型能力放到具体企业应用场景的玩家会不会越来越多？

张鹏：把模型能力变成客户需求、产品特性，最后这一公里。这个肯定会越来越多，因为市场需求大。这就是生态趋势。

方三文：如果很多玩家进来，会不会把市场利润率玩得很低？比如图像识别能力应用到不同场景，很多厂商做，利润率很低。

张鹏：那种情况是在技术接近天花板时发生，比如人脸识别到97%、98%，再往上没意义，技术稳定，大家蜂拥而上压成本，导致价格越来越低。但大模型还在技术快速增长阶段，技术溢价高，创新活跃，不太会出现低价竞争模式。我们要做的就是在曲线增长阶段保持技术创新领先，用创新速度创造市场空间，获得创新的技术溢价。

方三文：研发投入主要目的是在大模型方面保持持续领先优势，还是在产品化、商业化方面有更好体验和效率？

张鹏：一定是前者。基础模型能力上限是我们的根本，所有商业化都基于这一点。

方三文：这个行业有国际国内巨头，你要保持优势难不难？

张鹏：有挑战，但正是有挑战，团队觉得必须去做，必须做成。我们有这个自信和信心。

方三文：大厂可投入资金比你大得多，算力方面很难有优势；数据方面，大厂有存量互联网内容优势。你们是否是在算法方面有优势？

张鹏：三要素不是分裂看的。算力投入我们跟大厂没法比，人家投得起。数据方面，我也不觉得他们能把那些数据无偿合法地拿来做训练，这中间涉及法律问题。算法、研发能力是我们的强项。三要素单独看有胜有劣，但怎么粘合起来产生化学反应，考验团队能力。还有更本质的是对AGI、AI第一性原理的理解和认知程度。举个例子，某个大厂也是比较早就开始做大模型，做了一段时间之后，它们内部也不是无限制投入，投入完之后被问怎么商业化，团队被逼商业化，结果失败了，团队被替换。大厂投入也不是无上限，有考核要求。所以不用过于夸大所谓大厂的能力。

方三文：听起来是需要勇气才能参与的市场竞争。你是有勇气的人？

张鹏：我们这个团队很有勇气。

方三文：你们商业模式建立在B端市场，你们C端市场是做什么的？

张鹏：我们很早思考过这个问题。为什么要把B和C分开？分的原理是什么？没人能讲明白。很多人从商业层面说ToB/ToC的产品形态、付费模式不一样。但从产品和技术层面来看，回归第一性原理，这两者没有差别。因为不管服务企业还是互联网客户，最终都是服务人。只有人认可价值，利用技术和产品获得价值增益，才愿意付费。只是B端和C端付费逻辑、决策逻辑不同。但AI是生产力级别的，付费取决于生产力转换的价值增益。没有这个就不会付费。所以C端不是我们现在的重点。就像电，为电付费，个人或企业有什么差别？没差别，都是因为用了有价值。

方三文：目前商业化主要在B端，是吗？

张鹏：未来很多事情都是不确定性的，所以为什么我一直在说，现在这个时代最大的挑战来源于人。人对于新鲜事物的线性外推，只能基于过去认知预测未来，永远预测不到认知之外的东西。很多问题根源在此。智谱应该坚持AGI理想往前走，当市场需要什么类型时它就是什么类型。我们认为在这个阶段这种模式是好的，对我们来讲是合适的。我们就会沿着这个路去走。太远的我们预测不了，也没必要给自己设限。

发表评论取消回复

2人参与，4条评论

轩辕御龙录
2026-03-09 21:19:42回复
，也证明了这种模式是当下大模型商业化比较靠谱的路径。方三文：现在这种模式是阶段性最优解，还是长期稳定形态？张鹏：目前MaaS模式在相当长一段时间会比较稳定，但绝不是终局。终局变数多，有待验证。大模型未来有个确定性方向是越来越向基础设施演进，像水电燃气，成为社会运转所

飘渺踏歌行
2026-03-09 18:10:48回复
法论，可以把人类规则用if/else方式写下来交给机器用。但这种方式到一定规模后，知识能不能穷举？比如医疗领域所有病症和治疗方案能不能穷举？把所有知识写出来，可能是天文数字。

少年侠客
2026-03-09 18:56:58回复
分，从行为学定义上越来越像它。但本质没拆解开，不知道智能怎么形成的，所以没法确保100%做到。方三文：如果一个东西是模仿游戏，它就是不断接近？张鹏：对，不断逼近。方三文：如果完全破解了它，知道演绎过程，就可以无限制复制？张鹏：就是黑盒、白盒的区别。AI演化过程，第一、二代都是白盒，但