导语
在人工智能技术快速迭代、大模型成为产业焦点的背景下,全球AI竞争格局逐渐清晰,技术多样性与商业化落地成为行业的核心议题。在这一背景下,中国大模型企业的技术选择、组织路径与长期判断,逐渐成为观察全球AI竞争格局的重要样本。
在雪球出品的投资类专业对话栏目《方略》第三季第二期中,雪球创始人、董事长方三文对话智谱CEO张鹏,围绕AI发展历程、AI应用的边界、智谱商业模式等核心话题展开。张鹏表示,模型体系的多样性是技术持续进步的重要动力。以下是对话精选:

大众对AI的问题没有超越图灵九问
方三文:什么是AI?
张鹏:AI是一个缩写,它叫做Artificial Intelligence,直译过来就是人工智能。最简单直白的一个描述就是,用技术的方法,不管是计算机还是其他的方法,去模拟人类的智能,进而来服务人。
方三文:图灵在1950年的论文《计算机器与智能》里面提出了智能这个概念,后来在达特茅斯会议里面直接定义了人工智能。我们今天谈论的AI,和图灵说的智能或者是1956年提出的人工智能之间有什么关系?
张鹏:如果按照逻辑学或数学的概念来描述,智能是更大的一个圈,人工智能是智能当中的一部分,就是我们怎么去模拟人类的智能。所以现在我们说的AI或者人工智能,其实就是1956年达特茅斯会议上提出来的那个定义。但是,随着时间不断演进,技术和市场的变化,AI的内涵在不断变化。现在的人工智能包含的事情比当年范围更广,但核心目标没变。
方三文:大模型和AI,是一回事吗?
张鹏:大模型只是我们实现人工智能的技术方法中的一种。
方三文:从1950年代到现在,AI发展经历了什么重要的节点?
张鹏:从1950年代到现在大概70多年,不到80年。这几十年来,AI的发展并不是一帆风顺的。大家公认的有三次人工智能浪潮,或者严格划分也可以说现在是第四次。为什么会起起落落?我觉得这也是一个历史的必然规律。一件事情的发展不会永远是增长的曲线,过程中会碰到各种挑战、困难,结合当时的社会经济情况,会有起伏,都很正常。
方三文:1958年提出的感知机是什么?
张鹏:感知机是一个数学上的方法,简单理解就是尝试在数据的空间中找到所谓的“超平面”,把这个空间一分为二,平面的一侧是我们想要的结果,另一侧是不想要的,这其实是个分类问题。感知机就是找到这个“超平面”的一种方法,通过机器设定一个模型,让它通过数据迭代的方式准确定位超平面。它对AI的作用是奠定了一个基础,通过机器学习,让机器从数据中学习的方法去解决具体问题。就像人通过学习解决问题,不断实践,通过数据反馈来迭代求解,而不是设定一个公式算一遍就结束。这个和现在的大模型、深度学习的思想完全一致。可以说它是机器学习的源头、鼻祖。
方三文:1966年MIT开发了第一个真正意义上的聊天机器人,叫Eliza。你看现在大家特别热衷的ChatGPT,都在聊天。为什么人工智能跟聊天有这么密切的关系?
张鹏:我觉得最重要的还是回归到人工智能的本质目标,就是用机器或技术的方法实现类人的智能。但你如何确定你做出来的东西具备类人的智能?它需要一个检验方式。对于人来说最自然的检验方式就是聊天,看我能不能识别出你是不是个人。所以从最开始的出发点,就影响到后续很多工作。
方三文:1973年出了一个莱特希尔报告,提出AI的局限性,导致AI投资下降。当时AI局限性主要指什么?
张鹏:莱特希尔报告里举出的AI局限性有几个方面。首先最明显的是当时整个AI研究界乐观情绪占上风,在那个年代就喊出口号说未来20年要实现通用人工智能。大家的理想很好,目标远大,但路径中困难太大。那时计算机的计算能力很差。第二,当时对数据也没有很好的整理。第三,早期的人工智能方法基本上都基于符号学派,它能解决的问题非常局限,比如数学物理这种能用完备符号系统表达的,稍微扩大到知识、常识就不行了。所以导致大家重新冷静审视AI的投入,引起第一次AI寒冬。
方三文:是不是任何科学的终极目标或愿望,和现在可用的资源、路径总是存在着较大差距?
张鹏:这是一个行业或技术往前发展的源动力。就像物理化学里的渗透压,两边浓度不同会产生渗透动力,来自于不均衡。当你远大目标和当下拥有的资源、技术能达到的效果之间有差距时,这个差距会刺激大家不断研究、找到新方法、投入新资源。这很正常,只是看差距有多大。
方三文:这个渗透压达成的平衡是不是一个相对动态的平衡?
张鹏:是,肯定是动态平衡。就像AI的发展起起落落,为什么第一次寒冬后会有第二波?因为大家重新看到了动态平衡的可能性,有新资源加入,渗透压变化,好像能克服或利用这个差距,于是投入新方法、新资源去做。所以它永远是动态变化的。
方三文:1981年产生了第一台带GPU的电脑。GPU是什么?它今天很热,跟AI是什么关系?
张鹏:GPU跟CPU相对。CPU是计算机的核心处理单元,中央处理器。GPU叫图形处理器,当时专门设计出来帮CPU分担图形处理能力。GPU和AI的关系挺有意思。因为它做图像处理时更偏重浮点计算,CPU偏重整数计算。GPU专门加强了浮点数计算的能力。这一点恰恰跟AI或科学计算类似,科学计算里有大量浮点计算。有些科学家就说,能不能用硬件加速的方法来加速科学计算的算法程序?英伟达敏锐捕捉到这点,黄仁勋当时给很多科学家送GPU卡,唯一要求是把算法在上面跑,收集效果来宣传。
方三文:1980年代末1990年代初,AI又进入第二次寒冬。这个中间发生了什么?和第一次有什么区别?
张鹏:第二次AI起来是因为大家找到了一个新方法――专家系统。在第一代感知机等方法基础上,通过结构化知识表示,让计算机具备像专家一样的专业知识来解答问题。这是第二代人工智能成功的点。但到一定程度后发现,虽然理论上比第一代好,有完备方法论,可以把人类规则用if/else方式写下来交给机器用。但这种方式到一定规模后,知识能不能穷举?比如医疗领域所有病症和治疗方案能不能穷举?把所有知识写出来,可能是天文数字。这是实现成本和周期的问题。第二,虽然计算能力增加了,但巨大量的专家知识输入后,计算量是指数级爆炸增长,仍然不能满足需求。水位永远是动态的,看到计算能力提升投入新方法,加了很多东西后计算能力又不够了。所以是动态互相促进的过程。
方三文:1997年深蓝击败国际象棋世界冠军,有什么意义?
张鹏:这是非常标志性的事件。大家会觉得聊天简单,下棋比聊天复杂,智能水平高很多。如果机器在下棋上胜过人类,说明智力水平到一定程度了。深蓝战胜卡斯帕罗夫的意义就在这。
方三文:后来过了将近20年,2016年AlphaGo击败李世石。AlphaGo和深蓝在技术上不同?
张鹏:实现路径上不一样。深蓝主要是搜索式的方法,在已知棋谱或当前棋盘状态中搜索下一步,可能往前搜索几步,用蒙特卡洛树搜索剪枝,不搜索所有空间,只搜索一部分,预测有限步数,在有限时间内找到最接近最好的解法。AlphaGo也沿着这个路径,但实现方式不同,用了神经网络,用大量数据训练来逼近搜索和预测算法。目标都是搜索空间预测最好方法,但预测方式不同。可以理解为AlphaGo是端到端的方法,深蓝更多是基于规则、一环套一环的工作流水线。
方三文:简单说说深度学习是什么?
张鹏:深度学习指有比较深的算法层次。比如一层神经元或基本计算单元,能解决非常简单的问题。复杂问题就叠很多层,一层一层往上叠,层数越多能模拟的情况越多,计算越复杂。
方三文:就是函数套函数?
张鹏:对,一层套一层,不断垒起来。
方三文:从终端角度看,1995年前后PC普及,2000年前后互联网普及,把机器和数据连起来。这对深度学习发展有关系吗?
张鹏:深度学习需要非常大的计算能力。刚才讲GPU就是因为它浮点计算能力强,所以火起来。计算设备能力的提升是深度学习快速发展的前提条件,算力相当于发动机,越强大输出马力越大。数据相当于燃料,要有优良、大量的燃料才能让发动机跑更长时间,输出更大功率。PC和互联网提供了大量数据。
方三文:Google 2016年发表了Transformer论文,论文发表后短时间内OpenAI发布了ChatGPT,这两个事情有联系吗?
张鹏:肯定有联系。OpenAI真正转做大模型就在这篇论文发布之后。OpenAI 2015年成立,到2018年左右一直不是走这条路,而是走强化学习路线。Transformer论文后不久,2018年开始,以伊利亚为首的科学家果断转向,基于它做GPT相关研究。
方三文:第一个版本ChatGPT出来时你关注了吗?
张鹏:分两个阶段。2018年他们开始做GPT,没引起太大关注,效果不太好。从GPT-2开始有一定关注,学界有讨论,褒贬不一,有人说它只是大力出奇迹,不是算法革新,也有人说是好范式。那时关注到讨论,在国外比较多,国内相对少。得益清华环境,接触国外学术圈方便。真正让大家觉得很牛是2020年GPT-3发布。从GPT-3发布我们就关注到,并且认知到它可能就是未来的范式变化转折点。
方三文:为什么做出这种判断?当时出现什么现象或重要突破?
张鹏:之前我们用传统机器学习方法做NLP任务,包括对话、QA等,一直没做到让人满意。传统NLP方法需要很长算法流水线处理句子,找到结构、名词、动词,理解句子。但GPT出现后,发现不用这么做,只要把句子扔进去,它就能答,而且答得很好。这就是端到端解决,不需要复杂拆解。效果很多时候碾压传统流水线方法。所以大家看到这个方法有优势,觉得这可能就是下个阶段的技术范式。
方三文:DeepSeek-R1的发布,好像颠覆了大家认知。你认为从原理和效果上它有什么突破?
张鹏:DeepSeek引起行业内重大关注,但它还是沿着这条路走,没有像GPT相对于传统机器学习有那样迥异的方法论。它不是方法论级别的,更多是在怎么降低成本、怎么把工程优化,把原来“力大砖飞”简单堆参数量或数据量的逻辑拉回来,告诉大家不用堆那么多,可以在算法上优化,把成本压下来,效果同时提升。更重要的原因是,它在那个时间点用开源方式把技术全部交给社区、研究界、工业界,让大家无偿免费使用最新技术,对当时的市场冲击很大。
方三文:AI发展涉及算力、数据、算法。现在这三个因素哪个最卡住AI发展?哪个突破可能带来进一步发展?
张鹏:不同时间段认知不一样。最早大家觉得算法重要,可以直达AGI。过一段时间模型参数量大,又觉得互联网上能拿到的数据不够了,担心数据用尽、预训练撞墙。然后大家琢磨解决数据问题,到现在数据问题也能解决掉,又担心算力不够。后来技术进步,英伟达拼命生产,算力也能搞到。大家又会觉得算法本身有问题,效率不高,灾难性遗忘等问题解不了,很多人预测Transformer也要被革新。所以它是个动态循环、螺旋式上升的过程。
方三文:你觉得AGI是抽象目标还是具体目标?是最终可以实现还是只能无限接近?
张鹏:AGI定义不像AI那么清晰,它的内涵外延从没有非常明确权威的定义。但AGI能不能实现?只要我们能把这个目标定义好,不太离谱的定义,大概率能实现,时间长短问题。智谱从成立第一天目标就是AGI,我们有自己定义。
方三文:对普罗大众来说,AGI是不是有点像科学中的终极真理,不容易具体化?
张鹏:终极真理很难描绘,因为谁也不知道。但科学界有多种方法描绘,比如图灵测试用行为学定义智能。AGI很多时候大家也用行为学定义,比如有一派说,AI取得人各项能力的平均水平就叫AGI。有了行为定义,倒推技术要做到哪些事情,匹配人的水平。所以跟定义方式有关,实现路径参照这个一步步走上去。
方三文:今天大众对AI争论,有没有超出图灵提出的那九个反问?
张鹏:基本上没有超出那个范围。AI行业70多年,起起伏伏好几次,但问题回到原点,哲学上的思考很早就有了,不是新鲜东西。我们不断演进的是用什么路径、方法去接近当初定义的最高目标。
AI应用的边界
方三文:大模型具体是什么东西?
张鹏:首先“模型”大家可能容易理解,是一种算法的载体。传统机器学习里也有模型,不稀奇。关键是前面加了“大”字。为什么叫大模型?回到深度神经网络,你可以想象它是一个非常大的计算矩阵,矩阵里每个元素是一个参数,输入数据经过矩阵乘加得到结果。中间这个矩阵就是模型核心。大模型的矩阵规模非常大,体现在参数量非常大。传统感知机可能只有两三个参数,大模型可能有几千万、几亿、几十亿、上千亿参数,所以叫大模型。
方三文: 业余人士也大概知道大模型有分类:一种通用大模型,类似ChatGPT、Grok、Gemini、智谱GLM;还有一些在特定领域的特定场景模型。是不是可以分成这两大类?
张鹏: ChatGPT火起来后国内争论过,有没有通用模型和专业/垂直模型这个分类?我们回到第一性原理,为什么要分这两类?原因是什么?我们是通用模型派。当时有人说通用模型拿通用数据训练,参数量大成本高,但不能解决专业问题。另一派说训练参数量小点的,用专用数据训练,解决专业问题。这叫垂直或专业模型。但后来发现有个悖论:如果你能拿到专业数据,为什么不把它加到通用模型里训练?它是不是也能解决专业问题?为什么要单独弄专业模型?第二个问题,专业小模型用少量数据训练,能力就一定会比通用模型强吗?通用模型加专业数据后能力超过专业模型。所以专业模型存在的两个根本起点塌了,从实践中大家看到这是个伪命题。
方三文:那导向一个可怕结论:所有大模型公司都在通用大模型业务模式下竞争。最后竞争格局会是怎样?会始终存在很多通用大模型,还是会越来越少?
张鹏:收敛是肯定的。首先做这个事情成本挺高,算力、数据、人力需求非常高。如果大家都从零开始做,是资源重复投入。从资源最优化角度,一定会收敛到头部那几家,其他家做别的事。这是大势。现在越来越细分,不一定是应用,还有模型的基础设施、平台、具体细分场景的应用、服务等,形成大的生态。但大模型本身的参与门槛不是一般公司能参与的。
方三文:世界上通用大模型主要玩家大概四五家,主要在中美两国,欧洲有Mistral。你觉得会不会最后只剩一家?
张鹏:我直觉上认为不会只剩一家。因为技术发展需要多样性,尤其在早中期,技术革新可能性多,研究方向多,大家会有差异,各自有生存空间。加上市场很大,蓬勃发展,空间足够大,不会快速收敛。早中期会有多样化生态,不会因为一家取得优势就一家通吃。只剩下一家的情况只会出现在技术相对稳定的状态,技术革新不快速时,会有马太效应。现在阶段暂时不会出现一家通吃,目前也看不到一家通吃的前景。
方三文:造成各家大模型差异的主要是算力、数据还是算法?
张鹏:我觉得都有。算力是资源投入,能获取什么样的算力、多大量、什么成本,决定了后续投入效率、速度、创新比例。数据也一样,能获取什么样的高质量数据,在细分方面就有优势。算法更根本,谁算法创新更快更持续,行业排位就更靠前。
方三文:有人认为,对普通人来说AI除了方便信息获取整理,没引起生活太大变化。你认为这个变化会不会发生?
张鹏:它一定会发生,而且正在发生。日常办公、工作、生活场景中,AI已经能帮我们做很多事。我不太喜欢逛商场,很多事情希望AI帮我一键做完。我们发布AutoGLM产品就是这个目的。手机上有电商平台,我要买东西,可能有个想法,让AI帮我挑几样东西扔到购物篮,要求挑最便宜或性价比最好的,我只要最后确认付款。类似这样的事已经在生活中慢慢发生。
方三文:能否举一些AI已经改变行业的案例?
张鹏:有些大家看不到的地方,比如工业界、医药行业。原来发明一款药周期非常长,要筛选很多化合物,做实验,成本高。现在可以用AI帮助药物设计,筛选分子。比如蛋白质结构要找小分子契合,大量筛选工作通过AI做。还有AlphaFold,人体内蛋白质结构原来靠实验一点点拼凑,现在AlphaFold可以根据历史数据快速预测,用计算方法找出候选方案,再实验确定。这些领域发生很大变化,最终会给普通人带来很大变化,以后药可能没那么贵。
方三文:医生环节,AI有帮助或替代作用吗?
张鹏:肯定有。国内外都有。国外有大量研究文献、临床数据,用AI分析研判,帮助医生解决疑难杂症,或给医学研究提供知识支持。国内也有医疗机构和商业化公司在做类似产品,帮助基层医生提供知识辅助、培训等。
方三文:辅助驾驶或自动驾驶是不是AI的应用方向?
张鹏:自动驾驶做了十几年,替代人驾驶有可能做到,但跟AGI类似,首先得定义我们希望达到的完全自动驾驶的本质是什么,要解决什么问题。描绘清楚才知道现有方法能做到什么程度,缺陷是什么,下一步方法是什么。取决于定义。只能不断逼近已知认知的部分,从行为学定义上越来越像它。但本质没拆解开,不知道智能怎么形成的,所以没法确保100%做到。
方三文:如果一个东西是模仿游戏,它就是不断接近?
张鹏: 对,不断逼近。
方三文:如果完全破解了它,知道演绎过程,就可以无限制复制?
张鹏:就是黑盒、白盒的区别。AI演化过程,第一、二代都是白盒,但发现白盒走得很累。到第三代深度学习出现,慢慢向黑盒转换,因为白盒解决问题太多不知道怎么弄。有人说不用管里面原理,人的大脑也是黑盒,用黑盒对黑盒,从输入输出结果看,效果出奇的好,大家就转到端到端。
方三文:黑盒虽然无限接近,但要说它能无限制准确复制不一定?
张鹏:有两个事情。第一,如果把黑盒模型无限接近人,那它是可复制的,就是一坨数据,复制就好。但不可复制的是你没办法把它拆解开,说它为什么能做到,它某部分能力能不能单独拆出来,用白盒方式复现。所以问题分两面。
方三文:人和AI到底是什么关系?很多人说AI越能干,我失业了。你怎么看?
张鹏:挺复杂的,这是所有人都要面对的问题。这一代AI跟之前不一样,它终于有能力跟人平等对话,知识水平可能超出一般人。这就带来很大问题,人只跟人打过交道,没跟AI打过交道,不知道怎么和谐相处。 但我不觉得人类智能会停滞,人类适应和进化能力非常强。历史上技术变革、社会变革,都讨论过人类面临巨大危机,会被取代,但都挺过来了,过得越来越好。人本身也在进步进化。所以AI未必是绝对危机,可能刺激人类进化加速。
方三文:人这种生物或智能,跟计算机智能最大的区别可能是什么?
张鹏:我们曾把AGI路径分为L1到L5:知识学习压缩、推理、自我学习、初步意识、完整意识。现在大模型大概发展到自我学习这个中间阶段。差别在于后面两个阶段:人有自我意识,知道自己是我,AI目前显然做不到。
方三文:全球AI行业最大竞争体是美国和中国。你觉得它们在竞争什么?
张鹏:个人感觉是两种AI发展路径或思路的竞争。
方三文:美国思路是什么?中国思路是什么?
张鹏:美国在AI发展上求极致创新,追求高度,通过头部玩家、资本聚集,在小范围内大量投入,不断追求极限创新。中国不一样,中国很难像美国那样集中巨大资源在少数玩家砸出来。中国很多事情要求确定性和普惠。所以中国路径是稳扎稳打,首先技术创新要跟上,不能太落后;其次过程中追求现有成果不断转化成生产力、经济价值,改善生活。政策制定者强调AI+千行百业,AI赋能,改善民生经济。中国不是一味脱开,而是沿途下蛋,每个阶段结果在各行各业落地。这个过程效率驱动、ROI驱动,更强调成本效益收益核算。
方三文:跟过去很多行业一样,中国更侧重落地、应用、产业化、商业化,讲究用户体验和商业效率。之后很长一段时间AI竞争都会这样分工?
张鹏:可能会这样,至少我们国家还会这样做下去,历史文化决定的。美国头部公司在搞0到1,中国在搞10到100,更看重1到10和10到100,因为这毕竟是普惠的,更大范围的。
智谱的商业模式与护城河
方三文:智谱是AI落地、产业化、商业化的一个案例。简单说说智谱的商业模式?
张鹏:智谱思考得比较清晰。2020、2021年左右我们在琢磨这件事。技术不起源于我们,但我们追得很快。那时我们想这个技术怎么变成一门生意,商业化路径是什么。我们提出MaaS,Model as a Service,把模型本身变成一种服务,让大家能理解、使用,嵌入到产品、系统、生活中。这就是我们的商业模式。
方三文:这个模式是创立时定的还是慢慢摸索的?
张鹏:慢慢摸索的。2019年公司成立早期做学术运用,探索一些服务。后来有一个体外独立团队探索MaaS商业化,服务更多类型客户。到一定阶段,我们认为模式是正确的,就合并进来一起做。现在做得很大,增长很好,也证明了这种模式是当下大模型商业化比较靠谱的路径。
方三文:现在这种模式是阶段性最优解,还是长期稳定形态?
张鹏:目前MaaS模式在相当长一段时间会比较稳定,但绝不是终局。终局变数多,有待验证。大模型未来有个确定性方向是越来越向基础设施演进,像水电燃气,成为社会运转所需的智能基础设施。基础设施必须标准化、便宜、易于获取的。MaaS符合这种形态。另一个方向是模型作为基础设施以外,从应用角度会有不同形态,加上硬件,在手机或终端里,形成不同产品。就像电和电器,两端都有大市场前景。
方三文:一边是基础大模型,一边是基于大模型的应用。你们比较确定做后面这个?
张鹏:也不是后面,两件事同时做。更主要的是MaaS这个基础模型部分。上面的应用我们也有一些。
方三文:请举一个具体例子,你们为你们的客户MaaS提供什么服务,解决什么问题?
张鹏:挺多例子。主要客户像中国前十互联网公司,九个是我们的客户。有一个客户,去年发生国际事件,某海外社交平台大批用户迁移到国内一个社交平台,但语言不通,外国人看不懂中文,国内用户看不懂外文。我们就用模型辅助解决大量内容翻译工作。第二个例子,我们跟三星合作,把模型能力植入手机终端,在端侧可以用,解决数据隐私问题,聊天记录、图片不用传到云上,本地可搜索、编辑。这些都是解决现实世界的问题。
方三文:你觉得AI应用市场规模多大?
张鹏:Gartner预计在万亿美金级别,有报告说到2033年全球AI市场规模4.8万亿美金。国内至少万亿以上。
方三文:你们目前业务主要竞争对手是什么人?
张鹏:我们是独立通用大模型厂商,这类玩家国内不多。但大厂也在做同样的事,做基础模型和AI相关业务,他们是我们的友商、竞争对手、合作伙伴。
方三文:相对这些竞争对手,你们公司长期持续的优势是什么?
张鹏:我们足够聚焦。第一,对AI的认知从第一天就领先市场平均水平。第二,我们把自己定位成通用大模型厂商,目标AGI,其他事可以选择不做,聚焦在这。这是最大优势。依靠这种定位和专注,在技术创新、产品迭代上创造市场,创造更多商业化机会。通用模型能力不是虚的,不同阶段有切实的落地。最近我们聚焦在编程能力上,这是个通用能力,聚焦后产生的技术、产品、商业化价值很大。来源于我们对这事认知够早、够准,技术能力能达到最顶尖水平。
方三文:优势在模型本身还是落地应用?
张鹏:这两件事分不开。这次AI革命,从算法研究到工程实现、产品化、应用反馈整个闭环压缩得非常紧密。不像以前实验室发论文,几年后才做成Demo、产品、迭代。大模型这波从算法创新到类似ChatGPT上线只用了五年,用户一下过几亿。时间周期和闭环压缩得很厉害。你说把算法研究到顶尖再考虑交付,做不到。这是一体化的。我们一边研究一边输出,让大家用反馈,往好用方向加深。
方三文:通用大模型厂商会越来越少,但把大模型能力放到具体企业应用场景的玩家会不会越来越多?
张鹏:把模型能力变成客户需求、产品特性,最后这一公里。这个肯定会越来越多,因为市场需求大。这就是生态趋势。
方三文:如果很多玩家进来,会不会把市场利润率玩得很低?比如图像识别能力应用到不同场景,很多厂商做,利润率很低。
张鹏:那种情况是在技术接近天花板时发生,比如人脸识别到97%、98%,再往上没意义,技术稳定,大家蜂拥而上压成本,导致价格越来越低。但大模型还在技术快速增长阶段,技术溢价高,创新活跃,不太会出现低价竞争模式。我们要做的就是在曲线增长阶段保持技术创新领先,用创新速度创造市场空间,获得创新的技术溢价。
方三文:研发投入主要目的是在大模型方面保持持续领先优势,还是在产品化、商业化方面有更好体验和效率?
张鹏:一定是前者。基础模型能力上限是我们的根本,所有商业化都基于这一点。
方三文:这个行业有国际国内巨头,你要保持优势难不难?
张鹏:有挑战,但正是有挑战,团队觉得必须去做,必须做成。我们有这个自信和信心。
方三文:大厂可投入资金比你大得多,算力方面很难有优势;数据方面,大厂有存量互联网内容优势。你们是否是在算法方面有优势?
张鹏:三要素不是分裂看的。算力投入我们跟大厂没法比,人家投得起。数据方面,我也不觉得他们能把那些数据无偿合法地拿来做训练,这中间涉及法律问题。算法、研发能力是我们的强项。三要素单独看有胜有劣,但怎么粘合起来产生化学反应,考验团队能力。还有更本质的是对AGI、AI第一性原理的理解和认知程度。举个例子,某个大厂也是比较早就开始做大模型,做了一段时间之后,它们内部也不是无限制投入,投入完之后被问怎么商业化,团队被逼商业化,结果失败了,团队被替换。大厂投入也不是无上限,有考核要求。所以不用过于夸大所谓大厂的能力。
方三文:听起来是需要勇气才能参与的市场竞争。你是有勇气的人?
张鹏:我们这个团队很有勇气。
方三文:你们商业模式建立在B端市场,你们C端市场是做什么的?
张鹏:我们很早思考过这个问题。为什么要把B和C分开?分的原理是什么?没人能讲明白。很多人从商业层面说ToB/ToC的产品形态、付费模式不一样。但从产品和技术层面来看,回归第一性原理,这两者没有差别。因为不管服务企业还是互联网客户,最终都是服务人。只有人认可价值,利用技术和产品获得价值增益,才愿意付费。只是B端和C端付费逻辑、决策逻辑不同。但AI是生产力级别的,付费取决于生产力转换的价值增益。没有这个就不会付费。所以C端不是我们现在的重点。就像电,为电付费,个人或企业有什么差别?没差别,都是因为用了有价值。
方三文:目前商业化主要在B端,是吗?
张鹏:未来很多事情都是不确定性的,所以为什么我一直在说,现在这个时代最大的挑战来源于人。人对于新鲜事物的线性外推,只能基于过去认知预测未来,永远预测不到认知之外的东西。很多问题根源在此。智谱应该坚持AGI理想往前走,当市场需要什么类型时它就是什么类型。我们认为在这个阶段这种模式是好的,对我们来讲是合适的。我们就会沿着这个路去走。太远的我们预测不了,也没必要给自己设限。



发表评论
2026-03-09 21:19:42回复
2026-03-09 18:10:48回复
2026-03-09 18:56:58回复
2026-03-09 15:43:04回复