1 月 8 日,“大模型第一股”智谱(HK02513)正式在港交所上市,开盘后股价一度“破发”,随后震荡走高,截至发稿,智谱报125.7港元/股,涨8.06%,对应市值超550亿港元。

  《每日经济新闻》记者获悉,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。

  唐杰在内部信中表示,DeepSeek的出现警醒了自己,“(梁)文锋在2023年创业的时候和我聊过,当时我并没有意识到他对AGI如此执着,感谢他带给我很多不一样的思考”。他还回望道,这两年经历了很多,更重要的是“强化学习”了对 AGI、对公司治理和商业竞争的认知。

  唐杰认为,真正决定下一阶段大模型格局的,不是应用数量或短期商业热度,而是更底层的模型架构与学习范式。在对行业趋势的判断上,唐杰认为,已经广泛使用近10年的Transformer架构已经显露出一些不足,包括超长上下文的计算开销、记忆机制、更新机制等。这些都需要探索全新的模型架构,通过芯片—算法协同设计等技术提高计算效率。唐杰判断,应用侧的真正爆发,将出现在AI能够稳定替代不同工种和复杂任务之时。

  ———以下为唐杰内部信节选———

“大模型第一股”智谱上市首日震荡走高  创立发起人唐杰:应用侧的真正爆发将出现在这一时刻 第1张

  “”

“大模型第一股”智谱上市首日震荡走高  创立发起人唐杰:应用侧的真正爆发将出现在这一时刻 第2张