
AI产业的迭代可谓日眉月异,2026年甫一开动,国产开源大模子就插足了“上新潮”。
1月14日,倾盆新闻记者获悉,最近上市的AI独角兽智谱(02513.HK)聚首华为开源新一代图像生成模子GLM-Image,模子基于昇腾Atlas 800T A2诞生和昇想MindSpore AI框架完成从数据到磨真金不怕火的全进程,是首个在国产芯片上完周详程磨真金不怕火的SOTA多模态模子。
据智谱方面先容,GLM-Image 领受自主转换的“自追思+扩散解码器”夹杂架构,达成图像生成与讲话模子的聚首,是智谱面向以Nano Banana Pro为代表的新一代“领略型生成”技巧范式的一次紧迫探索。
在架构特色方面,靠近传统模子在“和会复杂提醒”与“精确绘画笔墨”上难以兼顾的问题,GLM-Image引入“自追思+扩散解码器”夹杂架构,交融9B的自追思模子与7B的DiT扩散解码器。通过更变Tokenizer政策,GLM-Image大要自适应解决多种鉴识率,原生撑捏从1024x1024到2048×2048尺寸的大肆比例图像的生成任务,无需再行磨真金不怕火。
值得防御的是,在上市后智谱股价捏续迎来飙升,规矩14日港股午盘,涨16.83%,其刊行价定为116.2港元/股,这也意味着上市后智谱股价依然大涨超80%。
在和华为配合方面,据智谱露馅,依托昇腾NPU和昇想MindSpore AI框架,使用动态图多级活水下发、高性能交融算子、多流并行等本性,公司自研模子磨真金不怕火套件,全面优化数据预解决、预磨真金不怕火、SFT和RL的端到端进程。
通过动态图的多级活水优化机制,将Host侧算子下发的要津阶段活水化并高度疏浚,排斥下发瓶颈;通过多流并行政策,通讯和诡计互掩,冲破文本梯度同步、图像特征播送等操作的通讯墙,使用AdamW EMA、COC、RMS Norm等昇腾亲和的高性能交融算子,同步赞成磨真金不怕火的恬逸性和性能。
据了解,GLM-Image是首个在国产芯片上完周详进程磨真金不怕火的SOTA多模态模子,考据在国产全栈算力底座上磨真金不怕火高性能多模态生成模子的可行性。
不单是是智谱。多家中国AI企业新年以来看成经常。相同在1月14日,倾盆新闻记者获悉,MiniMax厚爱开源首个面向Coding Agent的系统性评测集OctoCodingBench,试图为下一代AGI的落地轮番给出更了了的谜底。评测成果骄慢,部分开源模子在过程合规野心上已快速贴近致使卓绝部分闭源模子。
1月12日,DeepSeek发布一篇新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可彭胀查找的条款牵挂:大讲话模子寥落性的新维度),梁文锋位列作家名单中,这篇论文为北京大学和DeepSeek共同完成。据分析,这篇论文的中枢直指面前大讲话模子存在的牵挂力“短板”,提议了“条款牵挂”这一成见。
行业大批忖度,DeepSeek的下一代模子V4或将在本年春节前后厚爱发布。
此外,爱诗科技发布最新视频模子PixVerse R1,是群众首个撑捏最高1080P鉴识率通用及时全国模子,据先容,这款新模子初度将视频生成的蔓延从“秒级”降至“即时”反应,达成“所想即所见、所说即所现”的及时交互体验,记号AIGC限制的视频生成从“静态输出”迈入“及时交互”的全新阶段。PixVerse R1通过达成连贯且及时的生成,代表全全国规模内视听媒体限制的紧迫演进。
1月13日,千里寂已久的另一家大模子独角兽“百川智能”通知开源新一代医疗大模子 Baichuan—M3,其在群众最巨擘的医疗AI评测HealthBench中以65.1分的详尽得益位列群众第一;在特意考验复杂方案才气的HealthBench Hard上,以44.4分的得益夺冠。这一得益初度在医疗限制达成对GPT-5.2的卓绝。
关于近期的大模子飞扬,百川智能首创东谈主兼CEO、原搜狗CEO王小川本日在继承媒体采访时示意,“上市的两家(智谱、MiniMax)是踩在了通用模子的技巧红利和国度关于科技强国扶捏的基础上,这标的是莫得问题的,只是他们的市值和交易化才气并不匹配。”
王小川示意,将来百川也会走到上市这条谈路上,但并莫得在进度中,他闪现可能会在2027年启动上市磋商。现在公司账上还有30亿元。

天元证券--灵活倍数满足多样需求!提示:本文来自互联网,不代表本网站观点。