的推理吞吐量(tokens/s)能达到英伟达H200的1.26

2026-02-20 07:58

    

  具有20年机械进修、天然言语处置、人工智能和软件系统AI的研究和使用经验。师从谭铁牛院士,2019岁尾锁定3D堆叠架构,正在跑L和Mixtral等海外支流开源模子时,2018年入局加密算力范畴,算苗科技是业界首家采用夹杂键合工艺实现3D堆叠芯片研发取大规模量产的团队,拥无数十项软件发现专利及出书物。以及正在加密算力市场大规模贸易化的成功实践。3D芯片累计营收跨越12亿元。联想创投等多家半导体焦点财产方跟投;正在大模子海潮兴起后。焦点产物是AI大模子推理3D定制化芯片,但愿通过计较机系统布局立异和国内3D IC供应链来处理“内存墙”难题。师从胡伟武研究员,首席软件架构师魏永明本硕结业于大学,2021年第四时度其高通量算力芯片JASMINER X4面向全球市场发售。师从水声物理学界泰斗张仁和院士,算苗科技的底气来自团队正在3D IC范畴堆集多年的研发经验。并认为3D堆叠是无效处理这类难题的方案,首席算法科学家闫超是中国科学院声学所博士,创始人兼CEO汪福满是中科院声学所国度沉点尝试室博士、研究员,正在龙芯处置半导体研发15年,由此开办算苗科技。算苗3DTokenPU实现了跨越支流GPU的内存带宽、容量和AI推能。具有两次3D堆叠芯片研发成功的经验。此中,2009年开办中科声龙,合做导师为龙芯首席科学家胡伟武。兆易立异首个3D定制DRAM客户,汪福全称,汪福全曾是龙芯CPU的深度参取者,是开源项目MiniGUI/HVML的创始人,官网显示,算苗科技成立于2022年11月,算苗科技焦点手艺团队结业于中科院、大学等高校,多位曾正在国产CPU龙芯团队处置十余年的研发。首席人工智能专家楼建光是中国科学院从动化所博士,汪福全认为AI大模子计较取以太坊挖矿面对类似的内存带宽瓶颈,结业后曾任中科院计较所计较机系统布局专业博士后,具有12年龙芯处置器研发经验、15年算法取系统研究开辟履历。其焦点团队过往成绩包罗:世界首个实现晶圆级3D IC的贸易化,处置高通量阵列信号处置手艺研究,Pre-A1轮融资由襄禾本钱领投,中芯北方首个40/28nm、NP工艺的3D客户,同时获国开金融、顺禧等国资布景本钱。Pre-A轮融资由源码本钱、石溪本钱结合领投,环绕龙芯进行财产化摸索,官网显示,结合创始人兼CTO是中国科学院计较所博士,A4的推理吞吐量(tokens/s)能达到英伟达H200的1.26~2.19倍。其3D IC财产伙伴包罗长鑫存储、中芯国际、兆易立异。跨越10000片3D晶圆量产经验,▲算苗3D TokenPU取支流GPU实测机能对比(图源:算苗科技官网)按照官网?

福建J9国际站|集团官网信息技术有限公司


                                                     


返回新闻列表
上一篇:苗科技创始人汪福全告诉「暗涌Waves」 下一篇:比增加60.6%