随着Deepseek引领的新一轮大模型产业风暴,工程与技术创新大大降低了模型训练与推理成本,为基础模型赛道的飞速发展奠定了基础。然而,智能的最终形态应当是泛在形式的,大模型智能如何下沉至端侧,利用端侧算力来实现自主智能计算,成为了当前的关键问题。

2025年3月14日下午3点,应中南大学计算机学院计算机科学与技术系副主任张永敏教授的邀请,清华大学任炬教授在信息楼535智慧学术教室为计算机科学与技术专业和计算机拔尖基地班(图灵班)的本科生同学们做了题为《端侧大模型:趋势与挑战》的专题报告。任教授的报告深入浅出,从大模型时代的国家战略介绍开始,讲解了当前端侧大模型技术的局限性,提出了一种创新的大模型协同计算体系,以应对端侧大模型面临的三个根本性挑战。报告里,任教授从大模型的端侧部署与微调机制、端边协同推理性能优化、以及异构多智能体协同决策方法三个方面,深入分析了端侧大模型在当前研究中的最新进展与面临的挑战。他指出,尽管大模型技术得到了快速发展,但从大型语言模型(LLM)到实际智能体的过渡仍然存在不小的技术差距。报告中,任教授还探讨了未来大模型在端侧个性化部署、推理加速及协同决策等领域的技术趋势,并分享了可能的解决方案。

此次报告不仅加深了同学们对端边云智能大模型的理解,还激发了他们对这一前沿学科领域的浓厚兴趣。在报告的最后,任教授向与会人员介绍了清华大学计算机系的直博生招生政策,吸引了在场不少同学对未来学术发展的关注。随后的互动环节中,师生们就端侧大模型技术的应用与发展展开了讨论,任教授耐心回答了大家提出的问题,并分享了自己对当前技术瓶颈及招生政策的相关见解。
此次云边端智能专题论坛的成功举办,不仅促进了学术交流与思想碰撞,也为进一步推动校际合作、提升学校科研创新能力注入了新的活力。
撰写/摄影:T201班杨佳琳、T2201班佘书晨、钟萍
一审:张永敏
二审:夏佳志
三审:王新辉