皖ICP备15015255号-1
创新技术研发
提出关键算法:如高华佐和曾旺丁为 MLA 架构做出关键创新,用 MLA 替代了传统的多头注意力,大幅减少了计算量和推理显存。邵智宏、朱琪豪和代达劢等也在各自参与的项目中积极创新,为模型性能的提升提供了技术支撑。
优化训练资源:在 GRPO 的提出与应用中,显著减少了训练资源的需求,使模型训练更加高效,降低了对硬件资源的依赖,以较少的算力投入获得较好的训练效果。
参与项目全程
深度参与模型迭代:从 DeepSeek LLM v1 到 v3,不少清北应届生全程参与,如代达劢,他们在实践中积累了丰富的经验,不断优化模型性能,使得模型在多轮迭代中持续进步,提升了模型的准确性、效率和泛化能力。
主导重要项目开发:朱琪豪基于其博士论文工作,主导开发了 DeepSeek-Coder-V1,为团队在代码生成等方面的能力提升做出了重要贡献,展示了应届生的专业能力和领导潜力。
推动高效协作
灵活选择项目:团队运作颇具灵活性,允许成员根据兴趣和擅长自由选择项目,充分发挥了年轻成员的主观能动性,使他们能够在自己感兴趣和擅长的领域深入研究和创新,提高了工作效率和成果质量。
协同优化软硬件:不仅在算法和软件方面积极创新,还重视与硬件工程的配合,通过软硬件协同设计,降低训练成本,解决传统超算架构在 AI 训练需求上的不足,提高了整体的训练效率和性能。
注入新鲜活力
带来创新思维:年轻的清北应届生和在读生通常具有更开放的思维和创新精神,不受传统观念和方法的束缚,能够提出新颖的想法和解决方案,为团队带来新的活力和创造力,推动团队在技术和业务上不断创新。
快速学习成长:他们在参与项目的过程中,能够快速学习和掌握新的知识和技能,适应行业的快速发展和变化,为团队的持续发展提供了源源不断的动力和支持。
塑造团队文化
开放创新文化:团队强调能力和潜力,而非经验,这种用人理念吸引了大量优秀的年轻人才,形成了开放创新的文化氛围,鼓励成员勇于尝试和创新,不怕失败,促进了团队内部的知识共享和合作交流。
积极进取氛围:清北应届生的积极进取精神也感染着整个团队,促使团队成员不断追求卓越,挑战更高的目标,在激烈的市场竞争中保持领先地位。