11月14日上午,传神语联网网络科技股份有限公司(以下简称“传神”)携其自研创新产品任度“双脑”大模型一体机亮相2024全球机器学习大会。
传神始终走在人工智能领域前沿,多年来持续聚焦底层大模型技术创新,经过20多年的技术求索,我们成功开创了大模型“双网络数推分离”这一全新技术架构,为人工智能的广泛应用开辟了全新的路径。
传神语联创始人何恩培作主题演讲
“大模型行业加速发展,我们认为当前已经由scaling law进入到实时学习时代,而我们恰好一开始就坚定不移的走在这条路上,而如今的现状也正是验证了我们的正确方向”,传神语联创始人何恩培在演讲时说到。
坚持不懈,任度“数推分离”的技术路线
OpenAI及众多企业和研究机构已将“数推分离”视为下一阶段的重要探索和突破方向。任度以双网络架构实现数推分离,将推理网络与数据学习网络分离。其中,客户数据学习网络如同人类左脑,专注于数据的动态管理与迭代训练,持续为模型注入知识养分;推理网络则如同人类右脑,作为经大量数据预训练的基础网络,具备不错的推理和泛化能力。
传神语联创始人何恩培介绍“数推分离双网络架构”
双网络协同工作的独特设计,显著降低了训练算力成本,有效避免了微调训练造成的基座模型能力退化和泛化能力减弱等问题。数据学习网络可以在客户现场学习历史数据,并不断学习业务运营中的新数据,两个网络还能联合协同工作,输出客户所需成果。通过精细化的网络设计与优化算法,我们实现了数据在双网络间的高效传输与同步,确保了系统的整体性能与稳定性。
同时,数推分离的双网络架构突破了常规大模型技术架构限制,上下文输入长度不受限,可将海量用户数据(从20万字到1亿字)压缩到神经网络中实现深度知识理解。在训练和推理的硬件投入方面,任度大模型表现优异,实现了极为接近 “实时” 的数据学习模式。哪怕客户有极少量数据更新,也能快速上传并完成数据压缩,进化为客户定制大模型。
此外,在数推分离模式下,更新数据的网络压缩对推理网络影响微乎其微,却能广泛适应各种场景,灵活处理各类数据操作,训练时间可缩短至分钟级,是基于客户知识训练的通用场景大模型。
正是在“数推分离”这条路上的坚定与执着,传神成功推动了大模型技术边界的扩展,走出了与众不同的正确路线。我们的小参数轻量级大模型,不仅大幅降低了计算资源的消耗,还显著提升了模型的运行效率。同时,我们的双网络架构数推分离模式,更是突破了传统技术架构的限制,实现了数据处理和模型推理的高效协同。
全栈“根原创”,任度大模型更安全、更经济、更全面
任度大模型的数推分离双网络架构独具特色且独一无二。因为它是真正意义上从底层算法框架到上层应用的全技术栈自主研发成果,未使用任何开源代码和框架。何恩培先生强调:“我们自主研发了机器学习算法框架和模型架构,这使得我们的任何想法和创新都可以不受限制地去实践,让任度大模型具备实时学习客户数据的能力。在国内外,能做到这一点的企业为数不多。”
任度大模型目前拥有2.1B和9B两个版本,其中多模态9B参数版本在全球评测中表现卓越,已跻身全球大模型行业第一梯队。在多项国内外评测中,任度9B模型与百亿千亿参数大模型的对比中脱颖而出,以更少参数实现领先性能。同时,2.1B参数版本在2024年9月的MMLU评估中,综合评分超越了Gemma-7B、LLaMA2-34B等知名大模型,性参比更是超越了包括GPT-4o、Phi-3、Qwen2-7B、Llama3.1等国际顶尖大模型,以小参数实现了与百亿、千亿级别模型相媲美的性能。此外,任度大模型在训练与推理过程中的算力成本显著降低,仅为同等大型模型的1/5到1/10以及1/2到1/4,展现了极高的性参比,在所有评测中,性参比几乎全部处在前列,大部分是第一。(性能参比=大模型能力分数/大模型参数)。
任度“双脑”大模型一体机:一小时成为您的AI专家
何恩培先生介绍,双网络架构的数推分离大模型已应用在任度“双脑”大模型一体机中,即将投放市场。
该一体机解决大模型落地客户痛点。数推分离的双脑模式,解决了客户数据离场训练、向量效果有限以及人才投入高等难题,实现本地实时学习,快速转化为“企业知识专家”。更重要的是,客户数据在本地训练,无需上传至公有云,保障了数据隐私安全。根原创和高性参比,解决了客户在应用大模型中的高硬件投入、高能耗以及技术安全和软件漏洞等顾虑。
任度“双脑”大模型一体机的推出,不仅破解了大模型在企业落地过程中的诸多难题,更为千行百业的数字化转型提供了强大动力。从智慧政务到智慧城市,从金融风控到医疗健康,任度“双脑”大模型一体机正以其独特的优势赋能千行百业,推动AI价值在更广泛的领域落地。
如果您对我们的一体机感兴趣,希望了解更多的技术内容,请在此留下您的信息,我们会第一时间与您取得联系。
继往开来,携手共创AI未来
作为行业内极具影响力的科技盛会,全球机器学习大会汇聚了数千位业内领袖与技术专家,共同分享各自领域的真知灼见。此次发布不仅是任度“双脑”大模型一体机的简单亮相,更是印证了业界对传神“数推分离”概念、自主研发能力、全栈根原创大模型的认可。
当前大模型行业繁荣发展,“双网络数推分离”架构将会掀起新一轮的浪潮,属于传神的新时代已经来临。
传神未来也会以创新为驱动、以需求为导向、以政策为引领,推动技术的不断进步和产业的持续发展。同样将秉持开放赋能的理念,持续开放前沿的AI能力及方案,与各方携手共创人工智能的大未来!