DistillQwen-ThoughtY:通过变长思维链蒸馏,全面提升模型推理能力!
作者:蔡文睿(清素)、汪诚愚(熊兮)、严俊冰(玖烛)、黄俊(临在) 前言 自然语言处理领域因大语言模型(LLM)的突破发生重大变革,深度推理模型如 Open AI o1、DeepSeek-R1 等,通过思维链推理策略,模拟人类思考过程。然而...
作者:蔡文睿(清素)、汪诚愚(熊兮)、严俊冰(玖烛)、黄俊(临在) 前言 自然语言处理领域因大语言模型(LLM)的突破发生重大变革,深度推理模型如 Open AI o1、DeepSeek-R1 等,通过思维链推理策略,模拟人类思考过程。然而...
作者:汪诚愚(熊兮)、严俊冰(玖烛)、蔡文睿(清素)、岳元浩(顾城)、黄俊(临在) 前言 随着大型语言模型(LLM)的复杂性和规模不断增长,对于许多研究人员和企业而言,如何有效地利用这些庞大的模型变得愈发重要。然而,巨大的计算需求和训练成本...
作者:蔡文睿(清素)、汪诚愚(熊兮)、严俊冰(玖烛)、黄俊(临在) 前言 近年来,自然语言处理(NLP)领域以大语言模型(LLM)的出现为标志,发生了深刻变革,引领了语言理解、生成和推理任务的进步。其中,进步尤其显著的是深度推理模型的发展...
近年来,生成式AI技术的快速发展,尤其是ChatGPT、Deepseek等模型的发布,将人工智能推向了新的高度。这一趋势直接引爆了市场对算力芯片的需求,半导体产业也因此迎来了新一轮的繁荣期,各环节都处于高度忙碌的状态。据SEMI(国际半导体...
近日,海外权威视频生成评测榜单 VBench Leaderboard 更新了最新一期文生视频榜单,Vidu Q1分别以总分87.41%和60.98%的成绩,登上VBench-1.0和VBench-2.0的榜首,超越了Runway 、Open...
随着数据要素市场化进程加速,如何在保障隐私安全的前提下充分释放数据价值,并基于当下大热的开源模型DeepSeek实现智能化转型,成为数字经济高质量发展的核心命题。 近日,优刻得数据安全流通平台“安全屋”已完成与DeepSeek全系列模型适配...
在数字化转型的浪潮中,您是否在教育之路上面临诸多困境?学生基础与学习动力的参差不齐,行业知识的快速更新带来巨大压力,繁重的教学任务以及定期的教学大赛等战……作为科大讯飞旗下一款AIGC内容生产平台,讯飞智作正以前沿的AI能力深度赋能教育场景...
众所周知,LakeHouse 架构是当前大数据领域领先的技术架构之一。LakeHouse 由海外知名大数据公司 Databricks 提出,旨在融合数据湖的灵活性及成本效益与传统数据仓库的强大事务支持、高性能分析能力于一体,并且能够无缝集成...
近期,阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场...
“有宝宝问酒店有没有餐厅。是的,酒店有餐厅,早餐时间为早上6点至10点,种类很丰富。”在去哪儿旅行上的酒店页面,点开直播间,数字人主播24小时全天候在线解答客人的问题。 10月23日,去哪儿旅行上线数字人项目——“聆风”,这也是在线旅行行业...