欢迎光临
人工智能那点事

算法

Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践-人工智能那点事

Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践

作者:熊兮、求伯、一耘 引言 Mixtral 8x7B 是Mixtral AI最新发布的大语言模型,在许多基准测试上表现优于 GPT-3.5,是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学习...

赞(1)宋悦宋悦阅读(169)
通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践-人工智能那点事

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

作者:熊兮、求伯、一耘 引言 通义千问-72B(Qwen-72B)是阿里云研发的通义千问大模型系列的720亿参数规模模型。Qwen-72B的预训练数据类型多样、覆盖广泛,包括大量网络文本、专业书籍、代码等。Qwen-72B-Chat是在Qw...

赞(2)宋悦宋悦阅读(185)
腾讯长三角AI超算中心开工 上海加速发力“新基建”-人工智能那点事

腾讯长三角AI超算中心开工 上海加速发力“新基建”

新华社上海6月7日电(记者龚雯)从项目签约到土地摘牌仅用了58天,腾讯长三角人工智能超算中心及产业基地项目6日在上海松江正式开工,预估投资超过450亿元,占地236亩。 该超算中心将成为长三角最大、全国前三的人工智能超算枢纽,预计2021年...

赞(2)宋悦宋悦阅读(107)