腾讯混元文生图大模型对外开源,“中文原生”成最大亮点

专栏
2024
05/16
20:30
紫金财经
分享

腾讯混元文生图大模型对外开源,“中文原生”成最大亮点


紫金财经5月16日消息 随着算力的增强和数据资源的丰富,全球主流科技厂商不断探索更加高效的模型训练和优化方法,以推动生成式人工智能技术进一步发展。值得关注的是,大模型的使用门槛也在不断降低,C端免费、B端降价逐渐成为主流。


5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。这也是首个中文原生的类Sora架构开源模型,填补了国产大模型在文生图先进架构上的空白。


混元文生图大模型支持中英文双语输入及理解,不过“中文原生”才是腾讯混元文生图大模型的最大亮点,在古诗词、俚语、传统建筑、中华美食、当地习俗等中国元素的生成上表现出色。


此外,腾讯混元团队在算法层面优化了模型的长文本理解能力,能够支持最多256字符的内容输入。同时,在算法层面创新实现了多轮生图和对话能力,可实现在一张初始生成图片的基础上,通过自然语言描述进行调整,从而达到更满意的效果。


评测数据显示,混元文生图大模型是目前效果最好的开源文生图模型,整体能力达到国际领先水平。腾讯混元文生图能力,已经广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。一些主流媒体也将腾讯混元文生图用于新闻内容的辅助生产。


腾讯文生图负责人芦清林表示:“腾讯混元文生图的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源出来,是希望与行业共享腾讯在文生图领域的实践经验和研究成果,共建中文文生图开源生态,加速大模型行业发展。”


腾讯在开源上一直持开放态度,目前已开源了超170个优质项目,均来源于腾讯真实业务场景,覆盖微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块。


THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 亚设网的观点和立场。

20.jpg

关于我们

微信扫一扫,加关注

Top