站亮相世界人工智能大会,首次展出自研大语言模型

IT之家7月5日消息,在2024世界人工智能大会(WAIC2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的AI技术成果和AIGC多元创意,包括最新定制的AI语音声库、自研音视频大模型必剪Studio以及自研AI动态漫技术等。

此外,B站自研的大语言模型系列也在此次WAIC2024大会上首次展出,包括开源的Index-1.9Bchat和Index-1.9Bcharacter两个模型。

IT之家查询GitHub获悉,Index-1.9B系列模型于6月开源,包含基座模型、对照组、对话模型、角色扮演模型:

Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,站亮相世界人工智能大会,首次展出自研大语言模型多个评测基准上与同级别模型比处于领先

Index-1.9Bpure:基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对benchmark的影响

Index-1.9Bchat:基于index-1.9Bbase通过SFT和DPO对齐后的对话模型

Index-1.9Bcharacter:在SFT和DPO的基础上引入了RAG来实现fewshots角色扮演定制

在B站15周年演讲上,B站董事长兼CEO陈睿表示,2023年,B站AI相关内容的日均视频播放量同比增长超过80%,爆款内容涵盖科普资讯、AI技术应用、数字人和创意应用等领域。

根据B站透露的数据,当前超过8000万用户每月在B站观看AI相关的视频,其中6成为00后。

Index-1.9B系列模型开源地址:

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

最近发表