大模型测评报告长文本和捞针成大模型痛点

  • 大模型测评报告:长文本和捞针成大模型痛点

    大模型测评报告:长文本和捞针成大模型痛点

    新京报贝壳财经讯(记者白金蕾韦英姿罗亦丹)7月3日下午,在新京报贝壳财经夏季年会“‘通’往未来向新有AI”主题论坛上,新京报贝壳财经联合北京智源研究院、中国经济传媒协会发布行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》(下称:报告)。本次报告特色内容为新京报人工智能研究院自行研发的针对大模型传媒能力的测评体系。测评选取了较为知名的9款大模型应用程序(或其网页版),分别考察了其文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力,旨在评估不同大模型助手针对媒体...

1

最近发表