首页 资讯 查看内容

文心千帆上架Llama2,百度要做大模型“跨境电商” | 最前线

2023-08-03 09:08:57

来源: 东方资讯

文 | 周鑫雨


(资料图)

编辑 | 邓咏仪

8月2日,在百度文心千帆大模型平台媒体圆桌会议上,百度携着自己的大模型伙伴,在文心千帆上开设了模型的“百货超市”。

国内“百模大战”已经打了半年。做大模型的巨头们,进度条已经从大模型研发,快速拉到建立合作伙伴、渠道和生态。

此前,字节火山引擎和阿里通义千问都已经建立“模型货架”,拉拢一批AI公司或者大模型公司到自家平台上,提供从云到AI开发等服务。

如今的文心千帆做的更像是“跨境电商”:一方面,文心千帆接入的第三方模型足够多:33个,规模超越了此前拉伙7家国内大模型厂商的火山方舟。

另一方面,RWKV、Stability Diffusion,甚至Meta在7月19日发布的Llama2等国外知名大模型,也陈列其中。

文心千帆上线的部分第三方大模型。图源:百度

此外,此次文心千帆还上线了130套预制Prompt(提示词)模板和插件功能。所谓的“Prompt模板”,就是教会用户如何对大模型提出更好的问题,从而获得更优质的反馈,而百度提供的“预制Prompt模板”,则是将提问方式的标准答案,直接喂给了用户。至于新增的插件,率先在百度内部办公软件“如流”上进行了测试,未来将陆续登陆文心千帆。

33个国内外第三方大模型入驻平台

发布会上,百度智能云AI与大数据平台总经理忻舟介绍,这次入驻的第三方大模型的特色在于性能互补,能够满足不同用户的需求,比如支持无限上下文长度的RWKV,和英文能力较强的Llama2,弥补了文心一言相应的短板。

针对上架的第三方模型,百度主要在3个方面做了调控:提高可靠性和安全性。降低成本:调整后模型体积可压缩至25%-50%,推理成本可降低50%。支持全套工具链、多样化模型调优:接入模型支持SFT(全量参数微调、Prompt Tuning、Lora)、强化学习等调优方式。

关键词:

最新新闻
回顶部