随着 ChatGPT 登台亮相,从科技从业者,到投资圈,再到普罗大众,越来越多人再次关注到了 " 过气 " 的 AI,及其所能带来的价值和改变。
商业界也的确源源不断贡献着更多新的素材:OpenAI、微软、Google、Meta、百度、字节、腾讯等大厂,以及众多创业公司,都开始从自己擅长的角度切入竞争……
为了帮助读者能够持续关注由 ChatGPT 引发的科技圈海啸,36 氪推出「Chat AI」栏目,从中立的第三方视角,探索、分析每一次热点背后的商业观点。
文|沈筱、王与桐
编辑 | 石亚琼
3 月 16 号,百度文心一言上线,但是仅仅开放申请。据悉,截至发布会结束当晚 21 点,已经有 6.5 万家企业申请百度文心一言 API 调用测试。目前,个人用户也可以通过访问官网参与内测排队。
发布会我们已经有文章报道过,在此不做赘述。总的来说,透过这场发布会,百度表达了以下核心观点和内容:承认差距、阐述能力、展望未来。
而目前大家更感兴趣的,或许是文心一言所谓的智能对话能力,到底怎么样?
36 氪拿到了内测权限,在朋友圈征集了一些问题,并将某些问题与 ChatGPT 的回答进行对比(之所以如此,是因为百度文心一言一直对标 ChatGPT,也被人嘲讽为 "ChinaPPT")。
先说结论:
1、百度文心一言对开放式问题回答更好,对于任务和逻辑问题回答稍弱。
2、百度文心一言在第一次给出答案时不够问题,容易输出奇怪答案,质量不够统一。
3、视频和语音生成功能暂时无法体验,百度的说法是,成本太高。
4、单轮对话效果优于连续对话
5、比预期要好。
文心一言和 ChatGPT(GPT-4)的互评
首先,让「文心一言」和「ChatGPT(GPT-4)」互评。
双方的回答方向都很 " 官方 ",先陈述事实,再列出优点和缺点,中规中矩。所谓知己知彼,百战不殆。目前来看,AI 大模型本身似乎还不能做到这一点。但是,对 OpenAI、Google、百度等企业的决策者,以及开发 AI 大模型的人来说,应该不是难事。
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
ChatGPT(GPT-4)对百度文心一言的评价
这里需要做个小笔记:GPT-4 训练数据截止日期是 2021 年 9 月,而此前公布的 ChatGPT 数据库的最后更新时间是 2021 年的 12 月 31 日。
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
百度文心一言对 ChatGPT 的评价
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
第一次回答的小插曲
小插曲是,文心一言第一次回答这个问题,出现了一些奇怪的对话,但是重新生成之后答案就较为正常了。
文学创作
在发布会上,百度效仿网友对 ChatGPT 提出的续写《三体》要求,展示了文心一言对续写《三体》的建议。有网友称,ChatGPT 的回答更有趣。但是,细心的观众可能以及注意到,文心一言案例中点明了要 " 从哲学的角度续写 ",而非直接提问续写角度。
为了方便读者进行对比,笔者也尝试让 ChatGPT(GPT-4)回答了同样的问题。
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
文心一言:从哲学角度续写《三体》,来自于文心一言发布会
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
ChatGPT(GPT-4):从哲学角度续写《三体》
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
文心一言:从哲学角度续写《三体》,来自作者提问
看多了故事创作的例子,想必也会有读者对散文感兴趣。
从生成内容来看,文心一言似乎更能勾起笔者的思乡之情,尤其是这句 " 或许,我需要的并不是物质上的财务和名利,而是一份真正的情感和归属 "。
而笔者在尝试用 ChatGPT(GPT-4)生成散文时,频繁出现网络错误提示,导致文本生成不能顺利进行。这可能是服务器的问题。不过,从内容生成速度上来讲,GPT-4 确实不如 GPT-3.5,在很多情况下,也不如文心一言。尽管如此,依然可以看出,ChatGPT 是擅长排比的。
![独家测试:我们收集了几十个问题,而「文心一言」是这么回答的……]()
文心一言散文创作(字数统计:666 个字)