天天滚动:文心一言,甩开GPT-3.5,与GPT-4掰手腕?

来源:fx358财富网时间:2023-03-28 13:00:54

企业数字转型怎么找外部合作伙伴,现在有哪些类型的伙伴可以选择?

文|智能相对论(aixdlun)

作者| 叶远风


(资料图片仅供参考)

(资料图片)

“请写一个肯德基疯狂星期四的段子。”

“我女朋友的老公应该叫我什么?”

“XX微信群的群主与吴彦祖谁更帅?”

......

给几个搞怪的问题,戏耍一下,把答案贴出来,大家嘲讽一番。

在文心一言发布后,这种玩法直到今天还没有停止的意思。

可能连背后的技术与产品人员都没有想到,文心一言会以这样的方式火了下去。

作为国产版ChatGPT,文心一言在发布后,除了赞誉的声音,以各种形式被批判应该在意料之中,ChatGPT当初也是如此,这是产品不断进化要经历的过程。

只不过,在没有好坏的定论中,到底要给文心一言当下的技术水准定一个什么样的定义,并没有客观的、更加令人信服的结论。

起码,这种“戏耍”并不能反映多模态大模型所具备的能力。

ChatBOT固然可以闲聊,也应该支持用户随便闲聊,但闲聊互动不应该成为一款专业产品能力的最终评价标准。

光怪陆离的问题,就算去询问一个人类智者,得到的答案也是光怪陆离的。

现在来看,以某种更现实的视角去提出问题、实测答案,才更能体现出文心一言的能力和价值。

这种现实的视角应当有很多,其中,以企业信息需求为着眼点,会是其中之一。

这是因为,从文心系列大模型走向对话产品“一言”,或者,从GPT-3.5到GPT-4,ChatBOT最后都还是要走向商用、服务企业,创造专业价值的。

GPT-4发布后并没有公布其参数量,这被认为是走向商业化的准备,毕竟OpenAI制定的数亿美元营收目标现在快到4月份了还没太大动静。

而服务企业,要么提供“生产力”价值,这是ChatBOT场景垂直化后需要探索的内容,在各产业提供具体的工作能力;要么提供信息价值,通过类似“上帝之眼”的信息整合与逻辑梳理能力,帮助企业消除信息不对称,获取需要的信息。

目前ChatBOT的产业应用还未见,因此信息价值就成为可以客观评价的维度。

“智能相对论”团队获得了文心一言的内测账号,以及ChatGPT普通版本(基于GPT-3.5)与plus版本(基于GPT-4)的测试资格,尝试从企业信息获取维度,提出六个关联问题,从各答案中对比出文心一言的实际能力。

总体上,文心一言甩开GPT-3.5不成问题,与GPT-4能够掰手腕做到有来有回。

具体一个个分析,每个问题下,分别是文心一言、ChatGPT普通版、ChatGPT plus版的回答截图。

01

企业数字转型怎么找外部合作伙伴,

现在有哪些类型的伙伴可以选择?

可以看出,在三个回答中,只有文心一言提到了选择外部合作伙伴要注意到的几点,然后再例举可以找哪些类型的合作伙伴。

而ChatGPT普F通版、ChatGPT plus版都只是直接给出了类型。

这显示出,文心一言在算法上,相较与其他两个产品,对问题的潜在需求认识可能更加深刻。

02

企业应该怎样抓住

新的市场机遇?

在这个问题的回答中,很显然,条目的多少,基本上决定了答案的质量。

对一个企业来说,要抓住市场机遇,就应该要找到更多的方法,考验的是ChatBOT整合信息并分门别类的能力。

在这里,文心一言超越GPT-3.5但略逊于GPT-4。

03

企业怎么招徕优质人才,

有哪些好用的渠道?

与上一个问题类似,条目的多少直观反映了ChatBOT解决需求的能力。

文心一言远超GPT-3.5,并超越了GPT-4,再一次掰赢了手腕。

04

员工的工作效率很低,

怎么办?

这一局,相似的判断标准,文心一言继续领先GPT-3.5,但没有打赢GPT-4。

05

客户总是不回款,

有什么好的办法?

这个问题,由于各个回答都涉及了可能破坏企业与客户关系的行动,因此都进行了一次“打补丁”式的追问。

基本上,三个模型都很好地领会到了追问的意图,对“不和客户关系搞僵”有准确的认知,并提供了对应的答案。

其中GPT-4的表现超越文心一言。(注意ChatGPT有字数限制,plus版限制在700字左右,所以其输出因为字数太多最后被中止)

06

企业资金链紧张,

但是银行不肯借钱,怎么办?

吸取上个问题的教训,这个问题直接把限制条件加入到问题当中。

类似上一个问题,三个模型对“银行不借钱”情形下企业资金链紧张的应对办法都有清晰的认知,规避了银行信贷这一种方式。

其中,文心一言与GPT-4打成了平手,都提供了相同数量的方法供企业选择。

总结以上,仅就这六个企业比较关心的专业问题而言,文心一言全面胜过GPT-3.5,对GPT-4两胜、两负一平,典型的你来我往掰手腕。

而更进一步看,实际上在回答条目上的胜负,无关算法本身的设计,在技术上与算法训练的数据量和训练时长有关(要给足够多的食物,也要给足够多的时间去吃食物),后续的竞逐将仍然在数据训练上。

对文心一言而言,发布更晚已经吃了亏,下一步如何在训练上追赶、赶超(可能意味着巨大的成本投入)是百度要考虑的问题。

当然,由于文心系列大模型过去早已具备了丰富的多模态能力,因此文心一言在发布时就自带有GPT进化到“4代”才加入的多模态能力,这一点也常常为业界所忽略。

而“智能相对论”认为,未来ChatBOT的比拼,将很大程度上在多模态展开。

这意味着,当下的文本竞逐,只是一切的开始。

现在,任何的结论,不管是褒扬的还是贬低的,可能都为时尚早。

*本文图片均来源于网络

深挖智能这口井,同好添加vx:zhinengxdl

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

本文首发于微信公众号:智能相对论。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

关键词:

相关阅读

推荐阅读

银鹏控股公司:业务交流促提升互学互鉴共进步|世

3月2日,银鹏控股公司董事长刘懿婷带队前往中粮集团期货公司进行业务学习和交流。中粮期货公司从业多年、具有丰富实战经验的风险管理专家现场更多

2023-03-07 17:52:41

我国首个万吨级钠离子电池材料项目在山西综改区开

山西晚报讯(记者温丽芳通讯员张晓茹)日前,总投资约11亿元的山西华钠铜能(碳能)科技有限责任公司万吨级钠离子电池正(负)极材料项目在山更多

2023-03-07 11:51:14

建行阳江市分行:践行金融惠民理念-全球关注

2月24日,随着客户办妥抵押登记手续并成功放款,标志着阳江市建行“带押过户”业务取得历史性突破。根据中国人民银行发布《关于鼓励推广二手房更多

2023-03-07 11:53:21

焦点简讯:证监会同意三超新材向特定对象发行股票

中证网讯(记者昝秀丽)证监会网站3月6日消息,证监会发布关于同意南京三超新材料股份有限公司向特定对象发行股票注册的批复。【来源:中国证更多

2023-03-07 09:57:39

美股航空股6日全线走低

中证网讯(记者赵中昊)当地时间周一(3月6日),美股航空股全线走低。据wind数据,截至收盘,波音跌1 49%,美国航空跌1 47%,达美航空跌1%,更多

2023-03-07 09:43:44

世界热资讯!晋钢控股集团荣登2022山西省品牌十强

近日,“品牌强国(龙城)论坛”在太原举行,发布“2022中国上市公司品牌500强”以及“2022山西省品牌100强”。晋钢控股集团以218 9亿元的品牌更多

2023-03-06 17:38:52

手绘报告:2023预期目标

【来源:中国政府网】声明:转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者持权属证明发至邮箱newmedia@xx更多

2023-03-06 16:46:31

惠州首笔数字人民币缴纳税费业务成功落地

3月1日,TCL科技集团财务有限公司拿到了全市第一张使用数字人民币账户缴纳税款和非税收入的完税凭证,标志着惠州市首笔数字人民币缴纳税费业务更多

2023-03-06 11:50:50
    2022年三季报披露后,北京商报记者根据企业公告选取了30家上市房...
    首套房公积金利率下调原来贷款也下调吗首套房公积金利率下调原来...
    政府回购商品房意味着什么政府收购商品房的首要目的是稳定市场。...
    把自己房子卖了再买算首套房吗买过一套房卖了再买算首套房。简单...
    买房交首付注意事项有哪些1、核实开发商五证。在交首付时,需要先...
    房屋契税征收比例契税税率的缴纳一般分为以下几种情况:1、面积小...

Copyright   2015-2022 当代财经网  www.ddcjw.cn 版权所有  备案号:京ICP备2021034106号-19  联系邮箱:55 16 53 8 @qq.com