文心一言吧 关注:8,144贴子:28,189
  • 12回复贴,共1

看了差评君的直播-关于文心一言和GPT4的对比

取消只看楼主收藏回复

也看了百度的发布会直播,还是蛮有感触的。


IP属地:广东来自Android客户端1楼2023-03-16 21:42回复
    自己只用过gpt3.5和new bing,new bing经常用到每日限额。


    IP属地:广东来自Android客户端2楼2023-03-16 21:43
    回复
      直播看gpt4.0相对3.5提升挺多的,文心的确是有些相形见绌,AI作画也很普通,多模态的语音生成暂时也只是支持部分方言,不过好在作为外地人听着还挺自然的。


      IP属地:广东来自Android客户端3楼2023-03-16 21:49
      回复
        主播测试了分别用gpt4和文心写C的冒泡排序和JavaScript的2048游戏,gpt4指出来文心犯了数组越界和不符合变量命名规则的错误,而文心认为gpt4修改后的代码是正确的,却不是2048游戏的源码。


        IP属地:广东来自Android客户端5楼2023-03-16 21:54
        回复
          主播还问了诸如“如果孙悟空穿越三国”、“续写林黛玉倒拔垂杨柳”等,gpt4可以条理清晰地回答这些问题,并有些文采,但没有能完全理解后者的意思。而文心应该是理解了问题,但回答并不出采。


          IP属地:广东来自Android客户端6楼2023-03-16 21:59
          回复
            还有一些生活上的数学问题:如1,2,3,4生成24点;3升容器和5升容器倒出4升水。gpt4都解答完全,而文心的回答是错乱的。


            IP属地:广东来自Android客户端9楼2023-03-16 22:02
            回复
              测试内容还包括辩论(角色扮演)、弱智吧问题等等,我是中途进的直播,可能记不全。gpt4.0相对来说无论是语义理解还是上下文综合上看都更好。


              IP属地:广东来自Android客户端12楼2023-03-16 22:11
              回复
                文心有时候也能避开gpt4会踩的坑,这点还是值得高兴的。目前在文心身上看到的问题,实际上在我一开始用gpt3.5,以及昨天使用搭载了gpt的4.0的new bing上能看到影子。
                从这个角度来看,后两者相比之下也仅是重复操作下错误率更低。


                IP属地:广东来自Android客户端13楼2023-03-16 22:16
                收起回复
                  文心在对话方面,整个回答的结构做不如gpt和new bing的,往好的理解可以说更像人的回答方式,但可读性差,体验不好。


                  IP属地:广东来自Android客户端14楼2023-03-16 22:21
                  回复
                    主播的直播间弹幕氛围很差,包括b站关于文心的话题评论区都是一片唱衰,很多是因为之前的收费和广告,对我来说百度依然是搜索引擎的首选,可能是从小使用,很少注意到上面的广告,也不会下错什么软件。使用Google也没有什么体验提升的感觉。
                    不过网盘下载慢的确令人诟病。


                    IP属地:广东来自Android客户端16楼2023-03-16 22:27
                    收起回复
                      发布会看彦宏也是蛮紧张的,不知道是不是因为理工男的不善言辞。毕竟这两天要硬碰GPT4.0,还有可预见的国内舆论大环境问题。


                      IP属地:广东来自Android客户端17楼2023-03-16 22:33
                      回复
                        总之,文心暂时确实和GPT4.0在聊天方面有差距。加油吧!


                        IP属地:广东来自Android客户端18楼2023-03-16 22:34
                        回复


                          IP属地:广东来自Android客户端19楼2023-03-16 22:44
                          回复