新足迹

 找回密码
 注册

精华好帖回顾

· Hammer的狗生片段(Hammer的同居生活) (2009-12-12) 碧螺春 · 2023年夏末秋初韩日行 - (后篇)日本那智胜浦, 新宫, 京都, 奈良, 大阪 (全文完) (2024-8-30) buddha11815
· 【PowerMao指路】墨尔本精华游指南 (2006-7-27) powermao · 扩建进入尾声,还有两周结束,发帖纪念一下 (2013-5-31) caomianking
Advertisement
Advertisement
查看: 3234|回复: 162

[北美] DeepSeek的新闻准确率仅17%,在NewsGuard评估中落后于西方竞争对手 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 06:59 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
路透社:DeepSeek聊天机器人的新闻准确率仅17%,在NewsGuard评估中落后于西方竞争对手  

路透社1月29日消息,中国AI初创公司DeepSeek的聊天机器人在NewsGuard的评估中,仅在新闻和信息传递方面达到了17%的准确率,在包括OpenAI的ChatGPT和Google Gemini等西方竞争对手的比较中,排名第十,在11个受测模型中表现倒数第二。  

根据NewsGuard周三发布的报告,该聊天机器人在面对新闻相关问题时,30%的情况下重复了错误信息,53%的情况下给出了模糊或无用的答案,总体失败率高达83%。  

这一表现比西方竞争对手的平均失败率62%更糟,令人质疑DeepSeek所宣传的AI技术是否真的能以更低成本达到或超越微软支持的OpenAI的水平。  

DeepSeek下载量飙升,引发市场震荡  

DeepSeek的聊天机器人在推出后短短几天内,迅速成为苹果App Store下载量最高的应用。

这一现象引发了对美国在AI领域领先地位的担忧,并导致市场恐慌,美股科技板块市值蒸发约1万亿美元。  

针对NewsGuard的评估结果,DeepSeek尚未立即回应置评请求。  

DeepSeek在多个问题上表现不佳  

NewsGuard表示,它使用了与评估西方竞争对手相同的300个测试问题来测试DeepSeek,其中包括30个基于互联网上流传的10个错误信息的问题。  

这些错误信息的主题包括上个月联合健康集团(UnitedHealthcare)高管汤普森(Brian Thompson)被杀案,以及阿塞拜疆航空(Azerbaijan Airlines)8243航班的坠机事件。  

NewsGuard的审查还发现,在10个测试问题中的3个问题上,DeepSeek在没有被要求谈论中国的情况下,主动重复了中国政府的立场。  

在涉及阿塞拜疆航空坠机事件的测试问题,这些问题本身与中国无关,DeepSeek的回答却包含了北京方面的立场,NewsGuard指出。  

分析师:DeepSeek的意义在于成本,而非准确性  

D.A. Davidson的分析师卢里亚(Gil Luria)表示:“DeepSeek的突破点并不在于其能准确回答中国相关的新闻问题,而在于它可以用1/30的成本回答任何问题,与同类AI模型相比成本极低。”  

NewsGuard补充道,与其他AI模型一样,DeepSeek在回答由试图利用AI制造和传播虚假信息的用户所输入的问题时,最容易重复错误信息。  





来源:

https://www.reuters.com/world/ch ... d-audit-2025-01-29/

By Reuters
January 30, 20251:45 AM GMT+11Updated 4 hours ago

评分

参与人数 1积分 +4 收起 理由
limyae2009 + 4 偶对你的景仰如滔滔江水

查看全部评分

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 06:59 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. NewsGuard评估显示,DeepSeek聊天机器人的新闻和信息传递准确率仅为17%,失败率高达83%,在受测的11款AI模型中排名倒数第二。

2. 该聊天机器人在推出后迅速登顶苹果App Store下载榜,但也引发市场担忧,导致美国科技股市值蒸发约1万亿美元。  

3. NewsGuard测试发现,DeepSeek在回答某些问题时,主动重复中国政府立场,即使这些问题本身与中国无关,引发进一步争议。
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 07:06 来自手机 |显示全部楼层
此文章由 ctsnzakl12@gmai 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ctsnzakl12@gmai 所有!转贴必须注明作者、出处和本声明,并保持内容完整
错又在中方
很快成为软件版华为

发表于 2025-1-30 07:12 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
重申中方立场不等于不准确,毕竟这是中国的APP。

也很少用AI来看新闻的吧。

发表于 2025-1-30 07:13 来自手机 |显示全部楼层
此文章由 ozkids2011 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ozkids2011 所有!转贴必须注明作者、出处和本声明,并保持内容完整
说明deepseek背后有个审查团队

发表于 2025-1-30 07:21 来自手机 |显示全部楼层
此文章由 FireRain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 FireRain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
必须尽力打压 deepseek,对美国自信的破坏力太大了,还防碍影响华尔街利用ai泡沫赚钱。 接下来应该可以看到各类 deepseek负面报道
Advertisement
Advertisement

发表于 2025-1-30 07:21 |显示全部楼层
此文章由 pzh 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 pzh 所有!转贴必须注明作者、出处和本声明,并保持内容完整
3. NewsGuard测试发现,DeepSeek在回答某些问题时,主动重复中国政府立场,即使这些问题本身与中国无关,引发进一步争议。

这应该可以做为偷取美国公司数据的证据了

主流媒体中有多少与中国无关的东西扯上中国了?

发表于 2025-1-30 07:28 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
小红妹早上好,辛苦了!:)


对了,英伟达现在的股价涨了吗?

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 07:39 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-30 07:28
小红妹早上好,辛苦了!:)

早,阿姨要去搬砖了啊?

才大年初二啊,给你的员工们放假到初七吧,请对员工们好一点。

既然阿姨这么关心英伟达,今天等我有空,再翻译两篇英伟达的新闻给你看。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1金币 +1 收起 理由
limyae2009 + 1 好可爱啊

查看全部评分

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 07:42 来自手机 |显示全部楼层
此文章由 cwb1000 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cwb1000 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这是搞科研和促进生产力的
哪怕新闻准确率为零有毛关系?政治挂帅

发表于 2025-1-30 07:52 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-30 07:39
早,阿姨要去搬砖了啊?

才大年初二啊,给你的员工们放假到初七吧,请对员工们好一点。

辛苦了,如果可以这篇技术文一起带上的话 :)



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +1 收起 理由
凯瑟琳琳 + 1 感谢分享

查看全部评分

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)
Advertisement
Advertisement

发表于 2025-1-30 07:55 |显示全部楼层
此文章由 @树 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 @树 所有!转贴必须注明作者、出处和本声明,并保持内容完整
做空之后抄底,股市老阴阳手了

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 07:58 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-30 07:52
辛苦了,如果可以这篇技术文一起带上的话 :)

阿斯已经翻译了。

再说一遍。你太注重意识形态了,与时并进吧。

你的怨念太深,对身体不好,多听听王菲的新歌,放下你的不忿,明天会更好。

评分

参与人数 11积分 +46 收起 理由
RAMBLER + 6 感谢分享
yeshu + 3 感谢分享
natspec + 2 有共鸣

查看全部评分

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 08:00 来自手机 |显示全部楼层
此文章由 挑灯亮剑 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 挑灯亮剑 所有!转贴必须注明作者、出处和本声明,并保持内容完整
deepseek又不是新闻app,谁用AI看新闻。。。。

发表于 2025-1-30 08:30 来自手机 |显示全部楼层
此文章由 ryu2011 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ryu2011 所有!转贴必须注明作者、出处和本声明,并保持内容完整
好不好用,哪个模型好用,用户会给出答案。现在的这种新闻,要么捧,要么踩,看看就好。

发表于 2025-1-30 08:36 |显示全部楼层
此文章由 laikai000 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 laikai000 所有!转贴必须注明作者、出处和本声明,并保持内容完整
好用就行
Advertisement
Advertisement

发表于 2025-1-30 08:42 来自手机 |显示全部楼层
此文章由 dragonballz 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dragonballz 所有!转贴必须注明作者、出处和本声明,并保持内容完整
创建人是搞对冲的就很搞笑了,Deepshit本来就是规避很多违禁词还套娃ChatGPT搞出来的,为了省算力它应该简化了许多条件来达到所谓优化,这样必然会在很复杂的局面下误判或出错。让子弹再多飞一会,看看到底是不是汉芯2.0一类骗天朝政府拨款的东东

发表于 2025-1-30 08:49 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 凯瑟琳琳 于 2025-1-30 08:57 编辑

不知道国外测评有没有获得‘国足成就要感谢党’这种回答,毕竟这逻辑离谱得其他AI自己都不一定编得出来。

我上周把这个回答贴出来后,足迹立马有人站出来说:‘不准测试新闻,只能测试数理化。’按足迹的标准来,我就拿了一道ChatGPT出的数学题测试DeepSeek,结果DeepSeek直接无限循环,最后愣是把自己给整宕机了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-30 08:51 |显示全部楼层
此文章由 liangyu42087 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 liangyu42087 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-30 07:52
辛苦了,如果可以这篇技术文一起带上的话 :)

Open AI最开始也是从网上抓的数据。。。。

意思就是只许防火不许电灯

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +2 收起 理由
APSTNDP + 2 打脸太快了!

查看全部评分

发表于 2025-1-30 08:54 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-30 07:58
阿斯已经翻译了。

再说一遍。你太注重意识形态了,与时并进吧。

小红妹,我没有什么意识形态,我只是想告诉大家:历史很可能是真的回重复的,“摆脱愚昧”不容易,我们一起努力:)

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-30 08:55 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-30 07:52
辛苦了,如果可以这篇技术文一起带上的话 :)

回旋镖来的速度比想象中还快。现在国内对DeepSeek的态度已经开始降温,宣传力度明显收了回来,画风一转,重点强调‘技术还在进步’。
Advertisement
Advertisement

发表于 2025-1-30 09:04 来自手机 |显示全部楼层
此文章由 XyZ010 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 XyZ010 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-30 08:54
小红妹,我没有什么意识形态,我只是想告诉大家:历史很可能是真的回重复的,“摆脱愚昧”不容易,我们一 ...

就算有意识形态也没问题,意识形态肯定会影响科技发展人文发展,有些环境想创新甚至持续创新,非常难!我对此并不乐观

评分

参与人数 1积分 +3 收起 理由
luluau + 3 我很赞同

查看全部评分

发表于 2025-1-30 09:27 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 08:55
回旋镖来的速度比想象中还快。现在国内对DeepSeek的态度已经开始降温,宣传力度明显收了回来,画风一转, ...


在大年三十【大力宣传、让全国人民过个好年】之后带来的反思。


DS有没有蒸馏GPT美国那边还在调查。我个人觉得中国公司技术上进步肯定是有,但【远远没有】到达可以“捧杀”的地步。

而且那些芯片来得不明不白,大千世界已经有路透社的新闻,这里很多同学崇拜的马斯克也认为肯定。这会是一个大问题,期待后续的新闻。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-30 09:31 |显示全部楼层
此文章由 清风不写字01 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 清风不写字01 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cwb1000 发表于 2025-1-30 06:42
这是搞科研和促进生产力的
哪怕新闻准确率为零有毛关系?政治挂帅

总得找出些缺点啊,要不美国人的面子往哪搁。

评分

参与人数 1积分 +3 收起 理由
cwb1000 + 3 感谢分享

查看全部评分

发表于 2025-1-30 09:47 |显示全部楼层
此文章由 absd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 absd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有没有可能新闻机构报的是假新闻,DS报的才是真实的新闻

发表于 2025-1-30 09:50 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
absd 发表于 2025-1-30 09:47
有没有可能新闻机构报的是假新闻,DS报的才是真实的新闻

我觉得不大可能

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Advertisement
Advertisement

发表于 2025-1-30 09:54 来自手机 |显示全部楼层
此文章由 JHHHS 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 JHHHS 所有!转贴必须注明作者、出处和本声明,并保持内容完整
觉得 Deepseek 答不出来的时候就就不知道,而 ChatGPT 一本正经地胡说一个答案
头像被屏蔽

皮靴族

发表于 2025-1-30 09:55 |显示全部楼层
提示: 该帖被管理员或版主屏蔽

发表于 2025-1-30 09:59 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-30 07:58
阿斯已经翻译了。

再说一遍。你太注重意识形态了,与时并进吧。

阿丝很多时候真是神补刀,报道阿里又超越的那篇差点儿没让我笑喷
以有涯随无涯,殆已

发表于 2025-1-30 09:59 来自手机 |显示全部楼层
此文章由 Natio 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Natio 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-30 07:58
阿斯已经翻译了。

再说一遍。你太注重意识形态了,与时并进吧。

一个要装睡的人你是怎么都叫不醒的,他们就是传说中的“不醒人士”,哈哈哈哈哈哈哈。

评分

参与人数 4积分 +11 收起 理由
来自北方 + 3 感谢分享
welshzh + 4 你太有才了
fly02 + 2

查看全部评分

夫物芸芸,各复归其根,归根曰静,是为复命,复命曰常,知常曰明。

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部