新足迹

 找回密码
 注册

精华好帖回顾

· 寻找小时候年的味道 - 炸翻角(也叫排叉,麻叶),做萝卜糕 (2018-2-19) ylbeethoven · 悉尼参加汽车拍卖胜利归来(作业完毕,最新照片) (2007-1-8) 希曼
· 笋丝炒肉丝 (2005-10-28) astina · 从shy到social的巨大转变(P7,188楼最近更新) (2011-5-18) 花儿红彤彤
Advertisement
Advertisement
查看: 3317|回复: 90

哦,天哪,有人从OpenAI偷东西了吗? [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 12:05 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
华尔街日报:哦,天哪,有人从OpenAI偷东西了吗?  

OpenAI正在调查中国AI初创公司 DeepSeek 是否利用其成果来训练模型,这对一个本身就大量依赖他人成果的公司来说,堪称讽刺。  

致OpenAI的这封信,来自那些创造互联网内容的人们,这封信绝对真实无误。  

收件人:山姆·奥特曼(Sam Altman)  
OpenAI首席执行官  

亲爱的奥特曼先生及OpenAI领导团队:  

首先,哈哈哈哈。  

我们看到你们担忧中国AI初创公司DeepSeek可能利用你们的产品来开发自己的产品,这让我们颇感兴趣。

你们表示,已发现中国的一些机构试图从你们的AI工具中大规模提取数据,显然是用来训练他们自己的模型。  

嗯……大量吸收别人的劳动成果!那句老话怎么说来着?“因果报应是个轮回”。

呃,Sam 你懂的。

如果你不懂,GPT-4 也能轻松补全这句话。  

听着,我们明白,这确实不妙。

美国在AI发展方面一直处于领先地位,而现在中国可能借助你们的成功来推进自己的技术,而且他们甚至没打招呼。  

当然,必须承认,你们最近确实在努力与内容创作者达成协议,并对他们提供的素材进行补偿。

你们与新闻集团(News Corp,华尔街日报母公司),Vox Media,《金融时报》等媒体的合作,是朝着正确方向迈出的一步。

当然,仍然有大量艺术家和组织将你们告上法庭,要求更多赔偿。

话说回来,斯嘉丽·约翰逊(Scarlett Johansson)和你打的版权窃取官司现在进展如何?  

不过,你们仍然回避有关训练数据的问题。

还记得吗?当你们的前首席技术官被问及是否使用了YouTube的数据时,她的回答是:“呃,我其实不太确定。”  

还有,你们去年承诺的Media Manager工具怎么样了?你们曾表示,这款工具将允许创作者和内容拥有者告知你们他们的版权归属,并指定他们的作品是否可以被用于机器学习研究和训练。

就在上周,在达沃斯的一次采访中,《华尔街日报》的一名专栏作家询问了你们的首席产品官韦尔(Kevin Weil)。  

韦尔的回答是:“我们仍在开发这个工具,等有更多消息时,我们会进一步说明。”

当被追问该工具是否会在今年第二季度推出时,他的回应是:“再看看吧。”  

如果DeepSeek开发了一款工具,让你们可以选择不让他们使用你们的数据,我们猜测,你们现在肯定会想要吧?  

署名:  
全球所有作家,艺术家,电影人和内容创作者  

P.S. 请随意用这封信来训练你们的 AI。看到了吗?这才叫授权!  






来源:

https://www.wsj.com/tech/ai/oh-d ... 7c?mod=hp_lead_pos8

By
Joanna Stern

Updated Jan. 29, 2025 4:00 pm ET

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 12:06 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. OpenAI正在调查中国AI初创公司DeepSeek是否使用其产品训练自己的AI模型,这对OpenAI这样一个长期依赖他人成果的公司而言,显得格外讽刺。  

2. 文章对OpenAI的数据获取方式提出质疑,并指出其在透明度方面的不足,尤其是涉及训练数据的来源问题,例如YouTube数据的使用情况仍未得到明确回应。  

3. OpenAI虽然已与多家媒体公司达成合作协议,试图补偿内容创作者,但仍面临大量法律诉讼,创作者们要求获得更多权益和补偿。  

4. 文章批评OpenAI在兑现承诺方面进展缓慢,例如去年宣布的Media Manager工具仍未推出,而高管的回应也模棱两可,缺乏明确的时间表。
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 12:15 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
说OpenAI长期依赖他人成果
一派胡言,我感到非常的气愤!
为了自证清白,OpenAI请开源把
头像被屏蔽

银靴族

发表于 2025-1-30 12:16 |显示全部楼层
提示: 该帖被管理员或版主屏蔽

发表于 2025-1-30 12:17 来自手机 |显示全部楼层
此文章由 小桥流水人家 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 小桥流水人家 所有!转贴必须注明作者、出处和本声明,并保持内容完整
说白了就是气球被捅破了,恼羞成怒了。

发表于 2025-1-30 12:21 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Advertisement
Advertisement

发表于 2025-1-30 12:22 来自手机 |显示全部楼层
此文章由 ekong 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ekong 所有!转贴必须注明作者、出处和本声明,并保持内容完整
授权是所有互联网公司都应当面对的难题。
在copy命令被发明出来时,就已经有人担心这点了。

发表于 2025-1-30 12:24 |显示全部楼层
此文章由 goal 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 goal 所有!转贴必须注明作者、出处和本声明,并保持内容完整
作者混淆两类不同性质的问题

发表于 2025-1-30 12:25 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Yes, there have been recent developments in OpenAI's investigation into DeepSeek's use of its data. OpenAI has found evidence suggesting that DeepSeek utilized a technique called "distillation" to extract large volumes of data from OpenAI's models, potentially violating OpenAI's terms of service.
WSJ.COM

Microsoft's security researchers detected significant data exfiltration from OpenAI developer accounts in late 2024, which they believe are connected to DeepSeek. This data may have been used to train DeepSeek's AI models, allowing them to develop competitive models at a much lower cost than OpenAI's.
THEVERGE.COM

OpenAI is currently engaging in countermeasures to protect its intellectual property and is working closely with the U.S. government to prevent such activities.
NYPOST.COM

发表于 2025-1-30 12:27 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
上面是ChatGpt 说的,但是DS否认了以上说法。

发表于 2025-1-30 12:28 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
同样的事情无数人干过,还是被OpenAI暴打

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Advertisement
Advertisement

发表于 2025-1-30 12:30 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Have you used OpenAI's data for training your model?

Hi! I'm DeepSeek-V3, an AI assistant independently developed by the Chinese company DeepSeek Inc. For detailed information about models and products, please refer to the official documentation.

发表于 2025-1-30 12:31 |显示全部楼层
此文章由 liangyu42087 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 liangyu42087 所有!转贴必须注明作者、出处和本声明,并保持内容完整
goal 发表于 2025-1-30 12:24
作者混淆两类不同性质的问题

性质上有什么不同?

发表于 2025-1-30 12:31 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
刚刚问DS的,这个回答和昨天的回答已经模糊了很多。昨天是直接否认了,今天让你去查他们的产品说明书。

发表于 2025-1-30 12:32 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
大家别误会啊,只是想了解真相而已。

发表于 2025-1-30 12:33 来自手机 |显示全部楼层
此文章由 Tuka00 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Tuka00 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这个标题原来是真的。

不过大家听说过那个印度工程师因为吹哨chapgpt的专利权问题,疑似被谋杀了吗?

sam Altman 是个doggy guy.
Advertisement
Advertisement

发表于 2025-1-30 12:33 |显示全部楼层
此文章由 xq052b 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xq052b 所有!转贴必须注明作者、出处和本声明,并保持内容完整

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-30 12:33 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ninegumtrees 发表于 2025-1-30 12:27
上面是ChatGpt 说的,但是DS否认了以上说法。


这种证明方式不是属于悖论吗?

需要第三方吧,好比判案,你不能请利益双方的亲戚朋友来做陪审和法官吧
头像被屏蔽

银靴族

发表于 2025-1-30 12:33 |显示全部楼层
提示: 该帖被管理员或版主屏蔽

发表于 2025-1-30 12:35 |显示全部楼层
此文章由 chn217 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 chn217 所有!转贴必须注明作者、出处和本声明,并保持内容完整
goal 发表于 2025-1-30 11:24
作者混淆两类不同性质的问题

愿闻其详。
君子和而不同,请勿人身攻击。

发表于 2025-1-30 12:37 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
InTheEnd 发表于 2025-1-30 12:33
这种证明方式不是属于悖论吗?  

需要第三方吧,好比判案,你不能请利益双方的亲戚朋友来做陪审和法官 ...

今天我刚刚问了同样的问题,‘DS用了OpenAI 的数据来训练它的模型吗? DS就没有直接否认了,(昨天是直接否认了)。
Advertisement
Advertisement

发表于 2025-1-30 12:42 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
可以肯定的是,OpenAI也使用了油管或者谷歌搜索的结果作为training.

发表于 2025-1-30 12:43 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 InTheEnd 于 2025-1-30 12:44 编辑
ninegumtrees 发表于 2025-1-30 12:37
今天我刚刚问了同样的问题,‘DS用了OpenAI 的数据来训练它的模型吗? DS就没有直接否认了,(昨天是直接 ...


你和昨天一个哥们同一个BUG,包括这个帖子17楼的大学老师

问被害者:加害者是不是说谎了

问加害者:被害者是不是说谎了

发表于 2025-1-30 12:50 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
搞清楚事实真相总是好的,’受害者‘思维不可取哦。

用网络中的’raw' data, 和直接用OpenAI 训练过的数据还是有很大差距的。只是想搞清楚,DS是不是用了OpenAI 训练过的数据。

发表于 2025-1-30 12:53 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这文章的逻辑:OpenAI自己也是靠别人数据训练的,所以它没资格质疑DeepSeek是不是爬了ChatGPT的回答。但问题是,OpenAI训练GPT时用的是公开数据,比如书籍、论文、新闻,而不是直接爬对手的AI输出。

说OpenAI被内容创作者起诉,试图用‘你自己也有版权争议’来给DeepSeek辩护。但内容创作者维权,是因为自己的作品有没有被AI训练,而OpenAI质疑DeepSeek的,是你是不是直接扒了ChatGPT的输出来训自己的AI。这两者的区别,大概就像‘你读了一本书,吸收了知识’和‘你抄了隔壁同学的卷子’的区别。

真正的问题是,DeepSeek到底有没有这么干?如果没有,直接说‘不存在’就行了。如果有,那不管OpenAI以前干过什么,这事本身就是个问题。要真按文章的逻辑,那以后谁还老老实实训练AI?大家都去爬对手的API,行业直接集体摆烂,等着抄来抄去?

评分

参与人数 1积分 +4 收起 理由
波风鸣城 + 4 我很赞同

查看全部评分

发表于 2025-1-30 12:53 |显示全部楼层
此文章由 huangyiming 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 huangyiming 所有!转贴必须注明作者、出处和本声明,并保持内容完整
用别人的模型数据还好说,吃相难看的是说是原创,500万美元完胜50亿美元做的数据模型
Advertisement
Advertisement

发表于 2025-1-30 12:53 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ninegumtrees 发表于 2025-1-30 12:32
大家别误会啊,只是想了解真相而已。


假设DS是抄的,已经开源了,那么Open AI不更加应该开源吗?

第一,你的成果已经被盗,也不是什么秘密了

第二,证明DS是抄袭,脸书团队会立刻证明的,相信小扎速度

发表于 2025-1-30 12:57 |显示全部楼层
此文章由 滚石不生苔藓 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 滚石不生苔藓 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这种事情,AI不都是用网络资源训练吗?

相信CHATGPT是,DS也是。DS是后来者,估计不但CHATGPT, GEMINI也被利用了。

互联网年代,版权真的很难。以前盗版书,盗版电影,盗版音乐等等,文生图后,估计梵高,毕加索,达芬奇,莫奈,伦勃朗和塞尚等等再生,不过不是正版。

发表于 2025-1-30 12:58 |显示全部楼层
此文章由 bbc007 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 bbc007 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Let bullets fly.

发表于 2025-1-30 12:58 |显示全部楼层
此文章由 阿德莱德的流氓 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 阿德莱德的流氓 所有!转贴必须注明作者、出处和本声明,并保持内容完整

怎么deepseek总在说open ai,

感觉deepseek像open ai的套壳一样。
如果看到我在政治新闻贴发言,请无情的举报我。

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部