新足迹

 找回密码
 注册

精华好帖回顾

· 周末Plasti Dip - GOLF R (2014-5-26) anleizhang · 女生的旅行のlangkawi兰卡威(多图,真人)-坑已填! (2011-9-25) 舞美拉
· 买房,装修的一点心得(图片已上) (2008-1-10) 小李飞刀 · 预告一下。。。演出开始。糯米排骨照片都在第2页。 (2007-9-6) 美讶
Advertisement
Advertisement
查看: 3376|回复: 42

技术转贴:在整个互联网中,成人网站有多大? [复制链接]

发表于 2013-5-14 15:14 |显示全部楼层
此文章由 鱼羊鲜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 鱼羊鲜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 鱼羊鲜 于 2013-5-14 14:17 编辑

上网之人,多少都会接触过成人网站。这是一个举世公认的事实。

不过这是一个难以洞察的领域,因为相关数据少之又少。我们知道成人网站都是那些在互联网上有着超高流量的网站。根据 Google DoubleClick 的 Ad Planner 服务(通过cookie跟踪网民)显示,全球 Top 500 网站中,就有数十个成人网站。全球最大的色情网站 Xvideos 每月网页浏览量(Page Views,PV)高达 44 亿,是 CNN 或 ESPN 新闻网站的 3 倍,是 Reddit 的 2 倍。LiveJasmin 也不小。除了 Google 和 Facebook 等大站,其他网站在YouPorn、Tube8 和 PornHub 面前都是小巫见大巫。

虽然网页浏览量是一个很好的起始点,但它们仅告诉我们某些色情网站比某些非色情网站要受欢迎。40亿的PV,听起来很多,但当我们把那些X站用户实际在做的事考虑进来,成人网站的大小和规模就有点明朗了。


规模

色情网站和非色情网站的主页区别是访客的平均停留时间。诸如 Engadget 等新闻网站的平均停留时间是 3 – 6 分钟,大约是是阅读 1 – 2 篇文章。然而色情网站的停留时间,大约是在 15 – 20 分钟。

大部分网站的内容主要是文本和图像,而成人大站则是视频。ExtremeTech 首页完全加载大约是几兆数据,打开一篇文章,大约是500kb数据。访问色情网站,假设是打开一个 480×200 低分辨率的视频,每秒传输 100 kb 数据。15 分钟的话,那就大约是 90 MB 数据了。

Xvideos 每月有 3.5 亿访问次数,乘以 90 MB,那就每月传输大约 29 PB 数据,也就是每秒传送数据约 50 GB。做个对比,你家网络连接可能每秒传送两兆(2 MB),Xvideos 是你家的 25,000 倍。

简而言之,色情网站是在处理天文数字级别的数据。在原始带宽(Raw Bandwidth)方面,能与之匹敌的网站,也就只有 YouTube 或 Hulu,而 YouPorn 却又是 Hulu 的 6 倍。


基础设施

就支持视频所需的资源,数据存储器、CPU 周期、I/O 和带宽,远超过文本和图像所需要的资源。

当然了,虽然每个网站的情况又不一样了,但大部分成人站点都有 50 至 200 TB 的成人资料。对一个网站来说,这是个大数目(Google、Facebook、Blogger 和 Youtube 之流存储的数据比这还要多),好在现在 2 TB 的硬盘便宜。

CPU 周期和 I/O 会影响视频流和 PV 数量。首先,色情网站要提供动态、可搜索的海量视频数据库,然后点播视频时,从硬盘读取文件,再网络上传输。如果你有过在局域网传送大量大文件的经历,你就会知道网络系统的压力有多大了。

硬件设备情况,实际上我们几乎无法知晓,因为色情网站也没公布过。虽然如此,但我们讨论的大型色情网站会有四核服务器、千兆交换机、负载均衡器。在 软件方面,大部分大型色情网站都会使用超高吞吐量的数据库(比如 Redis )来存储和提供视频,还有轻量级的 HTTP 服务器(比如 Nginx )。

最后说带宽。还是以 Xvideos 为例(基于 Ad Planner 的数据估测),大型色情网站必须有足够的连通性(connectivity)来支撑每秒 50 GB(400Gbps )。这还只是平均传输速率。在高峰期间,Xvideos 或许要 1,000Gbps  (1Tbps) ,或更高 。在伦敦和纽约直接的连通性也才 15Tbps。

有很多方法来处理高流量:自己搞个数据中心,或者去大数据中心租赁几排架的服务器,或者使用诸如 Amazon AWS 和 Microsoft Azure 之类的云服务。


真实案例

YouPorn 是全球第二大的色情网站,足够提供研究数据。另外要说一下,DoubleClick  的 Ad Planner 中的估测数据比实际数据要低很多的。

YouPorn 有“超过 100 TB 的干货”,每天网页浏览量超过 1 亿。总而言,这相当于每天传送 950 TB 数据(大部分都是视频流),每月大约传送 29 PB。Xvideos 肯定不止 28 PB 这个估测值了,它可能是每月 35 – 40 TB。

在高峰期,YouPorn 每秒得响应 4000 个网页,相当于有每秒 100 GB 或(800 Gbps )的突发流量。这相当月每秒传送 10+ 张双层 DVD。

在软件方面,YouPorn 的主数据库是 Redis,用 MySQL 作为管理工具,用于管理和向 Redis 簇中添加数据。后端是 Perl 和 MySQL,不过在 2011 年改成了 PHP + Redis。HTTP 服务器是 Nginx,同时用 HAProxy  和 Varnish  做负载均衡。

Redis 服务器可以每秒处理 30 万请求,每小时记录下 8 – 15 GB数据,包括访客日志、行为数据等。据说 Redis 可以抗住 2 亿的日 PV。

(译注:2012年2月份,YouPorn 的技术人员 Eric Pickup 在 Google 群组宣告他们网站改用 Redis DB 后。扛住了每天1亿PV浏览量,每秒30万请求,已经坚持 2 周。Eric 还将去加拿大一个技术大会分享经验。)

令人悲伤的是,YouPorn 拒绝透露硬件设备信息。从 YouPorn 的 CDN 的 IP 地址来看,它应该没有使用云服务,应该托管在某地的大型数据中心。

互联网每天大约处理 1/2 EB 数据,相当于每秒处理 50Tb, YouPorn 的 800Gbps 这个数字,几乎就占了互联网中每秒流量的 2%。而全球有几十个和 YouPorn 规模相当的色情网站。互联网流量中色情内容占据了 30%,这个说法也就不是不现实的哦。

(译注:1 EB = 1024 PB = 1024 * 1024 TB = 1024 * 1024 * 1024 GB)

The internet really is for porn.


英文原文:extremetech,编译:伯乐在线

译文链接:http://blog.jobbole.com/12479/


评分

参与人数 6积分 +24 收起 理由
franknet + 2 感谢分享
ifan + 5 你太有才了
bulaohu + 8 感谢分享

查看全部评分

Advertisement
Advertisement

发表于 2013-5-14 15:21 |显示全部楼层
此文章由 鱼羊鲜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 鱼羊鲜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Redis+MySQL+PHP+Nginx

发表于 2013-5-14 22:19 |显示全部楼层
此文章由 商务车 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 商务车 所有!转贴必须注明作者、出处和本声明,并保持内容完整
研究的好.................深

发表于 2013-5-14 22:43 |显示全部楼层
此文章由 Dan.and.Andy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Dan.and.Andy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这种基础设施类的都是实践中拿钱堆的吧?
头像被屏蔽

禁止访问

发表于 2013-5-14 23:06 |显示全部楼层
此文章由 ggmmusst 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ggmmusst 所有!转贴必须注明作者、出处和本声明,并保持内容完整
色情网站都是要钱的。那天cnn,espn也要钱,他们也可以

发表于 2013-5-15 09:56 |显示全部楼层
此文章由 Melwater 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Melwater 所有!转贴必须注明作者、出处和本声明,并保持内容完整
前一段时间Youporn的人还出来做技术讲座。那技术杠杠的,铁道部12360应该多观摩学习。
Advertisement
Advertisement

发表于 2013-5-15 10:59 |显示全部楼层
此文章由 回头望 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 回头望 所有!转贴必须注明作者、出处和本声明,并保持内容完整
让铁道部领导每天看Youporn 3个小时学习建设网站,公家可以出钱注册用户

发表于 2013-5-15 11:08 |显示全部楼层
此文章由 brahmasky 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 brahmasky 所有!转贴必须注明作者、出处和本声明,并保持内容完整
食色,人之性也

发表于 2013-5-15 11:13 |显示全部楼层
此文章由 咋地办哩 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 咋地办哩 所有!转贴必须注明作者、出处和本声明,并保持内容完整
感谢分享
头像被屏蔽

禁止访问

发表于 2013-5-15 11:18 |显示全部楼层
此文章由 ggmmusst 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ggmmusst 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Melwater 发表于 2013-5-15 08:56
前一段时间Youporn的人还出来做技术讲座。那技术杠杠的,铁道部12360应该多观摩学习。 ...

关键的是人铁道部领导认为二奶比买票重要

发表于 2013-5-15 11:45 |显示全部楼层
此文章由 winsion 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 winsion 所有!转贴必须注明作者、出处和本声明,并保持内容完整
铁道部那个网站跟这个情况有点不同吧。色情网站的流量一直都是那么大,12360只是春运的时候流量巨大,这个究竟有什么解决方案?临时租用大量的服务器?
Advertisement
Advertisement

发表于 2013-5-15 12:30 |显示全部楼层
此文章由 鱼羊鲜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 鱼羊鲜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ggmmusst 发表于 2013-5-14 22:06
色情网站都是要钱的。那天cnn,espn也要钱,他们也可以

有免费流量,而且是很大的
头像被屏蔽

禁止访问

发表于 2013-5-15 12:35 |显示全部楼层
此文章由 ggmmusst 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ggmmusst 所有!转贴必须注明作者、出处和本声明,并保持内容完整
鱼羊鲜 发表于 2013-5-15 11:30
有免费流量,而且是很大的

呵呵,还是你强

发表于 2013-5-15 14:49 |显示全部楼层
此文章由 上班ing 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 上班ing 所有!转贴必须注明作者、出处和本声明,并保持内容完整
winsion 发表于 2013-5-15 10:45
铁道部那个网站跟这个情况有点不同吧。色情网站的流量一直都是那么大,12360只是春运的时候流量巨大,这个 ...

临时租几朵云分流嘛……

发表于 2013-5-15 14:53 |显示全部楼层
此文章由 梦子 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 梦子 所有!转贴必须注明作者、出处和本声明,并保持内容完整

发表于 2013-5-15 14:56 |显示全部楼层
此文章由 6521 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 6521 所有!转贴必须注明作者、出处和本声明,并保持内容完整
好了,YouPorn 火了,我都知道了
Advertisement
Advertisement

发表于 2013-5-15 15:26 来自手机 |显示全部楼层
此文章由 重机枪手 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 重机枪手 所有!转贴必须注明作者、出处和本声明,并保持内容完整
欧美的不知道,中文的不都是论坛性质的,发种子,不需要什么技术,框架就是足迹用的这个

发表于 2013-5-15 16:59 |显示全部楼层
此文章由 hywyh 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 hywyh 所有!转贴必须注明作者、出处和本声明,并保持内容完整
也不知道xvideos这类网站是怎样支持运营的。
看页面上的那些广告都是小商家,靠那点钱不太可能支持这么好的硬件系统吧?!

发表于 2013-5-15 17:20 |显示全部楼层
此文章由 magicmas 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 magicmas 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这怎么想是软文广告

发表于 2013-5-15 17:26 |显示全部楼层
此文章由 realfenglin 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 realfenglin 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这小广告,要删啊。哈哈

不管别人,反正我是试了试

发表于 2013-5-15 18:58 |显示全部楼层
此文章由 笨笨人 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 笨笨人 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这帖地意识是??? 科仆啊
Advertisement
Advertisement
头像被屏蔽

禁止访问

发表于 2013-5-15 19:01 |显示全部楼层
此文章由 闷烧锅 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 闷烧锅 所有!转贴必须注明作者、出处和本声明,并保持内容完整
色情网站的停留时间,大约是在 15 – 20 分钟


这么短
头像被屏蔽

禁止访问

发表于 2013-5-15 19:03 |显示全部楼层
此文章由 闷烧锅 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 闷烧锅 所有!转贴必须注明作者、出处和本声明,并保持内容完整
还好出名的porn star就那么几个,数据库的压力应该不大
头像被屏蔽

禁止发言

发表于 2013-5-15 19:40 |显示全部楼层
此文章由 future2521 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 future2521 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这贴要火啊。。。

发表于 2013-5-15 19:51 来自手机 |显示全部楼层
此文章由 bluesfans 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 bluesfans 所有!转贴必须注明作者、出处和本声明,并保持内容完整
不是很明白,即便主数据库用redis,video啥的大文件还是放在文件存储系统中,那说明youporn用的海量文件存储是真正牛的地方吧。并发不用像订票这类应用要对数据进行锁操作,铁道部也没啥可借鉴的。
头像被屏蔽

禁止访问

发表于 2013-5-15 19:58 |显示全部楼层
此文章由 闷烧锅 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 闷烧锅 所有!转贴必须注明作者、出处和本声明,并保持内容完整
bluesfans 发表于 2013-5-15 18:51
不是很明白,即便主数据库用redis,video啥的大文件还是放在文件存储系统中,那说明youporn用的海量文件存 ...

海量应该是指数据量,文件数量应该不算特别多。主要是对存储和网络的压力
Advertisement
Advertisement

发表于 2013-5-15 20:06 |显示全部楼层
此文章由 lingyang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lingyang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
论坛里有没有做这个行业的solution architect啊,呵呵,

发表于 2013-5-15 20:40 来自手机 |显示全部楼层
此文章由 bluesfans 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 bluesfans 所有!转贴必须注明作者、出处和本声明,并保持内容完整
闷烧锅 发表于 2013-5-15 18:58
海量应该是指数据量,文件数量应该不算特别多。主要是对存储和网络的压力 ...

假设带宽没问题,内存拿来存视频存页面缓存,那完全扛得住高并发呀,但问题是服务器当机有丢数据的风险

发表于 2013-5-15 20:45 |显示全部楼层
此文章由 Melwater 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Melwater 所有!转贴必须注明作者、出处和本声明,并保持内容完整
上统计数据:
100 million page views a day in 2008
300K queries / sec
100 Gb/s - 3 full  DVDs streamed every second
Logs 8GB-15GB of data per hour

15G LOGS! 各位老大都在log里面吧,扫黄的时候都跑不掉

发表于 2013-5-15 20:53 |显示全部楼层
此文章由 Melwater 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Melwater 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Stack

Originally written in Perl (Catalyst application with a DBIx::Class backend)
Now PHP-FPM (FastCGI Process Manager)  - is an alternative PHP FastCGI
HAProxy
ActiveMQ
Varnish
Redis
Nginx
MySQL
Syslog-ng
Symfony2

都是高级货

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部