新足迹

 找回密码
 注册

精华好帖回顾

· NSW州政府的Housing Delivery Program规划细节披露及讨论 (2013-3-18) Martin_2F · Master Chef 终极挑战 - 决胜局甜品 Guava Snow Egg (2010-8-9) 大胃
· 回国三年之感悟-1: 大上海 (2011-8-31) 唐韵秦风 · 红油红油红油红油红油红油红油红油红油!!! (2011-4-4) rongerchen
Advertisement
Advertisement
楼主:chainray

[IT] 有用R做数据分析的吗? [复制链接]

发表于 2015-9-7 15:51 |显示全部楼层
此文章由 vvuuww 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 vvuuww 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chainray 发表于 2015-9-7 15:46
我低学历

好吧。。。我好像见过你和炸猪互相说对方是烧鸭。。。看来你们两个都不是了。。。
Advertisement
Advertisement

发表于 2015-9-7 20:39 |显示全部楼层
此文章由 ressul 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ressul 所有!转贴必须注明作者、出处和本声明,并保持内容完整
数据可视化Tableau更好用更快

发表于 2015-9-7 21:06 |显示全部楼层
此文章由 RodTemperton 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 RodTemperton 所有!转贴必须注明作者、出处和本声明,并保持内容完整
kikixy1983 发表于 2015-9-7 11:33
This is a controversial topic and there are a lot of debates online. I try to be objective.

I ass ...

Hi mate, I'm doing some subjects in uni, I'm not sure whether some subjects are useful for Data Science
1. Stochastic Model/Stochastic Process
2. Differential Equation
3. Mathematical Statistics
4. Multivariate Statistics

Could you plz give me some suggestions? Thank you very much

发表于 2015-9-7 21:23 |显示全部楼层
此文章由 collot 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 collot 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我们公司一样已经有SAS EG, 偏偏老板想再上个R或者其它第三方的. Team里面一群连VBA, SQL都用不好的熊队友,真的很无悟。
用了下R,感觉编程语言格式和用法挺难适应的,最困惑的就是无数的第三方package,还有就是难懂的help system

发表于 2015-9-7 22:13 |显示全部楼层
此文章由 kikixy1983 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kikixy1983 所有!转贴必须注明作者、出处和本声明,并保持内容完整
RodTemperton 发表于 2015-9-7 21:06
Hi mate, I'm doing some subjects in uni, I'm not sure whether some subjects are useful for Data Sc ...

Mate, IMHO

1. Stochastic Model/Stochastic Process and 2. Differential Equation are essential if you want to work as a quantitative analyst in finance industry. It will be helpful for data science but i don't it is essential.

4. Multivariate Statistics will be very helpful if you are interested in data science.

3. Mathematical Statistics will be essential for whatever you want to do as long as it is related to data.

Both quant and data scientist are prestigious professionals. Quant is perhaps 80% math + 20% CS. Data scientist is perhaps 50% math + 50% CS.

退役斑竹 2017年度勋章

发表于 2015-9-7 22:14 来自手机 |显示全部楼层
此文章由 slau1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 slau1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我是來看看回复的
Advertisement
Advertisement

发表于 2015-9-7 23:38 来自手机 |显示全部楼层
此文章由 浮云马 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 浮云马 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chainray 发表于 2015-9-7 09:12
问题是現在有人提议把ms bi换成R

类似的故事还有:

TFS过时了,我们改用git吧
monolethic程序太多问题了,我们改microservice吧
OOP过时了,我们换functional吧
别用windows了,统一换mac吧

有些建议实行起来效果不错,有些不make sense,但不去试试你永远不知道

发表于 2015-9-8 01:48 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chainray 发表于 2015-9-6 20:27
哦。。明白了,这个用SSRS配合SQL可以做出来。。。

R还有什么牛逼功能么 ...

如果你想修个脚指甲,用把菜刀合适不?

同理,我想一分钟内发布一个数据报表,其中有数据的各种统计信息,比如中位数,分位数,想拟合一条回归曲线,又或者各个变量先做个转化再plot,你认为ssrs可以做么?

ssrs的核心是sql,sql有几个内置函数?理论上,r比sql强大的倍数基本就是r的函数数量除以sql,而前者是无限的,因此r的功能远大于sql

只是,对于一般的应用,sql已经足够了,r里面的一些包,更多是给有学术背景的人用的,因此仅从数据可视化这点讲,r唯一的优势就是:快速

r的优势更多是基于利用统计来做的应用,举个例子,我设计个抽奖应用,每个客户有不同的获奖概率,让你随机选3个,如果你用sql,如何基于不同权重抽样?而r只需要一个函数就能解决这样的问题

r并不牛逼,r更多是轻量级的数据工具,往往实现一些轻量数据前提下的应用或者数据探索工作,它只是数据计算平台中的第一个阶段,也就是单机下的一个数据工具,和sas,spss,matlab数据一个阵线的

往后面还有两个阶段,主要解决大数据量下的问题,但sql技术不属于计算平台这个领域的,还要偏底层些

评分

参与人数 2积分 +6 收起 理由
ggt20 + 3 感谢分享
gzrain + 3 感谢分享

查看全部评分

发表于 2015-9-8 01:53 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
RodTemperton 发表于 2015-9-7 21:06
Hi mate, I'm doing some subjects in uni, I'm not sure whether some subjects are useful for Data Sc ...

1 学好回归,尤其多元回归,细节是变量转化和选择
2 统计知识需要扎实,尤其各种test
3多看data mining算法

其他就是多编程

发表于 2015-9-8 02:00 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ressul 发表于 2015-9-7 20:39
数据可视化Tableau更好用更快

tableau更适合商业大公司,可以基本等同于excel的web版本

r的优势是免费外加package多,比较适合轻量应用,快速迭代

我个人还是比较推崇sql+tableau的模式,外加使用r做探索性已经一些轻量统计模型,个人讨厌sas,sas太笨重了,又贵,我觉得会退出历史舞台的

总之,硅谷玩r,纽约玩sas,具体原因大家自己想吧

发表于 2015-9-9 17:04 |显示全部楼层
此文章由 xtian0327 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xtian0327 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2015-9-8 01:53
1 学好回归,尤其多元回归,细节是变量转化和选择
2 统计知识需要扎实,尤其各种test
3多看data mining算 ...

歪个楼,请教一下各位高人:
我想换行往DA上转, 但只有一些统计基础用过点SPSS,请问如果自学我应该如何入手呢?
众多软件中学好哪个能帮助我尽快找到相关工作?
Advertisement
Advertisement

发表于 2015-9-9 19:01 来自手机 |显示全部楼层
此文章由 tryitagain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tryitagain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
R是免费的,而且每个人都可以写package,但是坏处是质量控制不好做。万一出点差错都找不到人负责。所以从风险角度讲R是有短板的。

发表于 2015-9-9 19:03 来自手机 |显示全部楼层
此文章由 tryitagain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tryitagain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
xtian0327 发表于 2015-9-9 17:04
歪个楼,请教一下各位高人:
我想换行往DA上转, 但只有一些统计基础用过点SPSS,请问如果自学我应该如何 ...

SAS, sql, excel

发表于 2015-9-9 19:24 |显示全部楼层
此文章由 咕咕噜噜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 咕咕噜噜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
高手太多,我这个刚入门的就帮顶顶吧。 对于我来说, 免费的资源是R的最大吸引点。

发表于 2015-9-9 20:05 来自手机 |显示全部楼层
此文章由 tryitagain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tryitagain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
collot 发表于 2015-9-7 21:23
我们公司一样已经有SAS EG, 偏偏老板想再上个R或者其它第三方的. Team里面一群连VBA, SQL都用不好的熊队友 ...

R studio下一个看看,界面可以的,出结果用markdown/knit看看

发表于 2015-9-11 00:14 |显示全部楼层
此文章由 organicechan 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 organicechan 所有!转贴必须注明作者、出处和本声明,并保持内容完整
R 有优点,也有缺点~~~找R分析员么?
Advertisement
Advertisement

发表于 2015-9-11 00:28 |显示全部楼层
此文章由 deepnorth2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 deepnorth2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我用,你有什么问题吗?

发表于 2015-9-11 09:59 |显示全部楼层
此文章由 test1ok 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 test1ok 所有!转贴必须注明作者、出处和本声明,并保持内容完整
R has advanced data processing packages etc.

Graph? programmed graph is good in R.

If you have SAS then you probably covered what R can do.

There are scenario that R will be more efficient to develop.

发表于 2015-9-11 20:16 |显示全部楼层
此文章由 mi_tu2010 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mi_tu2010 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 mi_tu2010 于 2015-9-11 20:22 编辑

R很强大,统计,可视化等,简单看了一下,对概率统计知识要求很高,暂时放弃了
最近在看可视化的东西,觉得d3不错,

发表于 2015-9-11 23:28 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
R用起来还是很上手的,我也刚开始,最近要上个big data的项目

发表于 2015-9-11 23:33 |显示全部楼层
此文章由 chainray 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 chainray 所有!转贴必须注明作者、出处和本声明,并保持内容完整
libai0915 发表于 2015-9-11 23:28
R用起来还是很上手的,我也刚开始,最近要上个big data的项目

具体用R做什么?
禱告,因为我渺小。。。。
Advertisement
Advertisement

发表于 2015-9-12 21:33 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
分析病人过去15年的数据

发表于 2015-9-12 22:10 |显示全部楼层
此文章由 chainray 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 chainray 所有!转贴必须注明作者、出处和本声明,并保持内容完整
libai0915 发表于 2015-9-12 21:33
分析病人过去15年的数据

能举个栗子吗?比如用R的什么功能,采集的样本?
禱告,因为我渺小。。。。

发表于 2015-9-12 22:35 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我还没有开始项目呢 现在在恶补R呢,项目要到下下周开始
到时候我再来给你更新

发表于 2015-9-12 23:06 |显示全部楼层
此文章由 Janet 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Janet 所有!转贴必须注明作者、出处和本声明,并保持内容完整
libai0915 发表于 2015-9-12 21:33
分析病人过去15年的数据

类似的数据分析, 我们用SAS

发表于 2015-9-12 23:11 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2015-9-12 23:06
类似的数据分析, 我们用SAS

有没有什么经验何以分享一下?谢谢啦
Advertisement
Advertisement

发表于 2015-9-12 23:14 |显示全部楼层
此文章由 Janet 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Janet 所有!转贴必须注明作者、出处和本声明,并保持内容完整
libai0915 发表于 2015-9-12 23:11
有没有什么经验何以分享一下?谢谢啦

如果有大量的历史数据, 一般会做longitudinal analysis, pathways analysis.

发表于 2015-9-12 23:23 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2015-9-12 23:14
如果有大量的历史数据, 一般会做longitudinal analysis, pathways analysis.

哦 谢谢了 记下来了,

我们这个是烧伤病人过去15年的数据,从医院统计来的,只知道这么多 还没有拿到需求 所以不知道应该如何去挖掘
头像被屏蔽

禁止发言

发表于 2015-9-13 00:43 |显示全部楼层
此文章由 tyler_kwok 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tyler_kwok 所有!转贴必须注明作者、出处和本声明,并保持内容完整
看到提起tableau我很高兴

发表于 2015-12-21 22:42 |显示全部楼层
此文章由 whoisit 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whoisit 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2015-9-8 02:53
1 学好回归,尤其多元回归,细节是变量转化和选择
2 统计知识需要扎实,尤其各种test
3多看data mining算 ...

您觉得未来从事Data Scince的话硕士读统计好还是CS/IT好?数学方面的知识需不需要学到很高深的比如Stochastic Process, Real Analysis, measure theoretic probability等等,多谢指教

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部