新足迹

 找回密码
 注册

精华好帖回顾

· 更新完毕。大阪奈良匆匆一游 - 奈良 (2015-1-6) 没有袖子的汗衫 · 盘点一下二手柴油X5四年的ownership (2019-2-6) Simonjo
· 白羊座博士妈咪OZ国历险记----持续记录中。。。。 (2014-1-20) nikinotnike · 复出开篇08圣诞塔斯曼半岛历险记 (2008-12-30) clickle
Advertisement
Advertisement
楼主:hmzha2

[IT] 群里有做 data scientist的吗? [复制链接]

发表于 2015-6-30 10:36 来自手机 |显示全部楼层
此文章由 gzrain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gzrain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 gzrain 于 2015-6-30 09:41 编辑
cnnworld 发表于 2015-6-29 09:39
会R编程不难,但背后输出的数据含义,要弄懂就要有数理知识

举个例子,做个线性模型,输出会有每个参数 ...


谢谢回帖

我觉得我应该不会转去那种纯统计方面做modeling了,这样跨度太大,年纪又不小了,很难跟班科出身的竞争;

我的优势是有强programming background,做implementation 比较相对可行点;我觉得一开始做做data sanitation/ process 应该还是可以的,比如搭建整个work flow,从建server, db, import data via various source , write scripts to process / cleaning data ;这些都是我可以做的;至于建模,还是留给专业的数学家去做吧,我应该focus自己有优势的地方

现在在看coursera的data science 系列, 感觉这条course path拿来入门还是ok的; 我读完了R这门,感觉只能算是introduction, 整个series是把正常的3门课拆成9门来教

https://www.coursera.org/specialization/jhudatascience/1

想问问业内人士,觉得这个series怎么样

Advertisement
Advertisement

发表于 2015-6-30 11:45 |显示全部楼层
此文章由 rydfxs 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rydfxs 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 rydfxs 于 2015-6-30 17:23 编辑
gzrain 发表于 2015-6-30 09:36
谢谢回帖

我觉得我应该不会转去那种纯统计方面做modeling了,这样跨度太大,年纪又不小了,很难跟班科出 ...


这个课程作为入门还可以,我自己的经验这个课跟实际应用还是相差很多。你有编程经验对你会有很大帮助,你的想法我是推荐的。

因为R自己很难作为一个独立的Data product,你可以用shiny, 但是我觉得没多少人用这个。R Shiny Server 用于production 就不是免费的了。

现在我用C# + R ,你也可以用Python + R, 或者直接用Python Pandas, Numpy。原因在于工作中很简单的例子,比如你做了简单的线性回归,然后做个T检验,向Web界面输出假设检验判断结果,只用R这个没法弄。

可能SQL 2016融合R以后能好些,直接放Stored procedure里。

评分

参与人数 1积分 +3 收起 理由
gzrain + 3 感谢分享

查看全部评分

发表于 2015-7-1 03:06 |显示全部楼层
此文章由 atelier 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 atelier 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DS说白了就是有IT背景的BA,每天干的活就是写pig,mapred,hive,spark application做不同的join。当然里面的水还是很深的,有兴趣的童鞋可以上Apache看看这些open source的东东。

DS就是bigdata下的产物,在澳洲没什么发展钱途,还是去美帝吧

发表于 2015-7-9 01:42 来自手机 |显示全部楼层
此文章由 万俟密 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 万俟密 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2015-4-28 23:02
我是这个title,说几点这个职位的要求把

1. 这个职位并不高深,在美国一般是计算机或者统计系的PHD,大公 ...

偶像 正在读统计希望有天也能有这个title

发表于 2015-7-12 10:12 |显示全部楼层
此文章由 hellograce 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 hellograce 所有!转贴必须注明作者、出处和本声明,并保持内容完整
牛人

发表于 2015-7-13 02:09 |显示全部楼层
此文章由 atelier 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 atelier 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果有Date Scientist高手的话,想relocateion闯一闯的话,可以帮内推。
Advertisement
Advertisement

发表于 2015-7-13 02:12 |显示全部楼层
此文章由 mememewe 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mememewe 所有!转贴必须注明作者、出处和本声明,并保持内容完整
想读数学的phd. 请问对于data mining来说,研究的方向是数学算法是好呢, 还是统计的modelling?

发表于 2015-7-13 07:43 |显示全部楼层
此文章由 atelier 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 atelier 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mememewe 发表于 2015-7-13 01:12
想读数学的phd. 请问对于data mining来说,研究的方向是数学算法是好呢, 还是统计的modelling? ...

统计和modelling

发表于 2015-7-13 12:50 |显示全部楼层
此文章由 mememewe 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mememewe 所有!转贴必须注明作者、出处和本声明,并保持内容完整
atelier 发表于 2015-7-13 06:43
统计和modelling

谢谢. 是不是因为专门搞算法的岗位比较少呢?

发表于 2015-7-13 16:00 |显示全部楼层
此文章由 atelier 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 atelier 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mememewe 发表于 2015-7-13 11:50
谢谢. 是不是因为专门搞算法的岗位比较少呢?

搞算法的一般都去编程了,做data scientist的主要就是统计和modelling。2条不一样的路。

搞算法的可以去google search team试试 :)
DS可以去Facebook, LinkedIn, Twitter试试。

发表于 2015-7-13 22:19 |显示全部楼层
此文章由 ysihaoy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ysihaoy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
churq 发表于 2015-4-29 16:23
我不想打击大家,我觉得工资好低啊,我也想走这方面,因为非常喜欢数学,但是觉得心理非常不平衡。
一个plu ...

你看看时薪和性价比哪个更好?
Advertisement
Advertisement

发表于 2015-7-13 22:21 |显示全部楼层
此文章由 ysihaoy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ysihaoy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
CBA在招,前提是PHD学位,懂得Machine learning,R,Python,Scala,Hadoop,Spark这些都是最基本的了

估计在澳洲达到要求的都不超过两位数的人

发表于 2015-7-14 15:30 |显示全部楼层
此文章由 Mandy99 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Mandy99 所有!转贴必须注明作者、出处和本声明,并保持内容完整
fycool 发表于 2015-4-29 00:16
optus 最近在招data scientist 。。。

同事老公原来就是在那里做这个,后来跳槽走了去了四大,牛啊。
如果你快乐,你就会吸引更多快乐的事情到你身边。

发表于 2015-7-14 15:34 |显示全部楼层
此文章由 ilovetudou 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ilovetudou 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有群吗?认识一个公司做这个,可以推荐一个朋友入群

发表于 2015-7-14 18:28 |显示全部楼层
此文章由 rydfxs 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rydfxs 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mememewe 发表于 2015-7-13 01:12
想读数学的phd. 请问对于data mining来说,研究的方向是数学算法是好呢, 还是统计的modelling? ...

我个人觉得如果读phd做Data Mining研究方向还是算法比较好,原因是料比较多,不愁没得写。比如衍生比较神经网络和支持向量机,我觉得就够你写万字了。统计建模如果不偏向应用,假设纯写GARCH和EWMA模型bia出万字比较难吧。

发表于 2015-7-14 18:54 来自手机 |显示全部楼层
此文章由 浮云马 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 浮云马 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ysihaoy 发表于 2015-7-13 21:21
CBA在招,前提是PHD学位,懂得Machine learning,R,Python,Scala,Hadoop,Spark这些都是最基本的了

估 ...

你太小看澳洲了
Advertisement
Advertisement

发表于 2015-7-14 21:26 |显示全部楼层
此文章由 mememewe 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mememewe 所有!转贴必须注明作者、出处和本声明,并保持内容完整
rydfxs 发表于 2015-7-14 17:28
我个人觉得如果读phd做Data Mining研究方向还是算法比较好,原因是料比较多,不愁没得写。比如衍生比较神 ...

谢谢. 小弟也是这样想的. 但就业的话,应该统计有优势吧. 还有,请问统计容易些呢,还是算法?

发表于 2015-7-14 21:38 |显示全部楼层
此文章由 myABAP 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 myABAP 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 myABAP 于 2015-7-14 20:40 编辑

本人应用数学专业,十年工程分析和十几年SAP开发经验,目前是SAP CONSULTANT,DATA SCIENCE是我下一步职业规划,年龄大了些但一直在学新东西的

发表于 2015-7-15 00:21 |显示全部楼层
此文章由 ysihaoy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ysihaoy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
浮云马 发表于 2015-7-14 17:54
你太小看澳洲了

你先要算算符合这些条件的PhD一共有多少

还是那句话真是这方面的能人肯定不在澳洲了

再看看现在澳洲有些公司里算得上是ds的又有几个大牛呢?澳洲local动动嘴皮子而已吧

发表于 2015-7-15 09:34 |显示全部楼层
此文章由 wenny1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 wenny1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
data scientist 很好找工作的,而且以后需求量会更大的。

发表于 2015-7-15 09:41 |显示全部楼层
此文章由 knovak 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 knovak 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼主是想从事这个行业还是已经在从事了 我算是学data science的吧 之后毕业也想找这方面的工作 现在开始越来越火了 虽然不像国内大小企业都招人 但是岗位也还是有的
Advertisement
Advertisement

发表于 2015-8-3 08:38 |显示全部楼层
此文章由 91tt 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 91tt 所有!转贴必须注明作者、出处和本声明,并保持内容完整
fnever 发表于 2015-4-29 08:46
在大学里干过几年数据分析建模算法开发什么的

不过哥已经投身互联网的浪潮了 ...

兄弟归国了啊?

发表于 2015-8-3 09:17 来自手机 |显示全部楼层
此文章由 whoisit 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whoisit 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ysihaoy 发表于 2015-7-13 21:21
CBA在招,前提是PHD学位,懂得Machine learning,R,Python,Scala,Hadoop,Spark这些都是最基本的了

估 ...

没看到说要phd好像,而且我看了看flyer是graduate program

发表于 2015-8-5 02:40 |显示全部楼层
此文章由 cais 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cais 所有!转贴必须注明作者、出处和本声明,并保持内容完整
墨尔本的Zendesk也在招data scientist
头像被屏蔽

禁止发言

发表于 2015-9-22 00:01 |显示全部楼层
此文章由 闲云散人 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 闲云散人 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Mark下 都是大牛

发表于 2015-9-22 14:25 |显示全部楼层
此文章由 rhoda 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rhoda 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Bessy 发表于 2015-5-2 22:34
个人推荐
Data Science for Business: What you need to know about data mining and data-analytic thin ...

谢谢分享,回头学习一下
Advertisement
Advertisement

发表于 2015-9-23 00:00 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我们公司的data science的team都是IBM和accenture的人。

发表于 2015-9-23 00:02 |显示全部楼层
此文章由 tuxiaobao 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tuxiaobao 所有!转贴必须注明作者、出处和本声明,并保持内容完整
土澳满眼都是data scientist, 和数据挂钩的, 不是data scientist都不好意思见人。。。。。。。。。。。。。。。。。。足迹更不用提了。。。。。。。。。。。。。

发表于 2015-9-23 03:38 |显示全部楼层
此文章由 woshidajiangyou 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 woshidajiangyou 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gzrain 发表于 2015-6-30 08:36
谢谢回帖

我觉得我应该不会转去那种纯统计方面做modeling了,这样跨度太大,年纪又不小了,很难跟班科出 ...

外行说句外行话,clean data当然是做数据处理的第一步,但也是非常基础的部分
核心还是在于模型啊,不知道对不对
锦瑟无端五十弦,一弦一柱思华年。
庄生晓梦迷蝴蝶,望帝春心托杜鹃。
沧海月明珠有泪,蓝田日暖玉生烟。
此情可待成追忆,只是当时已惘然。

发表于 2015-9-23 04:03 |显示全部楼层
此文章由 tryitagain 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tryitagain 所有!转贴必须注明作者、出处和本声明,并保持内容完整
woshidajiangyou 发表于 2015-9-23 02:38
外行说句外行话,clean data当然是做数据处理的第一步,但也是非常基础的部分
核心还是在于模型啊,不知 ...

对,算是食物链底端。为什么DS要自己整合Data,因为IT大牛不屑干这个,小牛出的货用起来不称手。

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部