新足迹

 找回密码
 注册

精华好帖回顾

· 麦麦泽泽儿童房DIY全攻略之二 - 门上的字母贴 (2008-11-7) MaxJay · 你会是哪个父母?如何与孩子沟通 (39-42楼书单更新) (2009-8-13) 蓝月亮
· "父母焦虑症"之我见 (2010-5-21) daffodil · 生活在别处 – 澳洲生活三年回顾 (2007-12-12) DreamRedMansion
Advertisement
Advertisement
查看: 4525|回复: 20

[IT] 发个贴谈谈国内的金融类数据环境 [复制链接]

发表于 2017-10-28 01:46 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 cnnworld 于 2017-10-28 12:43 编辑

回国已经几个月了,来这儿跟大家聊聊国内的金融类数据的环境

首先,金融类数据,大多是低频数据,比如银行的,保险的,车险的,公司大如平安,商业银行等,拥有的数据大多是很低频的,也就是说,有用户的信息数据,某次贷款的信息,银行卡的情况。

其次,金融类数据现在会结合大数据,大数据是什么呢,一般是说四类数据:1. 运营商数据 2.支付类数据 3. 网购类数据 4.社交类数据

因此,金融数据就是这些低频数据和那些高频的大数据结合一起,在某个场景下,玩一些数据应用,国内金融数据公司,大多数就是在玩这些数据

跟澳洲有什么不同呢?

那就是国内的数据实在太多了,且并不够规范,且这个生态链充斥太多不同人群

1. 银行类的数据,一般银行都有自己的干儿子或者亲儿子,他们会成为数据提供商,今年6月份出台了隐私相关法律,使得这部分数据输出变得困难,但是,这些亲儿子或者干儿子,在一定的规范下,依然会有些数据输出或者合作,所以国内常用的一个词叫做:联合建模。就是说,跑到这些干儿子或者亲儿子的公司内部,用这些数据建立模型,并输出一些分,这些分,可以代表用户的某些能力,比如风险能力,资金能力,信用能力等

2. 运营商的数据。运营商数据有两类,一类是运营商存在云端的数据,这类数据分成B域数据,PC域数据等,运营商数据中,保密最好的是移动数据,控制的比较严格,电信和联通对数据隐私相对较弱。 这类数据是很多人很想拿到的,这类数据跟金融的风险,尤其是反欺诈风险关系也比较大。 一类则是通过你手机爬的,为了要爬你的手机数据,如果你是安卓的,基本都能爬到,你访问过什么网址,通讯录是什么,只要你有授权,基本都会爬取。相比较,ios手机数据很难爬取,所以从安全角度,ios是相对安全的

3. 其他大数据基本被腾讯和阿里垄断,支付类数据大家都是片段化的,这些高频数据,对于刻画客户画像非常关键,因此,大数据应用的一个核心基础功能,就是要有非常强大的用户画像


在金融领域,利用上面的大数据以及传统的那些核心数据(低频数据),就可以刻画出一个人的所有画像,包括你访问过什么网站,最近有什么需求,是否在备孕,是否在租房,如果打算买车打算买什么品牌的车,这些画像,尤其是根据访问浏览地址和打开App情况来画像的,基本都是可以通过网址分类和app分类来得到。这种分类,一般公司需要十几个人做半年即可得到这样的标签库,使得我们对用户的判断会非常精准

当有了这样的用户画像后,我们一方面可以卖我们自有的金融产品,因为你很容易发掘对方的需要,一方面也可以开始做cross selling。 这使得我们的转化率会比传统的广告投放高,当我们识别了这部分用户的需要后,我们就会去触达他们。只要有用户的手机imei号,或者手机号码,配以合适的产品文案和推广方案,就可以将我们想要卖的产品卖给用户

用户画像也涉及一些IT技术,这里面主要有两点,一类是T+1的标签,标签有一天的滞后;一类是实时标签,这涉及到实时计算。实时计算框架有很多种,具体需要跟业务相关

以上探讨的是从营销角度,用户标签建设的重要性和基本方法论,这也是金融大数据领域的一个重要方向和做法。如果你看懂了,你应该会理解里面需要什么技术

金融类数据还有一类重要应用是跟风控相关。风控一般分为两类,反欺诈风控和审批风控。风控的方法一般是基于模型训练或者规则集。这里面的技术难点在于,模型训练的方法论有很多种,总结来说,分为传统的分类模型,或者是社交网络的方法来判断反欺诈。规则集一般是人工和业务专家的经验,但规则集里面政策的先后续以及里面的阙值计算,尤其是规则集的优化效果,也是模型非常重要的方向

总的来说,在国内做技术,速度是很快的,大家总觉得太慢太慢,因为很多时候,一件事差半年,可能结果会差很多,因为机遇没了。我们都在资源和机遇中平衡,寻找最佳空间。国内机会也确实有很多时机,比如期权,你入职的时候可能价值只有100万人民币,过了几个月,公司又一轮融资,你的期权价值可能变成了200万,因为估值翻了一倍。员工也在这种数字游戏中,打了更多的鸡血,为梦想“窒息“(贾跃亭语)








评分

参与人数 8积分 +41 金币 +2 收起 理由
Gaucho + 1
kingkongfei + 6 感谢分享
superdigua + 3 感谢分享

查看全部评分

Advertisement
Advertisement

发表于 2017-10-28 04:50 |显示全部楼层
此文章由 白雲山民 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 白雲山民 所有!转贴必须注明作者、出处和本声明,并保持内容完整
感谢分享!

发表于 2017-10-28 06:56 |显示全部楼层
此文章由 alanming 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 alanming 所有!转贴必须注明作者、出处和本声明,并保持内容完整
感谢楼主分享

发表于 2017-10-28 09:03 |显示全部楼层
此文章由 Coolbananas 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Coolbananas 所有!转贴必须注明作者、出处和本声明,并保持内容完整
强人

发表于 2017-10-28 09:33 |显示全部楼层
此文章由 gifox 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gifox 所有!转贴必须注明作者、出处和本声明,并保持内容完整
“你入职的时候可能价值只有1020万人民币,过了几个月,公司又一轮融资,你的期权价值可能变成了200万,因为估值翻了一倍”


楼主你打错字了把。按照理解,应该是增加期权价值把。

发表于 2017-10-28 09:38 |显示全部楼层
此文章由 tu2011 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tu2011 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gifox 发表于 2017-10-28 10:33
“你入职的时候可能价值只有1020万人民币,过了几个月,公司又一轮融资,你的期权价值可能变成了200万,因 ...

稀释的话应该是减少,不过楼主还是打错了一个地方
Advertisement
Advertisement

发表于 2017-10-28 09:44 |显示全部楼层
此文章由 bombhuauto 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 bombhuauto 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这类严格意义不算IT吧,应该算数据分析,或者大数据类。

方向不错,加油

发表于 2017-10-28 09:52 |显示全部楼层
此文章由 aurorash 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 aurorash 所有!转贴必须注明作者、出处和本声明,并保持内容完整
谢谢分享

退役斑竹 2017年度勋章

发表于 2017-10-28 09:52 来自手机 |显示全部楼层
此文章由 slau1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 slau1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
錢景是美好的

发表于 2017-10-28 09:52 |显示全部楼层
此文章由 gifox 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gifox 所有!转贴必须注明作者、出处和本声明,并保持内容完整
tu2011 发表于 2017-10-28 10:38
稀释的话应该是减少,不过楼主还是打错了一个地方

我也有想过有这个可能,所以希望楼主解释一下。
稀释的话,1020变200也不对啊。
头像被屏蔽

禁止发言

发表于 2017-10-28 09:53 |显示全部楼层
此文章由 Gaucho 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Gaucho 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 Gaucho 于 2017-10-28 14:13 编辑
bombhuauto 发表于 2017-10-28 10:44
这类严格意义不算IT吧,应该算数据分析,或者大数据类。

方向不错,加油 ...


在目前世界上很多大学里,数据分析专业还是在 School of Information Technology里面,统计学是单独列出或者列在应用数学系里面的。在统计学家看来,数据分析的技术无非都是统计学理论和方法在实践中的如何实现和变通,那些难以解决的实际问题又反过来刺激统计学在一些领域的理论发展。
签名被屏蔽
Advertisement
Advertisement

发表于 2017-10-28 10:06 |显示全部楼层
此文章由 dogdogkun 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dogdogkun 所有!转贴必须注明作者、出处和本声明,并保持内容完整
问一下有没有什么好的算法可以自动建规则集,除了决策树
头像被屏蔽

禁止发言

发表于 2017-10-28 11:10 |显示全部楼层
此文章由 Gaucho 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Gaucho 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dogdogkun 发表于 2017-10-28 11:06
问一下有没有什么好的算法可以自动建规则集,除了决策树

规则模型。
签名被屏蔽
头像被屏蔽

禁止发言

发表于 2017-10-28 11:13 来自手机 |显示全部楼层
此文章由 lwzdew 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lwzdew 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gifox 发表于 2017-10-28 10:52
我也有想过有这个可能,所以希望楼主解释一下。
稀释的话,1020变200也不对啊。 ...

10万20万的意思
签名被屏蔽

发表于 2017-10-28 11:24 |显示全部楼层
此文章由 YugaYuga 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 YugaYuga 所有!转贴必须注明作者、出处和本声明,并保持内容完整
lwzdew 发表于 2017-10-28 12:13
10万20万的意思

从上下文看是 100万
you only live once

发表于 2017-10-28 11:44 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dogdogkun 发表于 2017-10-28 11:06
问一下有没有什么好的算法可以自动建规则集,除了决策树

gbtd中间树状态
Advertisement
Advertisement

发表于 2017-10-28 11:45 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gifox 发表于 2017-10-28 10:52
我也有想过有这个可能,所以希望楼主解释一下。
稀释的话,1020变200也不对啊。 ...

100万,估值增加一倍,期权价值就翻倍

发表于 2017-10-28 11:50 |显示全部楼层
此文章由 dogdogkun 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dogdogkun 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Gaucho 发表于 2017-10-28 12:10
规则模型。

规则模型是指association rule mining吗?

发表于 2017-10-28 11:56 |显示全部楼层
此文章由 dogdogkun 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dogdogkun 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2017-10-28 12:44
gbtd中间树状态

弱问一下这个英文全称是什么?

发表于 2017-10-28 11:58 |显示全部楼层
此文章由 白雲山民 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 白雲山民 所有!转贴必须注明作者、出处和本声明,并保持内容完整
1020万 少了个—10—20万
头像被屏蔽

禁止发言

发表于 2017-10-28 13:12 |显示全部楼层
此文章由 Gaucho 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Gaucho 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dogdogkun 发表于 2017-10-28 12:50
规则模型是指association rule mining吗?

这个是descriptive rule learning models的其中之一。
签名被屏蔽
Advertisement
Advertisement

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部