新足迹

 找回密码
 注册

精华好帖回顾

· 美食接龙~交作业啦<山药羊肉煲,枣香山药排,奶香脆皮山药>虎妞接棒~黄花菜! (2008-8-11) LJ2008 · 我的鸟缘(二) (2006-7-14) SailingInOZ
· 煮夫手记二十六 想家了,咱们吃丸子(上) (2011-6-13) amon54 · 漫漫改造装修路 (2013-7-27) anata_t
Advertisement
Advertisement
123
返回列表 发新帖
楼主:kaixin123

[其他] Question about Excel [复制链接]

发表于 2012-7-24 12:00 |显示全部楼层
此文章由 jasonliu234 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jasonliu234 所有!转贴必须注明作者、出处和本声明,并保持内容完整
原帖由 tvc889 于 2012-7-24 10:42 发表
我觉得我的解决方案挺好的。

在楼主的数据上测试,100%正确率。

请见附件。



这个不错。用路的来分割,比用suburb要简单的多。
恢复人体的秩序,让免疫力自己去治病。
Advertisement
Advertisement

发表于 2012-7-24 12:19 |显示全部楼层

用regular expression什么类似问题都能搞定

此文章由 jasonliu234 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jasonliu234 所有!转贴必须注明作者、出处和本声明,并保持内容完整
原帖由 binbenban 于 2012-7-23 16:25 发表


请问 用 regular expression 怎么搞定?
恢复人体的秩序,让免疫力自己去治病。

发表于 2012-7-24 12:27 |显示全部楼层
此文章由 tvc889 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tvc889 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我不认为regular expression能轻易搞定。

看看微软的教程吧。

http://support.microsoft.com/kb/818802/en-us

原帖由 jasonliu234 于 2012-7-24 12:19 发表


请问 用 regular expression 怎么搞定?

发表于 2012-7-24 12:32 |显示全部楼层
此文章由 jasonliu234 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jasonliu234 所有!转贴必须注明作者、出处和本声明,并保持内容完整
其实公式都复杂的。

对于lz来说,如果能做成一个macro,run一下 就能出答案。也许才是她要的

发表于 2012-7-24 12:34 |显示全部楼层
此文章由 rabbitpoint 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rabbitpoint 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我们能不能假设前面的字符串和区名之间的空格数大于1呢?看起来好像是的。若是如此,不就简单了?若不是如此,是要需要一个区名的字典了。 (还有,一般的地址在写的时候,是有个逗号在区名前的。)

发表于 2012-7-24 12:55 |显示全部楼层
此文章由 tvc889 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tvc889 所有!转贴必须注明作者、出处和本声明,并保持内容完整
macro 也要有规则才可以。

原帖由 jasonliu234 于 2012-7-24 12:32 发表
其实公式都复杂的。

对于lz来说,如果能做成一个macro,run一下 就能出答案。也许才是她要的
Advertisement
Advertisement

发表于 2012-7-24 13:47 |显示全部楼层
此文章由 rabbitpoint 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rabbitpoint 所有!转贴必须注明作者、出处和本声明,并保持内容完整
其实对于这种不100%规则的数据,找个公式解决90%的问题,剩下的10%再换个办法再解决70%的问题,剩下的基本就是垃圾数据了,手工解决。data cleaning就是这样,handle的是exceptions. 还有,谁把地址搞成这个样子的,可能在原数据里面,根本就是两列,合并一起给楼主了也保不齐。

发表于 2012-7-24 16:06 |显示全部楼层
此文章由 bats 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 bats 所有!转贴必须注明作者、出处和本声明,并保持内容完整
刚刚试了一下把全部suburb放进去,其中又发现一些问题,的确不做不知道。
现在都弄好了
只要lz 把公式从row 20拉到row16000,再将
数据copy and paste进去a2 as text就能出结果(没办法我发现公式全入file size会变成18m)
其实用vba估计会快很多

[ 本帖最后由 bats 于 2012-7-24 16:20 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
客舍并州已十霜,归心日夜忆咸阳。
无端更渡桑干水,却望并州是故乡。

发表于 2012-7-24 18:09 |显示全部楼层
此文章由 kaixin123 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kaixin123 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼主的数据不是一般的垃圾,传上来的数据是冰山一角,比如空格在suburb名字中间,街道名后面还没空格,也不写个rd什么,偶尔出现个r是rd的意思吗?还有查google, 填充原始数据的还不是一个人,他们有着不同的简写习惯,反正这列地址栏大概10k个地址要整理,然后和另外7/8k做比对,问题是其中的4k地址要加进来才能做个合并的比较,我觉得这个任务已经超过我的能力范围,既然是分配给我的任务我就尽力做,真心感谢大家的帮忙

很多东西要回去研究、消化一下,谢谢大家!

发表于 2012-8-17 23:33 |显示全部楼层
此文章由 zwczcy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 zwczcy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mark

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部