新足迹

 找回密码
 注册

精华好帖回顾

· 江西婺源 2011初秋....#8 加連州 (2012-12-19) andychan · VIVI的日常穿搭 随手拍。。#570:最近的一些。。#527: 几件心水单品。。一楼直达电梯 (2015-8-18) VIVIbear
· 2012越南游 (2012-8-11) haining · 猫猫也支持奥运火炬归来 (更新图文) (2008-4-24) 我爱猫
Advertisement
Advertisement
查看: 1918|回复: 23

用啥语言能比较方便的写个小程序和网页交互提取数据? [复制链接]

发表于 2013-5-1 17:42 |显示全部楼层
此文章由 iamamouse 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 iamamouse 所有!转贴必须注明作者、出处和本声明,并保持内容完整
现在俺在大学里有个研究项目得用数据,从美国证监会(SEC)的网站上查询他们的数据库,下载数据。他们网站页面可以输入一些筛选条件,然后出来的数据(其实就是公司提交的很多报表)可以从网页上以txt或者html格式下载。因为数据量很大,用手动的话岂不是累死了。

现在有哪些比较方便的语言适合或者能够编写小程序自动得去和网页交互下载报表。或者说这样的自动化要求是否现实,大概能做到各啥程度。

俺要求不高,也不要很牛的功能。这纯粹是学术的,不涉及任何商业。我可以自己写程序,这研究项目也没资金赞助。
帅有个屁用!到头来还不是被卒吃掉
Advertisement
Advertisement

发表于 2013-5-1 17:47 |显示全部楼层
此文章由 findcaiyzh 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 findcaiyzh 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我是C#程序员,这种程序,我都用C#实现。
按理说什么语言都可以的。

发表于 2013-5-1 20:14 |显示全部楼层
此文章由 ericlgq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ericlgq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
selenium?可以录制脚本操作浏览器。

发表于 2013-5-1 20:19 |显示全部楼层
此文章由 coin_king 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 coin_king 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这种网站肯定有RSS feeder的,XML format。

发表于 2013-5-1 20:20 |显示全部楼层
此文章由 coin_king 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 coin_king 所有!转贴必须注明作者、出处和本声明,并保持内容完整

发表于 2013-5-1 20:24 |显示全部楼层
此文章由 kawara 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kawara 所有!转贴必须注明作者、出处和本声明,并保持内容完整
一般和text打交道都用scriping language

现在流行python,内置api也非常多
Advertisement
Advertisement

发表于 2013-5-1 22:39 |显示全部楼层
此文章由 LifesoCool 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 LifesoCool 所有!转贴必须注明作者、出处和本声明,并保持内容完整
PYTHON吧

发表于 2013-5-1 22:40 |显示全部楼层
此文章由 红烧鸡翅 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 红烧鸡翅 所有!转贴必须注明作者、出处和本声明,并保持内容完整
perl lwp
天天干这事

发表于 2013-5-1 22:49 |显示全部楼层
此文章由 鱼羊鲜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 鱼羊鲜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
都可以,看你哪个语言拿手啊

发表于 2013-5-1 22:51 |显示全部楼层
此文章由 yangwulong1978 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yangwulong1978 所有!转贴必须注明作者、出处和本声明,并保持内容完整
鱼羊鲜 发表于 2013-5-1 21:49
都可以,看你哪个语言拿手啊

我中文拿手,

发表于 2013-5-2 00:45 |显示全部楼层
此文章由 鱼羊鲜 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 鱼羊鲜 所有!转贴必须注明作者、出处和本声明,并保持内容完整
yangwulong1978 发表于 2013-5-1 21:51
我中文拿手,

哦 那就用 易语言

易语言汉语编程官方站
Advertisement
Advertisement

发表于 2013-5-2 10:26 |显示全部楼层
此文章由 无视 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 无视 所有!转贴必须注明作者、出处和本声明,并保持内容完整
“可以从网页上以txt或者html格式下载“

到底是下载还是要抓数据?

如果是下载就会有自己的url,如果要抓数据就需要web page的parsing/extraction, 不过都可以用powershell, 它底层大多是是调用.net的类库。跟c#的implementation比,优点是scripting,直接改code,也不用recompile。 缺点是必须对powershell的语法比较熟,debug起来如果没用好的工具就没有vs那么顺手。

另外用selenium应该不错。

发表于 2013-5-2 10:35 |显示全部楼层
此文章由 IsDonIsGood 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 IsDonIsGood 所有!转贴必须注明作者、出处和本声明,并保持内容完整
鱼羊鲜 发表于 2013-5-1 23:45
哦 那就用 易语言

易语言汉语编程官方站

最近才看到这个易语言,有前途么?貌似天朝不少初高中的骚年们趋之若鹜~~
2020目标: 活着

发表于 2013-5-2 10:37 |显示全部楼层
此文章由 IsDonIsGood 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 IsDonIsGood 所有!转贴必须注明作者、出处和本声明,并保持内容完整
无视 发表于 2013-5-2 09:26
“可以从网页上以txt或者html格式下载“

到底是下载还是要抓数据?

老大你的那个平台写得咋样啦?好久没看你上来了,很忙啊?
2020目标: 活着

发表于 2013-5-2 10:45 |显示全部楼层
此文章由 donent74 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 donent74 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我用vb做过,自动填入该填的筛选控件的值,再触发下载控件的点击事件,就可以模拟人手输入下载了。
这样很方便,因为不需要对网页的内容做多少分析,只要知道控件名称就行了。尤其如果你先需要login的话,感觉这样最简单,因为你根本不用关心提交给网站的具体内容。

发表于 2013-5-2 11:09 |显示全部楼层
此文章由 无视 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 无视 所有!转贴必须注明作者、出处和本声明,并保持内容完整
IsDonIsGood 发表于 2013-5-2 09:37
老大你的那个平台写得咋样啦?好久没看你上来了,很忙啊?

ha,这边不是经常来逛,工作版那边倒是经常去

写的差不多了,过两个星期就要给business做demo, pressure

你怎么样?一切还好吧?

评分

参与人数 1积分 +5 收起 理由
o2h2o + 5 good luck!一定语惊四座

查看全部评分

Advertisement
Advertisement

发表于 2013-5-2 12:37 |显示全部楼层
此文章由 iamamouse 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 iamamouse 所有!转贴必须注明作者、出处和本声明,并保持内容完整
谢谢给我,我按你们说得研究一下。
现在都有用中文编成的了?

发表于 2013-5-2 13:58 |显示全部楼层
此文章由 民工 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 民工 所有!转贴必须注明作者、出处和本声明,并保持内容完整
不需要强大的编程语言,脚本划拉划拉就够了

发表于 2013-5-2 14:05 |显示全部楼层
此文章由 iamiii 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 iamiii 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我会选python,因为最熟悉这个。

其他脚本语言都行。

发表于 2013-5-8 00:09 |显示全部楼层
此文章由 float 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 float 所有!转贴必须注明作者、出处和本声明,并保持内容完整
python 上手容易例子多

发表于 2013-5-8 11:25 |显示全部楼层
此文章由 ysihaoy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ysihaoy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
动态语言基本都很方便,什么python,ruby,groovy。。。。等很容易
Advertisement
Advertisement

发表于 2013-5-8 23:03 |显示全部楼层
此文章由 sonybp 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sonybp 所有!转贴必须注明作者、出处和本声明,并保持内容完整
selenium +1

发表于 2013-5-9 00:37 |显示全部楼层
此文章由 xmj 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xmj 所有!转贴必须注明作者、出处和本声明,并保持内容完整
IsDonIsGood 发表于 2013-5-2 09:35
最近才看到这个易语言,有前途么?貌似天朝不少初高中的骚年们趋之若鹜~~ ...

公司已经破产了,你说有没有前途

发表于 2013-5-9 08:18 |显示全部楼层
此文章由 IsDonIsGood 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 IsDonIsGood 所有!转贴必须注明作者、出处和本声明,并保持内容完整
xmj 发表于 2013-5-8 23:37
公司已经破产了,你说有没有前途

网站不是还在么?
2020目标: 活着

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部