新足迹

 找回密码
 注册

精华好帖回顾

· 超可爱狗狗大集合!!大结局(75---80号选手登场,详见180楼) (2009-9-5) 无翼而飞 · 2014 第200天回顾 - 人像 (2014-7-19) samxsam
· 懒人菜饭 (2005-5-26) 小米 · DIY之deck 凉棚 - 226楼 03/02/17 另类方法解决gutter,fascia漏雨 (2016-4-21) eric_gao
Advertisement
Advertisement
查看: 976|回复: 8

[IT] AWS stacks监控问题(已解决) [复制链接]

发表于 2024-6-23 09:21 来自手机 |显示全部楼层
此文章由 辰哥 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 辰哥 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 辰哥 于 2024-6-26 17:57 编辑

一般是只用cloudwatch配合StatsD就够用了
还是用第三方像Grafana, CheckMK这样的固定年费更省事?
据说cloudwatch没配好的话收费会很高

头头让我出个监控各个stacks availability的方案(以后可能会要更多细节的东西方便他出report)
stacks大约有50+里面都是不太一样的东西

求大佬给意见
——————————
最后决定用cloudwatch慢慢放弃第三方,如果有额外需求自己搞一个出来
Advertisement
Advertisement

发表于 2024-6-23 10:05 |显示全部楼层
此文章由 chn217 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 chn217 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果没有特殊的要求,CloudWatch监控就够用了。Grafana图表功能更加丰富,但是和AWS service之间的集成性不如CloudWatch。

你是说Cloudformation的stack吗?每个stack就相当于一个application,最简单的办法就是你起一个canary,直接去call那些application提供的服务端口(health endpoint),去判断服务是否在线。

评分

参与人数 1积分 +2 收起 理由
辰哥 + 2 感谢分享

查看全部评分

君子和而不同,请勿人身攻击。

发表于 2024-6-23 11:44 |显示全部楼层
此文章由 辰哥 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 辰哥 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chn217 发表于 2024-6-23 09:05
如果没有特殊的要求,CloudWatch监控就够用了。Grafana图表功能更加丰富,但是和AWS service之间的集成性不 ...

谢谢回复,dev team这边也是倾向于用CloudWatch,默认就检测CPU/内存/网络/DB/...。然后再在每个App里用statsD往CloudWatch发送使用状况,

可惜管理层不是很喜欢CloudWatch的dashboard。希望有更好的dashboard并且最好把各种宕机情况细分出来,比如像下面连接中的1.2图表
https://docs.checkmk.com/latest/en/availability.html

目前还有一个log存多久的问题。CloudWatch上Metric data好像只能存15个月,如果report想拿存近3年的数据好像只能买第三方或者让dev额外搞一个dashboard。

目前方案虽然有几个。但是我这个没啥AWS经验的“拍板人”很心虚,希望大佬们能多给些建议

发表于 2024-6-23 11:50 来自手机 |显示全部楼层
此文章由 你往何处去 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 你往何处去 所有!转贴必须注明作者、出处和本声明,并保持内容完整
最终还是取决于cost吧,老板愿意出多少钱

有没有关注过splunk Observability?

https://aws.amazon.com/marketplace/pp/prodview-lek3sdfditgxk

评分

参与人数 1积分 +2 收起 理由
辰哥 + 2 感谢分享

查看全部评分

发表于 2024-6-23 12:08 来自手机 |显示全部楼层
此文章由 辰哥 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 辰哥 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 辰哥 于 2024-6-23 11:13 编辑
你往何处去 发表于 2024-6-23 10:50
最终还是取决于cost吧,老板愿意出多少钱

有没有关注过splunk Observability?


说到痛点了。老板们都喜欢少出钱让手下多办事
估摸着一年$5k以内可以接受

发表于 2024-6-25 11:40 来自手机 |显示全部楼层
此文章由 maifangmaifang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maifangmaifang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
也可以考虑用Elastic的observability方案,就是用elasticsearch那些东西
Advertisement
Advertisement

发表于 2024-6-25 14:22 |显示全部楼层
此文章由 victorlinwen 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 victorlinwen 所有!转贴必须注明作者、出处和本声明,并保持内容完整
可以看看 datadog

发表于 2024-6-25 15:15 |显示全部楼层
此文章由 Mushroomm 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Mushroomm 所有!转贴必须注明作者、出处和本声明,并保持内容完整
辰哥 发表于 2024-6-23 11:08
说到痛点了。老板们都喜欢少出钱让手下多办事
估摸着一年$5k以内可以接受 ...

先挑3到4个不同的方案,列出每个方案的功能,长处短处。
再估算每个方案的成本。
写个report扔给老板。让他们自己选。老板需要被教育,但是也需要足够的信息。
否则你选什么方案都是错的。不是功能太弱就是太贵。

发表于 2024-6-26 19:07 来自手机 |显示全部楼层
此文章由 辰哥 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 辰哥 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Mushroomm 发表于 2024-6-25 14:15
先挑3到4个不同的方案,列出每个方案的功能,长处短处。
再估算每个方案的成本。
写个report扔给老板。让 ...

我就给了2个options
然后大家觉得自己搞合适
现在老板花钱请人给我们做aws training
希望我们在同一个level上

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部