项目总结-光大网关迁移
光大迁移在上周顺利上线, 但过程着实不轻松。
这是我做的第一家完整的迁移项目,零零散散记录了项目过程的一些问题、我的感想、以及可以立即着手做的一些改进, 与各位PM共享:
遇到的问题:
环境问题
paycore的数据库表中数据被清空了、重新拉流才解决。
开发库迁移,导致功能测试时库查询速度非常慢,甚至查不出来,特别是短信校验码的库,测一笔要等5分钟。
异常卡测试5次就没用了(比如持卡人校验在代码中做过限制)。后来找开发临时修改服务器代码才搞定。
测试时发现会计的入账规则没有配置。 但开发环境下很多配置都是缺失的,重新找核心人员完成配置。测试觉得:迁移中开发不能仅关注超网脚本,还要关注业务整体流程。开发觉得:有待商榷, 是不是迁移项目可以避开这些结算配置? 因为生产上肯定是好的, 没必要在功能测试环境上纠结。
DRM搞演练,paycore把所有模式改为备库了,导致测试进度延迟了1.5天。
SIT 上连接anymock,响应超时。 齐军反馈是不知道谁在跑压测,无法提供服务,影响测试进度0.5天。
设计问题
签约只有卡通、借记卡快捷支持发送到超网; 信用卡要一家家银行去改。所以以后每次迁移信用卡,都要改poscore。
katong系统的修改,之前在群里毛公问过,但无人回复。结果到发布计划评审时才发现原来不用修改。
数据订正时需要签约中心关闭签约入口。但零散入口较多,没办法关全面,最后修改了发布计划,没关闭渠道。
人员问题
张小彬接口联调没有问题,很积极。 但对业务不熟悉,后面有点支持不过来了。(特别是涉及到资金流水落地的)
新人,发起充值金额很高,每次都去查校验码,影响进度。
SIT的脚本什么时候导入?上了SIT,开发没有通知、 测试也不知道SIT脚本是由他们来导入的。
SIT头两天一直是走settlecore,一直没人处理。导致SIT测试时间太短。开发说没人找他,测试说开发没响应。(沟通问题,已找当事人)
新人,做掉单老是不成功 ,原因是流水状态改成UN , 不能改成FA, 否则掉单不会触发。(很囧)
预发布确认的列表仅发给了 PD , 没有PM和开发同学 。
做预发布/发布支付分流,要邮件给PD该流程没有固化下来,很多开发是问别人才知道的。
预约掉单查询需结算配合,该流程没有固话下来,很多开发是问别人才知道。
计划问题
充退人员很晚才进入项目。
数据订正的渠道路由人员介入时间太晚。
金融交换的脚本没跟着升级包。结果上了SIT之后测不通才发现有问题。临时找子龙,做的升级包数据库变更。
银行问题
“银行卡测试超限了,找PM重新找银行换卡”。 轻松一句话, 对于技改的项目推动起来还是蛮困难。毕竟技改是我们发起,银行那边不是放在最高优先级。
感想:
1. 组织大了,部门间配合的效率越来越依赖于接口人的响应速度。
2. 都说要做平台,但平台建起来,平台就成了黑盒, 负责平台维护的人就成了最忙的人,特别是在没有平台使用手册的情况下。
3. 新人(外包)在项目中需要辅导却苦逼地自我摸索;老人(自有员工)忙于应付各种评估、评审, 没时间辅导却要对质量负责; PM不懂技术细节干着急还要为进度买单。 每个人都有压力,但压力的源头在哪里?
4. 既然做核心,先要确保稳定,哪怕是测试环境。金融也在逐渐成为半个核心, 如何确保核心的配置稳定是个大挑战。几乎每个项目都会出现”谁改了我的配置 “ 这样无可奈何的情况。
5. 很多时候我们在测“配置”,而不是在测“代码”。这种工作是不是可以通过各种检查工具去完成?
6. 流程,流程,还是流程。流程可以避免犯错,但当执行者不知道流程的时候,流程就沦为官僚,就成了效率的最大杀手。
7. 我们需要慢下来。 不是指通过各种推和挡来降低需求响应速度,而是要减少隐形沟通成本、优化研发工具和流程来提高效率, 让团队成员压力降下来、进而慢下来。
8. 对PM的要求会越来越高, 所有活动计划要提前半个月制定,严格控制变更,尽量减少变更引发的沟通混乱。
后续可以做的改进:
1. 增加培训: 升级包流程(如何申请代码合并、何时要写发布计划等)+ 迁移流程(如何排查环境问题、如何检查金融交换是否切换完成等)
2. 整理渠道迁移的项目管理checklist,包括前期与银行协商测试环境、项目安排中涉及到金融交换、渠道路由的人员安排、预发布结算人员、运维人员的配合等。增加计划性、减少变更成本 、培养默契。
3. 充退流程的梳理、 充退常见问题排查过程整理;(正好后续续程颢会来学习充退,过程中可以产出一些文档)