职位简介
我们正在寻找一位熟悉云基础设施与区块链节点运维的工程师,负责多链节点的部署、监控、优化与稳定性保障。
岗位职责
区块链节点运维
- 负责主流公链节点部署、同步、升级与故障恢复
- 管理 Full Node / Validator / Archive 节点生命周期
- 处理链同步异常、BAD BLOCK 、consensus mismatch 等问题
- 优化 snapshot 导入、数据库恢复与链数据迁移流程
- 监控节点健康状态、同步高度与资源使用情况
云基础设施管理
- 基于 AWS 搭建高可用基础设施
-
管理:
- EC2
- EBS ( gp3/io2 )
- VPC
- Security Group
- Route53
- IAM
- 优化磁盘 IO 、网络吞吐与实例性能
- 处理云网络与跨区域部署问题
稳定性与故障处理
-
排查:
- 节点 out of sync
- shard chain delay
- peer disconnect
- Kafka / RPC / P2P 网络问题
-
优化系统:
- IO
- TCP/UDP
- Linux Kernel
- 文件系统参数
任职要求
必备要求
- 5 年以上 Linux 运维 / DevOps / SRE 经验
- 熟悉 AWS 云服务
- 熟悉 Docker / Kubernetes
- 熟悉 Shell/Python
- 熟悉 TCP/IP 、UDP 、DNS 、NAT
- 有生产环境故障排查经验
区块链相关经验(重点)
具备以下任意经验优先:
- Ethereum / Polygon / TON / XRP 节点运维
- Validator 运维经验
- Snapshot / State Sync / Archive 节点经验
- Tendermint / Cosmos 生态经验
- 区块链数据库恢复经验
加分项
- 熟悉 Kafka / Redis / PostgreSQL
- 熟悉 Prometheus + Grafana
- 熟悉 Terraform / Ansible
- 熟悉高 IO 场景优化
- 有 Web3 公司工作经验
- 有跨区域高可用架构经验
技术栈
- Linux
- AWS
- Docker
- Kubernetes
- Terraform
- Kafka
- Prometheus
- Grafana
- ELK
- Python / Bash
我们希望你具备
- 强问题定位能力
- 对稳定性有极高要求
- 能独立处理线上故障
- 对 Web3 / Infra 有持续兴趣
- 对性能优化有经验
工作地点
- Remote
薪资范围
- 根据经验面议
简历可发送邮件:Ym9iYnljaGVuMTk5MkBwcm90b25tYWlsLmNvbQ==