Instaclustr(NetApp 旗下公司)为企业客户运行托管开源数据基础设施,使 SRE 成为其工程组织的核心职能。Instaclustr 的 SRE 确保跨 AWS、GCP 和 Azure 的生产 Cassandra、Kafka、PostgreSQL、OpenSearch 和 Redis 集群的可靠性、性能和可扩展性。面试流程评估 Linux/Unix 运维能力、分布式系统故障排查、自动化能力和事件管理技能。候选人应预期实践性强的评估风格,反映日常维护数千个数据库集群的真实工作。堪培拉团队重视将扎实的系统知识与软件工程技能相结合,以构建自动化和减少重复劳动的工程师。
通过 NetApp Careers 或 Instaclustr 招聘页面提交申请。SRE 岗位通常在堪培拉办公室,采用混合办公模式(至少每周 2 天到办公室)。强烈建议通过 Instaclustr 或 NetApp 员工内推,可以获得加速审核。
SRE 简历关键词:Linux 系统管理、分布式系统监控、事件管理、SLO/SLI/SLA、Prometheus、Grafana、Terraform、Ansible、Kubernetes、Docker、CI/CD、on-call 轮换、事后复盘、Runbook、容量规划、混沌工程。
数据库专项关键词:Apache Cassandra(nodetool、repair、compaction)、Apache Kafka(分区管理、消费者延迟)、PostgreSQL(复制、WAL、vacuum)、OpenSearch/Elasticsearch(集群健康、分片分配)、Redis(sentinel、集群模式)。
简历影响量化:不要写「管理数据库集群」,应写「维护跨 3 个 AWS 区域的 200+ Cassandra 节点,SLA 可用性 99.95%」。包含事件响应指标、MTTR 改进和自动化节省的数据。
Glassdoor 信息:运维和 TechOps 岗位被评为 Instaclustr 面试中最难的,所以准备比标准软件工程师流程更深入。预期动手场景型问题。