【ONE CAREER エンジニアのホンネ vol.15】SREが支える信頼性。開発チームと連携した日々|ONE CAREER Tech Blog

みなさんこんにちは!ワンキャリアのSREチームの中岡です。
ワンキャリアに入社して3ヶ月が経ったため、入社したきっかけなども含めて、振り返りの記事を書きたいと思います。

ワンキャリアに入社した理由

主な動機は入社エントリに書いていますので、合わせて読んでいただけますと幸いです。

自分が今後目指すキャリア像をイメージできる会社であったこと、これまでの自身の経験を元に、組織に貢献できると感じられたこと、一緒に働く人達が魅力的であったことなどが主な理由ですが、一言で言えば、人、会社、ビジョンそれぞれに共感できたことが大きかったと思います。

最初の3ヶ月で取り組んだこと

最初の1ヶ月

入社後、基本的なオンボーディングを終えた後は、SREの普段の業務を理解しつつ、ドキュメントを読んだり、簡単なタスクに取り組んだりしていました。前職のインフラ構成と基本構成は似ていたため、キャッチアップは比較的スムーズでした。

SREチームは日々のAWS、GCPコストをDailyで確認し、急にコストが増えたリソースがあった場合に原因を確認したり、コスト最適化施策を行い、売り上げに対する減価率を抑えることで、ビジネスへの貢献にも繋げています。また、障害対応やインフラ変更に関わるレビューなど、システムを安定的に運用していくための責務を持っています。

2025年10月現在、SREチームはマネージャーを含めて3名の体制で、少数でインフラ全体の信頼性を支える役割を持っています。開発チームはプロダクトごとに分かれており、各チームが自分達のシステムに必要なインフラの設定やTerraformの修正も行なっています。

AmazonのCTOであるワーナー・ヴォゲルスが提唱した概念として知られる「You build it, you run it」という言葉を実践しており、開発したものを運用していくという意識が浸透していると感じました。

入社して半月ほど経った頃、各開発チームメンバーと1on1を実施しました。横断的なSREの特性として、各開発チームとのコミュニケーションが多く発生することが予想されたのと、純粋に各チームがどんな取り組みをし、どんなメンバーがいるのかを知りたいと思ったためです。

開発チームの他、PdMチームやAI・データチームの方ともお話ししました。 インターンを経て入社した若いメンバーの方も多く、入社1年目とは思えないほど活躍されている方が多くて驚きました。
新しいことや難しいことに挑戦されていたり、自分が開発しているプロダクトがユーザにどんな価値を提供しているかをよく考えていたり、何より楽しく取り組んでいる様子が感じられました。

非常に活気のある環境で、自分も頑張ろうと強く感じました。

2ヶ月目

1ヶ月目の終わり頃から、SREのチーム目標に沿った具体的なタスクに関わっていきました。

セキュリティ強化

ワンキャリアには、新卒採用サービスの「ワンキャリア」と中途採用サービスの「ワンキャリア転職」という2つのサービスがあります。
どちらもSaaSとしてAWS上で稼働しています。 サービスの特性上、個人情報やクチコミデータなど、守るべきデータがたくさんあります。サービスを安心して使っていただくためにも、セキュリティの強化はSREとして優先度の高いテーマでした。

私が入社した時点で、すでにAWSの「Security Hub」というマネージドサービスを活用し、AWSアカウントのセキュリティ情報を一元的に収集・管理している状態でした。そこで、「AWS 基礎セキュリティのベストプラクティス」のレポート情報をもとに、優先度の高い項目から対応をしていきました。

AWSが提供する各種セキュリティサービスを活用することはもちろんですが、自社のサービスに合った設定のカスタマイズや、実際に運用していくための日々の確認項目や、ログの分析方法の確立など、考えることはまだまだたくさんあります。

モニタリング強化

ワンキャリアの各サービスには、「Service Level Objective:SLO」が定義されています。

具体的には「稼働率」や「Application Latency」、「Good Status Code」などの指標をDatadogでモニタリングしています。各チームごとにSLOに関する目標を持っていただき、毎月その達成状況や課題を確認する「SLO定例」をSREで主催しています。

以下のように、DatadogのSLOダッシュボード、およびAPMの値を見ながら開発チームと調査や対応を検討します。

SLO定例の議事録より抜粋:SLOダッシュボードで前月の達成度をチェック
SLO定例の議事録より抜粋:DatadogのAPMの値を見て、パフォーマンスを分析

そのSLO定例の定期開催も私の役割となりました。SLOは一度決めたら終わりではなく、プロダクトの成長に応じて見直したり、エラーバジェットを測定して、開発の中でパフォーマンスチューニングをどの優先度で行うべきかの指標としたり、SLOを活用することによって(Critical User Journey: CUJ )の分析、改善に繋げたり、ビジネスと開発をつなげる役割もあります。

私自身、SLOについて学びながら定例会を主催し、その中で今取得されていないメトリクスがあればモニタリング改善を行ったり、Datadogをより活用していくための設定見直しも合わせて行っています。

3ヶ月目

外部登壇など

9月に入り、外部登壇の機会もいただきました。9月頭には「AWS Unicorn Day Tokyo 2025」という、AWS主催のスタートアップに携わる主にデベロッパー・エンジニアのためのイベントがあり、その懇親会の場でLT会に登壇しました。

また、社内のスペースを利用した他社様との合同勉強会でも、LTで発表しました。前職まではほとんど外部登壇の機会がなかったため、自分の知識や経験を共有する場として、自身の理解度を深めるとともに、何か1つでも参考となる情報を参加した方に提供できれば良いなと思っています。
今後も機会があれば積極的に発信していきたいです。

気が付くと、あっという間に3ヶ月が過ぎていました。
まだまだ取り組むべきことや、自分の理解が及んでいないことも多くあり、日々学ぶことが多いです。学習という点では、ワンキャリアにはWeQuestという取り組みがあり、エンジニアは週1回、社内の勉強会で発表を行います。
詳しくはこちらの記事に書かれていますので、ご興味がある方はご覧ください。

事前の準備も含めて業務時間に行い、その過程も目標設定の一部に組み込まれています。忙しい中、こうした制度がきちんと運用されているところもいいなと思いました。
また、AIの活用も積極的で、私もTerraformのコード修正などに、Claude Codeを活用するようになりました。

私の好きな「コアバリュー」

「誠実さ:Integrity and Respect」です。
チーム内、社内チーム間、社外の方、エンドユーザー、全ての関係性に当てはまることだと思っています。
SREは特に開発チームと関わることが多いですが、依頼や相談に真摯に向き合うこと、相手の方に敬意を払うことが大事です。その気持ちを忘れずに、今後もSREとして成長していきたいと思います。


「人の数だけ、キャリアをつくる。」
ワンキャリアではミッション実現のために、事業・プロダクト開発を推進させる仲間を募集しています。弊社のエンジニア組織にご興味を持っていただけた方は、採用情報もチェックいただけると嬉しいです!

▼ワンキャリアのエンジニア組織のことを知りたい方はまずこちら

▼カジュアル面談を希望の方はこちら

▼エンジニア求人票


元の記事を確認する

関連記事