LIVESENSE ENGINEER BLOG

リブセンスエンジニアの活動や注目していることを発信しています

SRE

マッハバイトのメインDBをAmazon Auroraに移行しました

こんにちは、かたいなかです。 2024年2月に長年の悲願だったマッハバイトのメインDBのAuroraへの移行を完遂しました!!! この記事では、どのようにマッハバイトのAurora移行を進めていったかを記事として残します。 なお、この記事の中では結構レガシーな…

大きなプロジェクトがコケるときには『受け身』をとりましょう

これは SRE アドベントカレンダー 2023 15日目とLivesense Advent Calendar 2023 番外編の記事です。 システム移行などの大きいプロジェクトでは、スコープも大きく、かかる時間も長いです。結果、つきまとう不確実性も大きくなり、残念ながらプロジェクトを…

マッハバイトのモノリシックなアプリケーションをオンプレからAWSに移行しました

移行の背景 どんなアプリケーションを移行したのか 移行後の構成 移行で直面した課題 認証・認可機構が複雑になっている 処理に時間がかかるエンドポイントがあり、ALBのIdle Timeoutのデフォルトでは足りなかった 非同期処理用のdelayed_jobのワーカーがバ…

DB移行を見据えたRidgepoleによる宣言的なスキーマ管理の導入

こんにちは、かたいなかです。 マッハバイトではシステムのオンプレからAWSへの移行を絶賛爆速で進めています。 そのなかでDB移行の下準備としてRidgepoleを導入することにしました。 今回はそのRidgepoleの導入について記事にまとめます。 Ridgepoleとは な…

マイナーなSaaSのCIを作っているんだが俺はもうダメかもしれない

はじめに CIの概要 出てきた課題と対策 ライブラリのtimeout値が固定値な上に短い ドキュメントにないパラメータがダマで増えた モニターのゾンビ化 想定したように設定が反映されずに手動で変更 YAMLのdiffツール(dyff)の自己主張が激しい 結局CI化するべき…

〜運用しやすいプレビュー環境を求めて〜 Gateway APIで作るサービスメッシュレスなプレビュー環境

みなさん、プレビュー環境してますか?どうも、かたいなかです。 以前、記事や登壇でIstioベースのPreview環境の構築方法をご紹介しました。 made.livesense.co.jp 外向けに発表したものの、Istioの運用工数や学習コストがネックとなってしまい、実際の転職…

cronジョブ監視サービスCronitorの設定をコード管理してCI/CDする

まえがき こんにちは、インフラグループの yjszk です。 今回は、Cronitorというツールについてご紹介します。Cronitorはジョブの状態を簡単に管理することができるモニタリングサービスです。 このサービスは、Cronジョブの監視を行うことができ、提供され…

Managed Node GroupでEKSの更新作業を楽にした話

こんにちは、かたいなかです。 最近、転職会議のEKSクラスタのワーカーノードをManaged Node Groupに置き換えました。 この記事ではManaged Node Group導入に際してどのような考慮が必要だったかを紹介します。 Cordon、Draining、Pod Disruption Budgetのお…

ECSを動かすEventBridge SchedulerをTerraformで構築してみた

こんにちは、インフラストラクチャーグループのyjszkです。2月から入社しました。 リブセンスにはバッチをECSとEventBridge Ruleで動かしている実装があります。EventBridge Ruleがなかなかの曲者で、UTCでしか時間を指定できません。 UTCで指定されたルール…

その時基盤が動いた 〜オンプレ オフィス移転で死す〜

これは Livesense Advent Calendar 2022 DAY 21 の記事です。 リブセンス インフラエンジニアのsheep_san_whiteです。お酒とロードバイクが大好きなおじさんです。 さて、リブセンスでは今年3月にオフィス移転を行いました。 オフィス移転に伴い開発環境のAW…

aws-cliのインストールが大変なので車輪の再発明をした話

AWSのサービスをちょっとだけ利用したいとき、aws-cliのインストールがだるいって思ったことはないでしょうか?私はあります。 そんなとき、どうするか? ※ これはリブセンスAdvent Calendar 2022の7日目の記事です。

クロスアカウントでの暗号化したRDSのスナップショット利用には気をつけようという話

これは Livesense Advent Calendar 2022 DAY 4 の記事です。 こんにちは。アルバイト事業部エンジニアの@mnmandahalfです。 今日は先日開催された社内LT大会で話したネタを記事にしてみたいと思います。 VPoEだけが追い出された?!エンジニアLT大会を開催し…

踏み台の管理コストを削減!ECS ExecとTerraformでつくる本番オペレーション環境

こんにちは。マッハバイトを運営するアルバイト事業部エンジニアの mnmandahalf です。 みなさんは本番DBへのSQLの手動実行等の作業をどんな環境で行なっていますか? 通常はDBにアクセスする用の踏み台サーバにSSHログインして作業を行うケースが多いと思い…

【転職会議】ArgoCDで実現するストレスフリーな新GitOps基盤

こんにちは、かたいなかです。 最近、転職会議のCI/CD基盤をFluxベースのものからArgoCDベースのものに式年遷宮しました。今回の記事では、新しいArgoCDでのCI/CD基盤について、作り直しに至った経緯や改善点をご紹介します。 ArgoCD移行に至った経緯 転職会…

Pull Requestをすぐ動作確認! マイクロサービスでのプレビュー環境の作り方

こんにちは、かたいなかです。 最近、マイクロサービスアーキテクチャを採用した環境でプレビュー環境の実現方法についていくつかのパターンを比較し整理する機会がありました。 今回の記事では、プレビュー環境を構築するための要件をなるべく特定の技術に…

多数のインフラ関連リポジトリをモノレポ構成にまとめたTips

前書き リブセンス インフラエンジニアの中野(etsxxx)です。VPoEという肩書きのそいつと同一人物です。 言うまでもなく写真と本文にはあまり関係ありません。コロナ禍前の、弊社のオフィスでのモノレポ化の風景です。 写真のそれとは異なりますが、私はTeach…

転職ドラフトのインフラをオンプレミスからAWSに移行した話

はじめに こんにちは2021年に転職会議から転職ドラフトの事業部に異動したyamitaniです。 異動前は転職会議でDB改善などの負債改善をメインにしてました。 made.livesense.co.jp 転職ドラフトでも改善活動を頑張っています。 何について話すか 今回はオンプ…

バージョニングの見直しとタグ・リリース作成の自動化

データプラットフォームグループ Livesense Brain チームの富士谷です。 機械学習基盤 Livesense Brain の開発・運用を行っています。 ここでは、Livesense Brain で開発するシステムのバージョニングの見直しと、 GitHub Actions を使ったタグ・リリース作…

Kubernetes manifests を単一リポジトリで集中管理する運用設計

Data Platform グループのリーダーの田中です。データ分析基盤 Livesense Analytics と機械学習基盤 Livesense Brain のプロジェクトマネジメント/アーキテクチャリングをしています。 今回は Livesense Brain における Kubernetes (k8s) manifest の管理方…

JAWS-UGコンテナ支部 #19 で転職会議でのEKS導入事例について話してきました

こんにちは、かたいなかです。 6/28に行われたJAWS-UGコンテナ支部 #19にて転職会議でのEKSの導入事例について話してきました。 jawsug-container.connpass.com JAWS-UG コンテナ支部 #19 from 理弘 山崎 この記事では、登壇時に解説した内容をスライドに書…

転職会議へのSLOの導入

こんにちは、転職会議のSREのかたいなかです。 転職会議のSREチームでは、現在SLOの導入に取り組んでいます。 最初の頃は、SLOに関しての知見がなかったこともあり導入の動きがドタバタになってしまい、今から考えるともっとうまく進められたなと思うことも…

画像配信システムにCDNの導入を試みた話

こんにちは。9月よりインターンとして参加しているインフラグループの幸田です。 現在リブセンスでは、高速化の取り組みを進めており、その一環として今回は画像配信システムへのCDN導入検証を行いました。 この記事では導入検証を通して見つけた、最低限確…

DNS over HTTPSを使ってDNSレコードを外形監視

こんにちは、インフラグループの水野です。 みなさん、DNSのレコードの監視を行っていますか? DNSレコードの変更ミス等を検知することはもちろん、自分たちの運営しているサービスの名前解決がユーザ側でどのように見えているのかというのを確認することは…

9つのWebサイトモニタリングサービスの使用感まとめ

移り変わりのはやいモニタリングサービス。新しいサービスが出ていたり、既存のサービスも使い勝手が変わっているかもしれません。そこで今回は、9つのモニタリングサービスについて、実際に触ってみた感想や費用について纏めてみました。

気軽に試せるエンタープライズSDS「ScaleIO」を試してみた

みなさんネットワークストレージはお好きですか? 今回は、EMCが提供するエンタープライズ向けSDS、「ScaleIO」について導入検証をしてみたのでご紹介いたします。

AWSの構成図をいい感じに出力してくる「Cloudcraft」を使ってみた

インフラグループでは、業務引き継ぎの際に構成図が必要な場面が多々あります。 そこで今回はAWSの構成図をいい感じに出力してくれる「Cloudcraft」についてご紹介したいと思います。

転職会議のECSデプロイ事情

'16新卒シリーズ第4弾。 今回は、転職会議チームがGolangで開発した、ECSへのDockerデプロイツール"pnzr"についてご紹介いたします!

Terraform & Packer での運用におけるサーバの構成変更

Terraform にて無停止でオンラインで入れ替えるImmutable Infrastructure な運用を実現するために、行っている際の工夫をご紹介します。

チームによる継続運用を意識したAWS環境におけるTerraformの活用

「特定の"インフラ担当"・"開発メンバー"」や「古の記憶」に頼らず、『開発メンバー全員が拡張や移行作業を気軽にできるインフラ』を実現するために、私のチームで採用しているTerraformを使ったAWS環境運用フローをご紹介いたします。 Terraformで移行およ…

あなたはどれだけ知ってる?〜監視&モニタリングツール19選〜

リブセンスでは過去 Nagios/Munin で行っており、現在では mackerel を利用していますが、この界隈も変化が激しく多種多様なツールが登場しているためここであげているようなツールの良いところどりをして運用の向上になればと思っています。