Last updated on
8月5日~8月9日の技術ログ
8/5(月)
読んだ記事
- Snykを導入する中でShitLftするだけでは解決されない課題と運用ベースの対応では不十分な課題について
- DevSecOpsとは
- 前回初プロセスで脆弱性が入り込むリスクを権限するチェックを盛り込む など
- 内回り … シフトレフト
- 自動化された脆弱性スキャンなど
- CICDとかでやるもの
- 外回り … デプロイ後の運用環境でのセキュリティ対応
- ECRの自動スキャン
- ECSで実行中のコンテナイメージを定期的に自動スキャン
- Fargateでミスコンフィグの検知・修正
通信をすべてNAT Gatewayを通していませんか?棚卸しによる70%のコスト削減に成功!
- VPCフローログでNatGatewayの通信先を特定している
- EKSの知識がなくわからなかった
- EKSのベースをいつかどこかで身に着けておきたい
- テスタブルなインフラプロジェクト
- インフラのテストは一般的に普及していない
- dev環境はなく、sandbox, test環境がある
- sandboxは各インフラ開発者の手動環境
- 破壊可能な環境でインフラリソース開発やアプリケーションエンジニアのトレーニング環境としての用途
- インフラ初心者が何をやっても壊れないための仕組み作りと権限管理は必須
- sandbox環境はしっかり考えて自社への導入も検討したい
- test環境はCI専用環境
- エラーバジェット
- システムがどれだけ問題を許容できるかを定義する指標
- SLOの指標の定義ができていてもエラーバジェットの導入まではできていないケースが多い
Embedded SREの実践: 開発チームから始めるSRE推進
- 金融機関の業務フローに組み込まれるプロダクトのSRE
- 活動内容
- モニタリング・オブザーバビリティ
- CloudWatch
- Sentry
- New Relic
- SLI管理
- DBパフォーマンス改善
- ポストモーテム
- コスト最適化
- ライフサイクル管理
- 構成管理 IaC
- セキュリティ
- トイル撲滅
- モニタリング・オブザーバビリティ
- Embedded SREとは
- 開発チームにSREが配置される体制
- 自分はこれに近い気がする
- 開発チームにSREが配置される体制
GitHub ActionsでCheckが通ったらDraft PRを自動でopenにしたかった
Emotionからvanilla-extractへの移行!Recipesスタイリングで最適化
- App Routerでクライアントサイドでの実行でvanilla-extractの優位性を説明している
- Emotionと書き方の違いはスタイルのファイルが分離されること
LaravelエンジニアやDocker利用者向け、便利なMakefile集 - Qiita
- makefileをエイリアスみたいに使っている
SRE NEXT 2024@Abema Tower 登壇資料まとめ
- 気になった資料は目を通してまとめる
テスト自動化実践ガイドは目的も実践もほしい情報が揃っていて、まさにガイドでした
7月のAWSコスト分析
- 担当プロジェクトのCost Explorerを見ていて気になった部分
- EC2 として計上されているコスト
- Natgatewayのコストがほとんど
- CDKでスタック毎削除しているため時間単位のコストは15$程度のはず
- 実際のコストは44$程度
- Natgateway経由の通信料が過剰な可能性
- アクセス制限しているし、ECRのイメージのpullが原因のはず
- Natgatewayのコストがほとんど
- CDKでスタック毎削除・デプロイしているALB・RDSのコスト
- 計算してみたら予算とほぼ一致、妥当
- CodeBuildのコスト
- 実行時間単位の課金
- デプロイの数を見れば適切と判断
- EC2 として計上されているコスト
8/6(火)
読んだ記事
Cloudflare D1 を使った日本語の全文検索を実装する
巨大インフラ産業で戦うSRE / SRE working in the large infrastructure industry
- Code Climateでカバレッジの可視化とCodeSmellの指摘
- ファイルの複雑さなどがわかるらしい
アンドパッドのマルチプロダクト戦略を支えるSRE / SRE NEXT 2024
コーヒーの味を維持したまま量を変える変換器を作成しました - Qiita
8/8(木)
読んだ記事
SRE NEXT2024 登壇&体験記 その2 - エムスリーテックブログ
敵対的SRE: 300個のジョブをAIチーム全員で支える技術
- 監視について
- 「エラーで落ちた」だけじゃなくて原因も載せるとすぐにわかる
- 成功を監視
- 遅くなっていたジョブが検知できるように
- 成功を定義して監視するのが重要
- バッチなら各ジョブのSLOを定義して監視する
- SLOを通知する・しないの分岐点にする
障害への不安をぶっ壊す!カオスエンジニアリングを運用しシステムとチームの耐障害性を高める - ZOZO TECH BLOG
- LambdaやStepFunctionsがAiの分野でも利用されている
[アップデート] Cost Optimization Hub でも組織の委任管理者を設定出来るようになりました | DevelopersIO
8/9(木)
読んだ記事
SRE NEXT 2024でクライアントサイドへのSLI/SLOの導入についてお話しました
- クライアントサイドのSLOSLI策定例