Blog About

Engineering

Published on
July 29, 2022
Tuning ElasticSearch storage
engineering data
Việc tối ưu bộ nhớ cho Database rất quan trọng đối với 1 Data Engineer, sau đây mình sẽ chia sẻ những cách mà Fossil đã sử dụng để tối ưu bộ nhớ cho ElasticSearch
Published on
July 12, 2022
Apache Spark behind the scenes
engineering data
Các bạn có thắc mắc sau khi submit 1 job cho Spark Cluster thì Spark sẽ làm những gì không? Cùng tìm hiểu với mình nhé.
Published on
March 10, 2022
Spark on Kubernetes tại Fossil
engineering data
Apache Spark được chọn làm công nghệ cho Batch layer bởi khả năng xử lý một lượng lớn data cùng một lúc. Ở thiết kế ban đầu, team data chọn sử dụng Apache Spark trên AWS EMR do có sẵn và triển khai nhanh chóng. Dần dần, AWS EMR bộc lộ một số điểm hạn chế trên môi trường Production. Trong bài viết này, mình sẽ nói về tại sao và làm thế nào team Data chuyển từ Spark trên AWS EMR sang Kubernetes.
Published on
January 4, 2020
Giảm kích thước Docker image cho ứng dụng Ruby on Rails
engineering
Việc giảm dung lượng Docker image tuân theo nguyên tắc cơ bản nhất chính là loại bỏ các thành phần không cần thiết trong Docker image
Published on
March 9, 2019
Automatically prefix commit message with Git hook
engineering git
In order to find all the commits relating to a specific JIRA issue as well as find the issue relating to a specific commit quickly, my team applies a common pattern for all commit message in our projects: `[ISSUE] MESSAGE`

Engineering

Tuning ElasticSearch storage

Apache Spark behind the scenes

Spark on Kubernetes tại Fossil

Giảm kích thước Docker image cho ứng dụng Ruby on Rails

Automatically prefix commit message with Git hook