Là một trong bảy công cụ chất lượng huyền thoại, biểu đồ phân bố tần suất thoạt nhìn qua thì cũng là một biểu đồ cột thôi mà. Vậy biểu đồ cột này có gì đặc biệt, có ý nghĩa, tầm quan trọng như thế nào trong kiểm soát chất lượng và sản xuất mà lại nằm trong bộ 7 anh em nhà QC Tools? Mời bạn đọc cùng tìm hiểu và làm rõ theo từng phần bên dưới nhé!
1. Biểu đồ phân bố tần suất là gì?
Biểu đồ phân bố tần suất (Histogram Diagram) hay còn gọi là biểu đồ phân bố tần số hoặc biểu đồ mật độ phân bố… là một dạng biểu đồ cột cho thấy tần suất xuất hiện của mỗi giá trị khác nhau trong một tập dữ liệu. Qua đó, cho thấy sự thay đổi/ biến động của tập dữ liệu đó và dựa vào hình dạng của biểu đồ mà người ta có thể đưa ra những kết luận về tình trạng bình thường hay bất thường của chỉ tiêu chất lượng, của quá trình.
Vậy, có những dạng biểu đồ nào và làm sao để xác định ??
2. Một số dạng biểu đồ điển hình và ý nghĩa của chúng
Có nhiều dạng biểu đồ phân bố tần suất. Nhưng trong bài chia sẻ này, tôi xin giới thiệu một số dạng sau đây:
2.1. Phân phối chuẩn: là biểu đồ phân bố tần suất có dạng hình chuông. Ở dạng này, tần suất xuất hiện là nhiều nhất ở trung tâm và giảm dần về hai phía (lưu ý rằng hai phía có dạng đối xứng) như hình minh họa bên dưới. Đây là dạng lý tưởng mà các quá trình hướng tới. Đỉnh chuông càng cao, đáy chuông càng nhỏ tức là quá trình càng ổn định.
2.2. Phân phối lệch: là dạng phân phối không cân xứng. Ở dạng phân phối này, giá trị trung bình của đồ thị bị lệch về bên trái hoặc phải, tạo nên hình dáng không cân đối. Có thể phán đoán rằng dữ liệu đã bị giới hạn ở 1 phía, tạo nên sự bất thường. Qua đó, tập trung tìm nguyên nhân của sự bất thường.
2.3. Phân phối hai đỉnh: ở dạng này, biểu đồ thu được trông giống như lưng của một con lạc đà 2 bướu. Tần suất xuất hiện tại trung tâm thấp hơn các khoảng lận cận tạo nên hình dạng nói trên. Dựa vào đây, có thể phán đoán rằng đã có sự trộn lẫn của 2 nhóm dữ liệu có phân bố khác nhau (ví dụ: dữ liệu của hai máy, hai ca làm việc…). Khi này, có thể thử phân thành 2 (hay nhiều) phân bố có giá trị trung bình khác nhau, vẽ riêng từng biểu đồ để phân tích.
2.4. Phân phối đảo nhỏ: là dạng phân phối có hình dáng trông như một hòn đảo, nằm tách biệt tại bên trái hoặc bên phải của phân bố so với các dữ liệu còn lại. Hòn đảo nhỏ này được gọi là những giá trị ngoại lai. Dựa vào đây, ta có thể phán đoán rằng có một phần nhỏ dữ liệu bất thường từ một phân bố khác được trộn lẫn vào. Khi này, nên tìm hiểu lại lịch sử lấy dữ liệu để tìm ra được vấn đề và tiến hành cải tiến.
2.5. Phân phối răng lược: ở dạng phân phối này, biểu đồ thu được có hình dạng trông như một cây lược. Do tần suất của dữ liệu phân phối không đồng đều dẫn đến việc xuất hiện những thanh cao và ngắn xen kẻ nhau nên mới tạo ra hình dạng nói trên. Nhìn vào đây, chúng ta có thể phán đoán được rằng đây là kết quả của những dữ liệu bị làm tròn, hoặc xây dựng biểu đồ phân bố ban đầu đã không chính xác.
3. Lợi ích của biểu đồ phân bố tần suất
Biểu đồ tần suất cho chúng ta biết được bốn vấn đề sau:
- Giá trị thường xuất hiện nhất (mode)
- Mức độ thường xuất hiện của mỗi giá trị
- Hình dạng của phần bố
- Mối quan hệ giữa dữ liệu và các giới hạn yêu cầu
Qua đó, thấy được tình trạng của quy trình so với tiêu chuẩn đặt ra. Và dựa vào dạng phân phối của biểu đồ còn có thể phán đoán các vấn đề tồn tại trong quy trình. Từ đó, nghiên cứu và tìm hướng xử lý thích hợp hoặc đưa ra cải tiến…
Đến đây thì thật không quá lời để nói Histogram là một công cụ chất lượng huyền thoại đúng không nào? Nếu bạn đang tự hỏi, làm cách nào để có một biểu đồ phân bố như vậy? Mời bạn cùng tiếp tục tham khảo tiếp nhé!
4. Các bước để tạo một biểu đồ phân bố tần suất cơ bản
Có nhiều cách cũng như nhiều công cụ (Excel, Stagraphic,..) để xây dựng một biểu đồ phân bố, ở bài viết này tôi sẽ đưa ra cách vẽ biểu đồ Histogram bằng phương pháp thủ công, cơ bản. Mời bạn cùng theo dõi các bước sau đây:
4.1. Thu thập dữ liệu
Thu thập ít nhất 50 dữ liệu liên tiếp từ một quá trình (n>50)
Ví dụ: Trong khoảng thời gian 1 tháng, có 100 dữ liệu được thu thập. Dữ liệu như bảng dưới đây:
4.2. Tính toán các dữ liệu thống kê
Trước khi đi vào tính toán các dữ liệu thống kê, chúng ta hãy cùng nhau làm quen với một số thuật ngữ liên quan đến Histogram:
- Số lớp là các giá trị dữ liệu trong một khoảng nào đó được dùng để xây dựng biểu đồ tần suất. Mỗi cột trong biểu đồ thể hiện cho một lớp.
- Độ rộng của lớp chính là độ rộng của cột trong biểu đồ.
- Độ rộng dãi dữ liệu là sai khác giữa giá trị lớn nhất và nhỏ nhất.
1. Tính số lớp dữ liệu (k): Số lớp thường xấp xỉ bằng căn bậc 2 của số dữ liệu và có các điều chỉnh để quyết định độ rộng thích hợp.
Trong ví dụ này, có 100 dữ liệu. Ta chọn k = 10
2. Tính độ rộng của toàn bộ dữ liệu (R):
Overall Range (R) = Giá trị lớn nhất – Giá trị nhỏ nhất
Ở ví dụ này, độ rộng dải dữ liệu R = 73 – 53 = 20
3. Tính độ rộng của lớp (h): h = R/k
Ở ví dụ này, độ rộng của lớp h = 20/10 = 2
Trong trường hợp h tính ra dạng phân số, làm tròn h cho số nguyên gần nhất.
4. Xác định biên độ trên và biên độ dưới của các lớp dữ liệu
- Biên độ dưới của lớp thứ nhất được xác định bằng:
Giá trị Min – ½ * giá trị thay đổi thấp nhất của dữ liệu
Trong trường hợp này, giá trị thay đổi thấp nhất của dữ liệu là 1 (ví dụ 56, 57, 58,.. có giá trị thay đổi thấp nhất là 1). Do đó, biên độ dưới lớp thứ nhất = 53 – ½*1 = 52.5
- Biên độ trên của lớp thứ nhất được xác định:
Biên độ dưới lớp thứ nhất+ độ rộng của lớp
Ví dụ này, biên độ trên = 52.5 + 2 = 54.5
- Biên độ dưới lớp thứ 2 được xác định:
Biên độ dưới lớp thứ 2 = Biên độ trên của lớp thứ nhất = 54.5
- Biên độ trên lớp thứ 2 được xác định:
Biên độ trên lớp thứ 2 = Biên độ dưới lớp thứ 2 + độ rộng của lớp = 56.5
Tương tự với các lớp còn lại, ví dụ này ta có 10 lớp dữ liệu tương ứng:
4.3. Xác định tần suất của lớp dữ liệu
Đếm số dữ liệu (data points) trong mỗi lớp, ta có bảng tần suất:
4.4. Vẽ biểu đồ tần suất
- Trục x biểu diễn các lớp
- Trục y biểu diễn tần số xuất hiện
- Chiều cao của cột thể hiện mức độ thường xuyên xuất hiện của mỗi dữ liệu trong lớp
Lưu ý: Trước khi đưa ra bất kỳ kết luận nào từ biểu đồ, bạn phải đảm bảo rằng quy trình hoạt động bình thường trong khoảng thời gian phân tích. Nếu có bất kì sự bất thường nào xảy ra tác động đến quy trình trong lúc phân tích, thì kết quả cũng như hình dạng phân bố sẽ không thể tổng quan cho tất cả các khoảng thời gian của dữ liệu.
Trên đây là một số chia sẻ về biểu đồ phân bố tần suất cũng như hướng dẫn cách vẽ biểu đồ Histogram bằng phương pháp thủ công, cơ bản (tham khảo: ASQ). Mong rằng bài viết này sẽ có ích cho bạn đọc.
Ngoài ra để thuận tiện hơn, bạn đọc có thể tải file Worksheet có sẵn tại đây để tham khảo và sử dụng !!
Minh Duc