Top 5 cách lọc dữ liệu trùng trong Excel nhanh chóng
Microsoft Excel cung cấp cho người dùng nhiều tính năng như tính toàn cộng trừ, tạo bảng,... để dễ dàng quản lý dữ liệu. Tuy nhiên quá trình thao tác lâu dài sẽ xuất hiện những dữ liệu trùng lặp. Bài viết sau đây sẽ hướng dẫn bạn những cách lọc dữ liệu trùng trong Excel thật chi tiết.
Vì sao nên lọc dữ liệu trùng trong Excel?
Lọc dữ liệu trùng trong Excel là một thao tác nhỏ nhưng không kém phần quan trọng trong quá trình phân tích dữ liệu. Lọc dữ liệu trùng sẽ mang đến cho bạn những lợi ích bất ngờ như:
- Tăng tính chính xác: Nhiều dữ liệu trùng lặp có thể khiến kết quả của bạn bị sai lệch, ảnh hưởng đến kết quả tính toán, phân tích. Lọc dữ liệu sẽ khiến kết quả của bạn đảm bảo độ chính xác hơn.
- Tiết kiệm không gian lưu trữ: Loại bỏ các dữ liệu không cần thiết sẽ giúp bạn tối ưu không gian lưu trữ, giảm kích thước tệp và tăng cường hiệu suất của Excel.
- Dễ phân tích và quản lý: Khi dữ liệu không còn bị trùng lặp, bạn có thể dễ dàng tập trung vào những thông tin quan trọng mà không bị phân tâm bởi nhiều thông tin.
- Hiệu quả làm việc được cải thiện: Tốc độ làm việc của bạn sẽ được đẩy nhanh hơn khi bảng tính được loại bỏ những dữ liệu trùng.
Cách lọc dữ liệu trùng trong Excel
Dưới đây là một số phương pháp tìm và lọc dữ liệu bị trùng, bạn có thể lựa chọn phương pháp thích hợp để thực hiện:
Cách lọc dữ liệu trùng trong Excel với Remove Duplicate
Trong Excel có sử dụng một tính năng vô cùng mạnh mẽ là Remove Duplicate. Công cụ này có chức năng gộp các dữ liệu trùng lặp lại một cách nhanh chóng, chính xác.
Công cụ này được tích hợp lên mọi phiên bản của Excel. Để thực hiện, bạn làm theo những bước sau:
Bước 1: Dùng chuột tô đen dữ liệu bạn cần lọc -> Trên thanh công cụ chọn Data -> Click vào Remove Duplicates
Bước 2: Hộp thoại Remove Duplicates sẽ xuất hiện:
- Tick vào My data has headers nếu dòng đầu tiên trong bảng dữ liệu của bạn là tên cột
- Chọn Select All nếu bạn muốn lọc toàn bộ dữ liệu trên bảng, nếu không bạn có thể chọn một vài cột bạn muốn lọc.
Bước 3: Sau khi chọn xong, nhấn OK. Lúc này trên màn hình sẽ hiển thị hộp thoại thông báo số giá trị giống nhau (duplicate values) đã được xóa đi và số giá trị duy nhất (unique values) còn lại.
Sử dụng Conditional Formatting để tìm và lọc dữ liệu trùng trong Excel
Bên cạnh đó, nếu bạn chưa chắc về dữ liệu của mình và muốn kiểm tra chúng trước khi xóa, Conditional Formatting là một công cụ hữu ích để đánh dấu những dữ liệu trùng nhau
Bước 1: Chọn cột bạn cần lọc dữ liệu -> Ở mục Home phần Style bạn chọn Conditional Formatting -> Tiếp tục chọn Highlight Cells Rules -> Duplicates Values
Bước 2: Lúc này, màn hình sẽ hiển thị hộp thoại Duplicate Values.
- Giá trị trùng lặp sẽ được đánh dấu nếu ở ô đầu tiên bạn chọn Duplicate. Còn nếu làm nổi bật giá trị duy nhất trong vùng, bạn chọn Unique
- Ô thứ hai cho phép bạn chọn màu làm nổi bật, thông thường máy sẽ mặc định là màu đỏ nhạt và chữ đỏ đậm (Light Red Fill with Dark Red Text)
Lọc dữ liệu trùng bằng Advanced Filter
Advanced Filter là công cụ cho bạn lọc ra những giá trí mà bạn muốn, các giá trị khác vẫn nằm ở đó và không mất đi.
Bước 1: Tô đen dữ liệu bạn cần lọc -> ở tab Data mục Sort & Filter -> Bạn chọn Advanced
Bước 2: Hộp thoại Advanced Filter xuất hiện:
- Ở mục Action, chọn Filter the list, in-place nếu bạn muốn lọc trực tiếp trên vùng dữ liệu đó, Excel sẽ lọc ra các dòng có giá trị theo đúng điều kiện lọc. Chọn Copy to another location nếu bạn chỉ muốn giữ lại các giá trị đã lọc và copy nó sang một vị trí khác trong bảng tính.
- Mục List range chứa vùng dữ liệu bạn muốn lọc.
- Mục Criteria range chứa điều kiện lọc.
- Mục Copy to chỉ hiển thị khi bạn chọn vào thiết lập Copy to another location ở phía trên. Đây là nơi bạn sẽ chọn vị trí bạn muốn copy dữ liệu đã lọc.
- Quan trọng nhất ở đây là tick chọn vào Unique records only để lọc ra các giá trị trùng, chỉ giữ lại các giá trị duy nhất.
Phương pháp lọc dữ liệu trùng lặp nhờ Pivot Table
Ngoài ra, bạn cũng có thể chọn Pivot Table. Đây cũng là một công cụ giúp bạn dễ dàng tính toán hoặc thống kê dữ liệu thường được nhiều người dùng trong Excel.
Bước 1: Bạn chọn phạm vị dữ liệu cần xử lý. Ở mục Insert, bạn chọn Pivot Table
Bước 2: Trên hợp thoại Pivot Table from table or range bạn cần thực hiện vài thao tác:
- Kiểm tra ở phần "Table/Range" khu vực dữ liệu đã được chọn đúng chưa
- Phần "Choose where you want the Pivot Table to be placed" bạn có thể lựa chọn New Worksheet nếu bạn muốn kết quả xuất hiện ở trang tính mới hoặc chọn Existing Worksheet khi bạn muốn đặt kết quả ở vị trí cụ thể -> Nhấp OK
Bước 3: Hộp thoại Pivot Table sẽ xuất hiện:
- Trong cửa sổ PivotTable Fields bạn kéo cột mà bạn muốn lọc dữ liệu trùng vào ô Rows
- Tiếp tục kéo cột đó vào ô Values và chọn Value Field Settings là Count
Thủ thuật lọc dữ liệu trùng trong Excel bằng hàm
Bên cạnh những công cụ hỗ trợ, bạn cũng có thể lựa chọn sử dụng các công thức để tiến hành lọc dữ liệu:
Bước 1: Thêm một cột Kiểm Tra vào vùng dữ liệu trên sheet thứ hai đã được tạo.
Bước 2: Nhập công thức cho cột Kiểm Tra như sau:
=IF(ISNA(VLOOKUP(A2,'Sheet1 (2)'!A1:B14,1,0)),"Unique","Duplicate")
Bước 3: Áp dụng công thức cho toàn bộ cột Kiểm Tra. Những giá trị bị trùng lặp sẽ được trả về giá trị “Duplicate”, còn giá trị duy nhất sẽ trả về giá trị “Unique”.
Những lưu ý khi lọc dữ liệu trùng trong Excel
Để cho quá trình lọc được thuận lợi cũng như không gây ra các tình trạng hỏng hoặc mất dữ liệu, bạn cần lưu ý một số yếu tố sau:
- Sao lưu dữ liệu gốc: Để tránh tình huống trong quá trình lọc xảy ra sai sót làm mất dữ liệu, bạn nên sao lưu bản gốc trước đó.
- Xác định tiêu chí lọc: Xác định rõ tiêu chí lọc, cột dữ liệu bạn muốn lọc, việc làm này sẽ giúp bạn đảm bảo mình đang thực hiện đúng theo mong muốn.
- Kiểm tra kết quả sau khi lọc: Đôi lúc, kết quả lọc sẽ không như bạn mong muốn. Vì thế, bạn nên kiểm tra lại kết quả cẩn thận.
- Thực hành trước với bản sao: Nếu bạn vẫn chưa quá tự tin với khả năng lọc dữ liệu của mình, bạn có thể thực hành trước trên các bản sao dữ liệu trước khi dùng trên tài liệu gốc.
Bài viết trên GEARVN đã miêu tả chính xác và cụ thể cách lọc dữ liệu trùng trong Excel mà bạn có thể ứng dụng. Những thủ thuật này sẽ giúp bạn có được một bảng dữ liệu "sạch" hơn để bạn dễ dàng quan sát, phân tích.