Một cách nữa để có thể loại bỏ, tách dữ liệu lặp lại ra khỏi dữ liệu thô đó là cách sử dụng cột phụ, dùng công thức để biết được dữ liệu nào lặp, dữ liệu nào không lặp như trong hình sau:
Ở đây, chúng ta sẽ kết hợp công thức COUNTIFS với câu điều kiện IF để kiểm tra dữ liệu lặp hay không dựa vào 3 cột A, B và C trong dữ liệu, nếu kết quả của hàm COUNTIFS lớn hơn 1 tức là dữ liệu đã lặp lại, ngược lại, dữ liệu là duy nhất.
Chú ý ở đây chúng ta phân biệt 2 trường hợp:
- Công thức để kiểm tra dữ liệu lặp không bao gồm lần đầu tiên dữ liệu xuất hiện:
=IF(COUNTIFS($A$2:$A2, $A2, $B$2:$B2, $B2, $C$2:$C2, $C2)>1, "Duplicate row", "Unique")
- Công thức để kiểm tra dữ liệu lặp có bao gồm lần đầu tiên dữ liệu xuất hiện:
=IF(COUNTIFS($A$2:$A$10, $A2, $B$2:$B$10, $B2, $C$2:$C$10, $C2)>1, "Duplicate row", "Unique")
Sau khi đã hoàn thành cột phụ để phân biệt được dữ liệu duy nhất và dữ liệu lặp. Việc còn lại chúng ta phải làm là sử dụng chức năng Filter quen thuộc của Excel để có thể loại bỏ được dữ liệu bị lặp:
- Chọn toàn bộ dữ liệu bao gồm cả cột vừa tạo
- Trong thẻ Data, bấm nút Filter hình cái phễu.
- Bấm chọn mục Duplicate row rồi bấm OK
- Sau đó, chúng ta đi xoá những dòng dữ liệu bị trùng bằng cách, chọn những dòng còn lại sau quá trình lọc, nhấn chuột phải và bấm Delete Row từ menu chuột phải.
Một cách tương tự, bạn cũng có thể sử dụng cách này để xoá dữ liệu lặp lại ở một lần cụ thể nào đó, dù dữ liệu đó có lặp lần thứ 3, lần thứ 4, lần thứ 5 v.v.