Sai lầm là do con người và tất cả chúng ta đều biết điều đó. Khi làm việc với một lượng lớn dữ liệu, mắt người không có khả năng xác định những điểm khác biệt hoặc tương đồng nhỏ giữa các mục dữ liệu.
May mắn thay, phần mềm khoa học dữ liệu như Google Trang tính có thể nắm bắt các chi tiết mà ngay cả mắt người nhạy bén nhất cũng có thể bỏ sót. Nhờ đó, các công việc như so sánh các cột, tìm sự khác biệt và xác định điểm tương đồng được thực hiện dễ dàng, với tốc độ cực nhanh và không có sai sót.
Trong hướng dẫn này, chúng tôi sẽ chỉ cho bạn cách bạn có thể sử dụng Google Trang tính để so sánh hai cột và tìm các kết quả phù hợp và khác biệt.
Đối với mỗi chủ đề ở trên, chúng tôi sẽ sử dụng dữ liệu mẫu sau, bao gồm hai cột – Thành phần bánh và Thành phần bánh quy:
Cũng lưu ý rằng trong trường hợp này, chúng tôi đang so sánh các cột trên cùng một trang tính. Nhưng bạn cũng có thể sử dụng các phương pháp tương tự để so sánh hai cột trong các tài liệu Google Trang tính khác nhau. Để thực hiện việc này, bạn sẽ cần sử dụng hàm IMPORTRANGE để có thể tham chiếu đến các cột trong trang tính khác.
Cách so sánh hai cột để khớp chuỗi chính xác
Cách dễ nhất để so sánh hai cột là tìm một chuỗi khớp chính xác. Tất cả điều này yêu cầu một so sánh từng dòng đơn giản.
Google Spreadsheets chỉ cần xem hàng nào có cùng giá trị và hàng nào có giá trị khác nhau và hiển thị kết quả trong cột trống thứ ba. Trong ví dụ của chúng tôi, chúng tôi sẽ chỉ tạo một cột mới cho kết quả và hiển thị TRUE nếu cặp mục trong cùng một hàng khớp và FALSE nếu chúng không khớp.
Công thức bạn sẽ sử dụng để so sánh như vậy là:
= A2 = B2
Công thức trên so sánh dữ liệu ở hàng 2 của cả hai cột để xem chúng có khớp nhau không. Nếu họ làm như vậy, thì bạn sẽ nhận được kết quả ĐÚNG. Nếu không, bạn sẽ nhận được kết quả FALSE.
Dưới đây là các bước để làm theo:
- Trong hàng thứ hai của cột C (trong ô C2), dán công thức: = A2 = B2
- Bấm phím quay lại.
- Bấm đúp vào ô điều khiển điền để sao chép cùng một công thức vào phần còn lại của các ô trong cột C.
Bây giờ bạn sẽ thấy kết quả của mỗi phép so sánh trong cột C.
So sánh hai cột và hiển thị văn bản có ý nghĩa
Phương pháp trên hoạt động hiệu quả nếu bạn là người duy nhất làm việc với dữ liệu.
Nhưng người thứ ba nhìn vào trang tính của bạn có thể không hiểu chính xác ý bạn là ĐÚNG và SAI.
Do đó, việc cung cấp kết quả mang tính mô tả nhiều hơn trong cột C. Ví dụ: bạn có thể sử dụng từ “Khớp” cho các phần tử hàng khớp và “Không khớp” cho các mục hàng không khớp.
Nếu muốn có kết quả mang tính mô tả cao hơn, bạn có thể sử dụng công thức IF đơn giản để trả về văn bản “Khớp” nếu các giá trị khớp và “Không khớp” nếu các giá trị khác nhau.
Để làm điều này, giả sử bạn đang làm việc trong ô C2 của ví dụ của chúng tôi, bạn sẽ sử dụng công thức sau:
= IF (A2 = B2, “Khớp”, “Không khớp”)
Công thức trên sử dụng hàm IF để so sánh các giá trị trong A2 và B2. Nếu điều kiện “A2 = B2” là đúng, văn bản “Khớp” được trả về. Nếu không, văn bản FALSE được trả về.
Dưới đây là các bước để làm theo:
- Trong hàng thứ hai của cột C (trong ô C2), hãy chèn công thức: = IF (A2 = B2, Đạt, Không đạt).
- Bấm phím quay lại.
- Bấm đúp vào ô điều khiển điền để sao chép cùng một công thức vào phần còn lại của các ô trong cột C.
Bây giờ bạn sẽ thấy kết quả của mỗi lần so sánh là Đạt hoặc Không đạt trong cột C.
So sánh hai cột và đánh dấu các hàng phù hợp
Nếu, thay vì hiển thị kết quả trong một cột riêng biệt, bạn muốn đánh dấu các hàng có dữ liệu phù hợp, bạn có thể định dạng có điều kiện.
Định dạng có điều kiện là một kỹ thuật tuyệt vời để định dạng các ô dựa trên một điều kiện.
Dưới đây là cách bạn có thể sử dụng định dạng có điều kiện để đánh dấu các hàng phù hợp trong Google Trang tính:
Bây giờ bạn sẽ thấy tất cả các ô / hàng phù hợp được đánh dấu bằng màu đã chọn.
Ghi chú. Nếu bạn muốn làm ngược lại, tức là chỉ đánh dấu các ô / hàng không khớp, hãy thay đổi công thức ở bước 7 thành: = $ A2 $ B2
So sánh hai cột để tìm dữ liệu phù hợp
Cho đến nay, các phương pháp chúng ta đã thảo luận về cơ bản đã xác định xem các ô trong cùng một hàng có khớp hay không.
Nhưng nếu bạn muốn so sánh hai cột và tìm ra giá trị nào của cột A được lặp lại trong cột B, bất kể nó nằm ở hàng nào?
Nó sẽ có ý nghĩa hơn đối với dữ liệu mẫu của chúng tôi, phải không? Bạn có thể muốn biết những nguyên liệu làm bánh nào cũng được sử dụng để nướng bánh quy.
Đây là cách bạn có thể sử dụng định dạng có điều kiện để tìm dữ liệu trùng lặp:
- Bấm vào menu Định dạng trên thanh menu.
- Chọn tùy chọn Định dạng có Điều kiện.
- Thanh bên “Quy tắc định dạng có điều kiện” mở ra ở phía bên phải của cửa sổ.
- Trong hộp nhập bên dưới “Áp dụng cho Phạm vi”, hãy nhập phạm vi ô mà bạn muốn áp dụng định dạng. Trong ví dụ của chúng tôi, chúng tôi chỉ muốn xem các điểm nổi bật của cột B. Vì vậy, chúng tôi nhập: B2: B12.
- Sau đó, bên dưới Định dạng Quy tắc, bên dưới Định dạng Ô Nếu, hãy bấm vào mũi tên thả xuống.
- Từ menu thả xuống xuất hiện, hãy chọn Công thức tùy chỉnh.
- Bạn sẽ thấy một trường nhập bên dưới trình đơn thả xuống. Nhập công thức của bạn tại đây: = COUNTIF ($ A $ 2: $ A $ 9, B2)> 0
- Trong phần Định dạng Kiểu, bấm vào nút Tô Màu ().
- Chọn màu bạn muốn sử dụng để đánh dấu các ô / hàng phù hợp. Chúng tôi đã chọn “màu xanh lam hoa ngô nhạt 1”.
- Cuối cùng, nhấp vào nút Xong để định dạng có điều kiện thực hiện công việc của nó.
Bây giờ bạn sẽ thấy tất cả các ô (thành phần) của cột B (cookie) cũng có trong cột A (bánh) được đánh dấu bằng màu đã chọn.
Giải thích công thức
Trong bài toán này, chúng tôi muốn tìm hiểu những thành phần nào của cột B cũng được tìm thấy trong cột A.
Nói cách khác, chúng tôi chỉ muốn chọn những phần tử của cột B có 1 hoặc nhiều lần xuất hiện trong các ô từ A2 đến A9.
Trong công thức:
= COUNTI ($ A $ 2: $ A $ 9; B2)> 0
Hàm COUNTIF đếm số lần giá trị trong B2 xuất hiện trong phạm vi ô A2: A9.
Nếu con số này lớn hơn 0, có nghĩa là một giá trị trùng lặp của B2 tồn tại trong cột A. Nó có thể tồn tại một, hai hoặc nhiều lần. Trong mọi trường hợp, miễn là bộ đếm lớn hơn 0, hàm trả về TRUE.
Khi hàm trả về TRUE, định dạng có điều kiện của chúng ta sẽ bắt đầu và đánh dấu ô B2.
Điều này được lặp lại cho tất cả các ô từ B2 đến B12.
So sánh hai cột để tìm dữ liệu bị thiếu
Điều gì xảy ra khi bạn muốn làm ngược lại? Nếu bạn muốn tìm thành phần cookie không có trong bánh thì sao? Trong trường hợp này, bạn sẽ chỉ cần sửa đổi một chút công thức được sử dụng trong bước 7 của phương pháp trước đó.
Công thức tùy chỉnh được sử dụng trong thanh bên của quy tắc định dạng có điều kiện bây giờ sẽ trông giống như sau:
= COUNTI ($ A $ 2: $ A $ 9; B2) = 0
Điều này là do bây giờ bạn muốn xem liệu có 0 lần xuất hiện của phần tử cột B trong cột A.
Điều này sẽ cho bạn một kết quả như dưới đây:
Đây là một số cách bạn có thể sử dụng Google Trang tính để so sánh hai cột. Chúng tôi đã sử dụng một mẫu nhỏ hơn để giúp bạn hiểu các khái niệm.
Nhưng các phương pháp được thảo luận trong hướng dẫn này có thể thực sự mạnh mẽ khi được sử dụng với các tập dữ liệu lớn, đặc biệt nếu bạn sử dụng chúng để xử lý phân tích.
Chúng tôi khuyến khích bạn áp dụng và thử nghiệm các phương pháp này và hy vọng bạn thấy những giải thích hữu ích.