In data cleansing, what does the term "data deduplication" refer to?

Converting data into a standardized format
Encrypting sensitive data for security
Identifying and removing duplicate records
Indexing data for faster retrieval

In data cleansing, the term "data deduplication" refers to the process of identifying and removing duplicate records or entries from a dataset. By detecting and eliminating redundant data, data deduplication helps improve data quality, reduce storage space requirements, and enhance the efficiency of data processing and analysis. It is a crucial step in maintaining data integrity and consistency.

Add your answer