Q:
Tại sao các nhà quản lý nên bảo vệ chống lại sự dư thừa cơ sở dữ liệu?
A:Các nhà quản lý cơ sở dữ liệu và các chuyên gia CNTT khác nên bảo vệ chống lại sự dư thừa cơ sở dữ liệu của Cameron hoặc dữ liệu dự phòng dữ liệu của Cameron vì tất cả các tác động tiêu cực mà sự dư thừa có thể có trong hệ thống cơ sở dữ liệu hoặc môi trường. Bất cứ nơi nào một phần dữ liệu nhất định được sao chép, trong hai trường trong cơ sở dữ liệu hoặc trong hai môi trường cơ sở dữ liệu khác nhau, nó có thể có hậu quả cho việc truy xuất dữ liệu.
Một trong những lý do đầu tiên để tránh dư thừa dữ liệu là nó có thể lãng phí hoặc quá mức.
Điều quan trọng là chỉ ra rằng một số loại dự phòng dữ liệu được lên kế hoạch, để bảo vệ và sao lưu dữ liệu. Tuy nhiên, những người khác phát sinh từ mã hóa kém hoặc không hiệu quả, hoặc thiếu chú ý đến các thực tiễn tốt nhất. Trong nhiều trường hợp, lượng dư thừa dữ liệu lớn khiến cơ sở dữ liệu nhanh chóng phát triển vượt quá kích thước hợp lý. Với suy nghĩ này, nhiều nỗ lực chống lại sự dư thừa dữ liệu được thực hiện để tiết kiệm không gian trong cơ sở dữ liệu và do đó, để giảm chi phí và nỗ lực bảo trì. Tuy nhiên, điều này phải được thực hiện với mục đích hướng tới tính thực tiễn - các kỹ sư có thể thực hành một thứ gọi là sao chép dữ liệu, nhưng nó phải được thực hiện theo cách hiệu quả.
Ví dụ: người quản lý cơ sở dữ liệu có thể khám phá một cái gì đó như lấy đi một chuỗi từ một trường lặp lại, chẳng hạn như tên khách hàng hoặc công ty được chia sẻ và thay thế nó bằng một tham chiếu biến đơn giản trong đó chuỗi được giữ ở một nơi khác. Điều này có thể tiết kiệm không gian trên cơ sở dữ liệu - nhưng nó cũng có thể yêu cầu nhiều hoạt động của máy chủ hơn để thực hiện một truy vấn nhất định, vì vậy nó có thể không hiệu quả như vẻ ngoài của nó.
Một lý do lớn khác để sao chép dữ liệu hoặc tránh dư thừa dữ liệu là do sự nhầm lẫn có thể dẫn đến. Dữ liệu dư thừa trong cơ sở dữ liệu có thể gây ra nhiều loại dị thường. Một trong những điều này được gọi là sự bất thường cập nhật - sự bất thường cập nhật xảy ra khi một bản ghi được nhập lại với thông tin cập nhật, nhưng bản cập nhật không đưa nó trở lại bản ghi gốc. Trong tình huống như vậy, có thể có ba hồ sơ khác nhau cho một nhân viên công ty cụ thể, với ba chức danh công việc khác nhau và ba địa chỉ khác nhau, vì thông tin của người đó không được cập nhật trong toàn bộ cơ sở dữ liệu, mà chỉ trên hồ sơ được nhập lần cuối.
Theo đề xuất của các chuyên gia, quản trị viên cơ sở dữ liệu có thể tránh dư thừa dữ liệu theo thiết kế. Họ cũng có thể tham gia vào các thực tiễn chuẩn hóa dữ liệu có thể khắc phục các bất thường cập nhật và các loại dị thường khác bằng cách tiêu chuẩn hóa các cách lưu giữ các bản ghi của bảng cơ sở dữ liệu. Quản trị viên cơ sở dữ liệu cũng có thể theo đuổi các nỗ lực sao chép dữ liệu để dọn dẹp và chuẩn hóa dữ liệu theo các cách khác. Tất cả điều này phục vụ mục đích tạo các bảng cơ sở dữ liệu sạch hơn, làm cho các bản ghi cơ sở dữ liệu phù hợp hơn và ngăn chặn tất cả các vấn đề đau đầu và các vấn đề phức tạp liên quan đến dự phòng dữ liệu ngoài dự kiến.