Trang Chủ Bảo vệ Dữ liệu nhiễu loạn là gì? - định nghĩa từ techopedia

Dữ liệu nhiễu loạn là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Data Perturbation có nghĩa là gì?

Xáo trộn dữ liệu là một hình thức khai thác dữ liệu bảo mật quyền riêng tư cho hồ sơ sức khỏe điện tử (EHR). Có hai loại nhiễu dữ liệu chính phù hợp để bảo vệ dữ liệu EHR. Loại thứ nhất được gọi là phương pháp phân phối xác suất và loại thứ hai được gọi là phương pháp biến dạng giá trị. Chuyển dữ liệu được coi là một kỹ thuật tương đối dễ dàng và hiệu quả trong việc bảo vệ dữ liệu điện tử nhạy cảm khỏi việc sử dụng trái phép.

Techopedia giải thích dữ liệu Perturbation

Truyền dữ liệu đã được ca ngợi là một ứng dụng bảo vệ dữ liệu trong chăm sóc sức khỏe hiệu quả hơn so với nhận dạng / xác định lại do xác suất cao hơn các cuộc tấn công có thể xảy ra liên kết các tập hợp dữ liệu công khai với các định danh hoặc đối tượng ban đầu. Vì lý do này, pertubation dữ liệu được ca ngợi là một ứng dụng vững chắc hơn khi nói đến bảo mật EHR.


Phương pháp phân phối xác suất lấy dữ liệu và thay thế nó từ cùng một mẫu phân phối hoặc từ chính phân phối. Cách tiếp cận biến dạng giá trị gây nhiễu dữ liệu bằng nhiễu đa bội hoặc cộng gộp hoặc các quá trình ngẫu nhiên khác. Nó được coi là hiệu quả hơn so với loại nhiễu loạn trước đây. Cách tiếp cận này xây dựng các trình phân loại cây quyết định, ví dụ, mỗi phần tử được gán nhiễu ngẫu nhiên từ phân phối Gaussian. Bằng cách khai thác dữ liệu, phân phối dữ liệu ban đầu được xây dựng lại từ phiên bản nhiễu loạn của nó. Tuy nhiên, các nhà phê bình chỉ ra thực tế rằng tiếng ồn phụ gia ngẫu nhiên có thể được lọc có thể dẫn đến thỏa hiệp quyền riêng tư EHR.

Dữ liệu nhiễu loạn là gì? - định nghĩa từ techopedia