Trang Chủ Cơ sở dữ liệu Dữ liệu lớn là gì? - định nghĩa từ techopedia

Dữ liệu lớn là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Dữ liệu lớn có nghĩa là gì?

Dữ liệu lớn đề cập đến một quy trình được sử dụng khi các kỹ thuật xử lý và khai thác dữ liệu truyền thống không thể khám phá những hiểu biết và ý nghĩa của dữ liệu cơ bản. Dữ liệu không có cấu trúc hoặc thời gian nhạy cảm hoặc đơn giản là rất lớn không thể được xử lý bởi các công cụ cơ sở dữ liệu quan hệ. Loại dữ liệu này đòi hỏi một cách tiếp cận xử lý khác gọi là dữ liệu lớn, sử dụng song song lớn trên phần cứng có sẵn.

Techopedia giải thích Dữ liệu lớn

Nói một cách đơn giản, dữ liệu lớn phản ánh thế giới đang thay đổi mà chúng ta đang sống. Càng nhiều thứ thay đổi, càng có nhiều thay đổi được ghi lại và ghi lại dưới dạng dữ liệu. Lấy thời tiết làm ví dụ. Đối với một người dự báo thời tiết, lượng dữ liệu được thu thập trên toàn thế giới về các điều kiện địa phương là đáng kể. Về mặt logic, sẽ có ý nghĩa rằng môi trường địa phương chỉ ra các hiệu ứng khu vực và các hiệu ứng khu vực chỉ đạo các hiệu ứng toàn cầu, nhưng nó cũng có thể là cách khác. Bằng cách này hay cách khác, dữ liệu thời tiết này phản ánh các thuộc tính của dữ liệu lớn, trong đó việc xử lý thời gian thực là cần thiết cho một lượng lớn dữ liệu và trong đó số lượng lớn đầu vào có thể được tạo ra bằng máy, quan sát cá nhân hoặc các lực bên ngoài như các điểm mặt trời.

Xử lý thông tin như thế này minh họa tại sao dữ liệu lớn trở nên quan trọng như vậy:

  • Hầu hết các dữ liệu được thu thập hiện nay không có cấu trúc và yêu cầu lưu trữ và xử lý tthan khác nhau được tìm thấy trong cơ sở dữ liệu quan hệ truyền thống.
  • Sức mạnh tính toán có sẵn là tăng vọt, có nghĩa là có nhiều cơ hội hơn để xử lý dữ liệu lớn.
  • Internet đã dân chủ hóa dữ liệu, tăng dần dữ liệu có sẵn trong khi cũng tạo ra ngày càng nhiều dữ liệu thô.

Dữ liệu ở dạng thô không có giá trị. Dữ liệu cần phải được xử lý để có giá trị. Tuy nhiên, đây là vấn đề cố hữu của dữ liệu lớn. Là xử lý dữ liệu từ định dạng đối tượng bản địa đến một cái nhìn sâu sắc có thể sử dụng có xứng đáng với chi phí vốn lớn để làm như vậy? Hay chỉ có quá nhiều dữ liệu với các giá trị không xác định để biện minh cho canh bạc xử lý nó bằng các công cụ dữ liệu lớn? Hầu hết chúng ta sẽ đồng ý rằng việc có thể dự đoán thời tiết sẽ có giá trị, câu hỏi đặt ra là liệu giá trị đó có thể vượt xa chi phí đưa tất cả dữ liệu thời gian thực vào báo cáo thời tiết có thể được tính vào hay không.

Dữ liệu lớn là gì? - định nghĩa từ techopedia