Trang Chủ Phát triển Biểu thức chính quy là gì? - định nghĩa từ techopedia

Biểu thức chính quy là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Biểu thức chính quy có nghĩa là gì?

Biểu thức chính quy là một phương thức được sử dụng trong lập trình để khớp mẫu. Biểu thức chính quy cung cấp một phương tiện linh hoạt và súc tích để khớp với chuỗi văn bản. Ví dụ: một biểu thức thông thường có thể được sử dụng để tìm kiếm trong một khối lượng lớn văn bản và thay đổi tất cả các lần xuất hiện của "con mèo" thành "con chó".


Các biểu thức thông thường được sử dụng cho các hệ thống tô sáng cú pháp, xác thực dữ liệu và trong các công cụ tìm kiếm như Google, để cố gắng xác định kết quả khớp thuật toán với truy vấn mà người dùng đang hỏi.


Biểu thức chính quy cũng được biết đến dưới dạng ngắn là regex hoặc regrec.

Techopedia giải thích Biểu thức chính quy

Các tiện ích, trình soạn thảo văn bản và ngôn ngữ lập trình sử dụng các biểu thức thông thường để thao tác và tìm kiếm các mẫu văn bản. Mặc dù một số ngôn ngữ tích hợp các biểu thức chính quy vào cốt lõi của cú pháp ngôn ngữ, như TCL, Awk, PERL và RUBY, các ngôn ngữ khác sử dụng các biểu thức chính quy thông qua các thư viện, chẳng hạn như Java, C ++ và C. Điều này có nghĩa là có các khác biệt triển khai để biểu thức chính quy hoạt động. tốt với một ứng dụng có thể hoặc không thể hoạt động với ứng dụng khác. Sự khác biệt tinh tế tồn tại.


Biểu thức thông thường có thể là vô cùng mạnh mẽ. Về cơ bản, nếu mẫu có thể được xác định, một biểu thức chính quy có thể được tạo. Một mẫu đơn giản có thể là một cái gì đó đơn giản như tìm tất cả các tình huống trong đó một câu kết thúc bằng "cái đó" và được thay thế bằng "cái". Mô hình có thể trở nên phức tạp hơn bằng cách thực hiện thay thế tương tự nhưng chỉ ở lần xuất hiện thứ 3 và thứ 5 của trận đấu. Hoặc có thể còn phức tạp hơn nữa bằng cách sử dụng các bộ ký tự khớp khác nhau tùy thuộc vào tần suất và vị trí của các ký tự khớp trước đó.


Ba thành phần chính của biểu thức chính là các neo được sử dụng để chỉ định vị trí của mẫu liên quan đến một dòng văn bản, các bộ ký tự khớp với một hoặc nhiều ký tự ở một vị trí và các bộ sửa đổi chỉ định số lần bộ ký tự trước được lặp lại.


Các hoạt động giúp xây dựng các biểu thức chính quy là:

  • Định lượng: Bộ định lượng cho biết mức độ thường xuyên xảy ra của phần tử trước.
  • Phân nhóm: Các toán tử có thể có phạm vi và quyền ưu tiên được chỉ định bằng cách sử dụng dấu ngoặc đơn.
  • Điều kiện Boolean: Điều kiện OR hoặc AND có thể được nêu cho các toán tử và nhóm.
Biểu thức chính quy sử dụng các thuật toán như Tự động hóa hữu hạn xác định (DFA) và Tự động hóa hữu hạn không xác định (NFA) để khớp với một chuỗi. Trong một NFA, đối với mỗi cặp trạng thái và ký hiệu đầu vào, có một số trạng thái tiếp theo có thể có, trong khi DFA chấp nhận một chuỗi ký hiệu hữu hạn.

Biểu thức chính quy là gì? - định nghĩa từ techopedia