Bài viết nói về phần mềm:

Phần mềm Lọc Số Điện Thoại


Đang hoạt động
Phiên bản: 1.1.1.9
Lần cuối cập nhật: 06/04/2024 14:47
Dùng thử 1 ngày
Bản quyền: CẤP 1

Phần mềm lọc trùng, chia nhà mạng, làm đẹp danh sách SĐT.

Xem chi tiết

Regex pattern ra một biểu thức giúp ta có thể quét được một số cụm từ theo quy định trong một văn bản cho trước. Ví dụ quét SĐT hay Email trong văn bản ta sử dụng regex pattern gọi tắt là regex.

Phần mềm quét SĐT
Một mẫu Regex và giải thích cụ thể.

Next paragraph...

Trong bài viết này sẽ giúp bạn hiểu sơ regex pattern và có thể tự định nghĩa để lọc SĐT.

Để lọc SĐT trong văn bản hay nội dung text bất kỳ ta dùng 1 mẫu Regex như sau: 0[0-9\s.-]{9,13} , giải thích ý nghĩa của mẫu regex này như sau:

Tìm chuỗi bắt đầu bằng số 0, liên sau số 0 là một chuỗi các chữ số có thể có thêm dấu chấm (.) dấu gạch (-), khoảng trắng (\s) và chuỗi ký tự này dài từ 9 đến 13 ký tự.

Như vậy chỉ với định nghĩa đơn giản ngắn gọn ta hầu như bắt được 95% SĐT Việt Nam trong văn bản vì hầu hết SĐT được gõ dưới dạng một chuỗi số liền nhau hoặc cách nhau bằng khoảng trắng hoặc dấu chấm hoặc gạch ngang.

Phần mềm quét SĐT
Sử dụng phần mềm lọc SĐT từ văn bản.

Nhưng tùy theo văn bản mà người ta có thể để lại SĐT kiểu khác như +84909826364 thì regex trên không bắt được vì chuỗi không bắt đầu bằng số 0 vì vậy bạn phải định nghĩa lại Regex. Dưới đây là các quy ước cở bản để tạo regex:

.: đại diện cho bất kì kí tự nào ngoại trừ \
[abc]: khớp với 1 kí tự trong nhóm kí tự a, b hoặc c
[a-z]: khớp với 1 kí tự trong vùng từ a-z, ngăn cách bằng dấu –
[^abc]: khớp với 1 kí tự ngoại trừ nhóm kí tự a, b và c
\d: kí tự chữ số tương đương [0-9]
\D: kí tự không phải chữ số
\s: kí tự khoảng trắng (space)
\S: kí tự không phải khoảng trắng
\w: kí tự word (gồm chữ cái, chữ số và dấu _), tương đương [a-zA-Z0-9_]
\W: tương đương [^a-zA-Z0-9_]
^: bắt đầu 1 chuỗi hay 1 dòng
$: kết thúc 1 chuỗi hay 1 dòng
\: biểu diễn 1 kí tự đặc biệt trong regex thành kí tự thường (ví dụ \. sẽ khớp với dấu chấm, nếu thiếu \ sẽ hiểu nhầm là kí tự đại diện . phía trên mình đã nói)
|: kí tự tương đương phép or (sử dụng nhiều trong cặp móc tròn)
(): khớp với 1 nhóm các kí tự (ví dụ Ste(v|ph)en sẽ khớp với Steven hoặc Stephen)
?: khớp với kí tự đứng trước 0 – 1 lần (ví dụ S?even sẽ khớp Seven hoặc even)
*: khớp với kí tự đứng trước từ 0 lần trở lên (ví dụ Te*n sẽ khớp Tn, Ten, Teen, Teeen, Teeeen,…)
+: khớp với kí tự đứng trước từ 1 lần trở lên (ví dụ Te+n sẽ khớp Ten, Teen, Teeen,…)
{<n>}: khớp đúng với <n> kí tự trước đó (ví dụ Te{2}n sẽ khớp Teen)
{<n>,}: khớp với <n> kí tự trước đó trở lên (ví dụ Te{2,}n sẽ khớp Teen, Teeen, Teeeen,…)
{<n>,<m>}: khớp từ <n> đến <m> kí tự trước đó (ví dụ Te{1,3}n sẽ khớp Ten, Teen, Teeen,…)

Để tìm hiểu rõ hơn và đầy đủ về regex bạn có thể tìm cụm Regex Pattern qua Google.

Sau khi bạn am hiểu Regex bạn sẽ lấy được bất cứ thứ gì có quy tắc từ văn bản.

Regex được ứng dụng trong các phần mềm của iClick như Get Comment Facebook, Lọc SĐT.

Trân trọng, iClick.

phần mềm quét sđt regex regex pattern lọc sđt từ nội dung bất kỳ bắt sđt trong văn bản regex bắt sđt văn bản chính quy regex bắt email phần mềm lấy bình luận facebook

Thời gian đăng bài viết Tác giả: quanly | Thời gian đăng bài viết Đăng lúc: | Thời gian sửa lần cuối bài viết Lần sửa cuối: 10/01/18 21:43 | Đếm số lượt xem Số lượt xem: 16,125

Hãy là người đầu tiên viết bình luận