Google BERT: Thuật toán hiểu ngữ nghĩa, ngữ cảnh và Entity

9/7/2021 2:32:29 PM

Google đã công bố bản cập nhật quan trọng nhất trong năm 2019. Bản cập nhật BERT tác động đến 10% các truy vấn tìm kiếm. BERT là gì và nó sẽ ảnh hưởng đến SEO như thế nào?

 
 

BERT là một Cập nhật chính của Google

Theo Google bản cập nhật này sẽ ảnh hưởng đến các truy vấn tìm kiếm phức tạp phụ thuộc vào ngữ cảnh.Đây là những gì Google nói:Những cải tiến này được định hướng xoay quanh việc cải thiện sự hiểu biết ngôn ngữ, đặc biệt đối với các truy vấn ngôn ngữ / hội thoại tự nhiên hơn, vì BERT có thể giúp Tìm kiếm hiểu rõ hơn về sắc thái và ngữ cảnh của các từ trong Tìm kiếm và kết hợp tốt hơn các truy vấn đó với kết quả hữu ích.Đặc biệt đối với các truy vấn dài hơn, nhiều cuộc trò chuyện hơn hoặc các tìm kiếm trong đó các giới từ như phạm vi đối với và đối với các vấn đề rất quan trọng, Tìm kiếm sẽ có thể hiểu ngữ cảnh của các từ trong truy vấn của bạn. Bạn có thể tìm kiếm theo cách cảm thấy tự nhiên cho bạn.

Thuật toán BERT là gì?

Chuyên gia tìm kiếm bằng sáng chế thuật toán Bill Slawski ( @bill_slawski  ) đã mô tả BERT như thế này:Bí mật là một cách tiếp cận trước khi đào tạo(pre-training) xử lý ngôn ngữ tự nhiên có thể được sử dụng trên một body lớn của văn bản. Nó xử lý các tác vụ như nhận dạng thực thể (Entity recognition), một phần của việc gắn thẻ lời nói và trả lời câu hỏi giữa các quy trình ngôn ngữ tự nhiên khác. Bert giúp Google hiểu văn bản ngôn ngữ tự nhiên từ Web. Google đã mở nguồn công nghệ này và các công nghệ khác đã tạo ra các biến thể của BERT.Thuật toán BERT (Bidirectional Encoder Representations from Transformers) là một thuật toán học sâu (deep-learning) liên quan đến xử lý ngôn ngữ tự nhiên. Nó giúp một cỗ máy hiểu được những từ trong câu có nghĩa gì, nhưng với tất cả các sắc thái của ngữ cảnh.

BERT và SEO On Page

Tôi đã hỏi chuyên gia thuật toán tìm kiếm Dawn Anderson ( @dawnieando trên Twitter) điều đó có nghĩa gì với SEO và cô ấy trả lời rằng nó sẽ không giúp các website được viết kém.Theo Dawn:BERT và family cải thiện tình trạng của nghệ thuật trên 11 nhiệm vụ xử lý ngôn ngữ tự nhiên. Ngay cả việc đánh bại sự hiểu biết của con người vì các nhà ngôn ngữ học sẽ tranh luận hàng giờ về phần lời nói chỉ một từ. Nhưng nếu trọng tâm của một trang là rất yếu thì sao? Ngay cả con người đôi khi cũng sẽ giống như những gì bạn quan tâm?Và đại từ(pronouns) đã có vấn đề rất lớn trong lịch sử nhưng BERT giúp với điều này khá nhiều. Bối cảnh được cải thiện vì tính chất hai chiều của BERT. Vẫn còn nhiều việc phải làm vì chúng tôi cần nhấn mạnh tầm quan trọng, sử dụng các cấu trúc rõ ràng, giúp biến dữ liệu phi cấu trúc thành dữ liệu bán cấu trúc, sử dụng tín hiệu trên các trang ánh sáng nội dung (ví dụ như hình ảnh nặng nhưng không phải văn bản trang thương mại điện tử nặng) những thứ như liên kết nội bộ.

BERT cải thiện hiểu biết truy vấn tìm kiếm

Cập nhật BERT của Google cải thiện cách Google hiểu các truy vấn tìm kiếm. BERT phân tích các truy vấn tìm kiếm, không phải các website. Tuy nhiên, như Dawn đã nói, SEO On Page trở nên quan trọng hơn về mặt sử dụng từ ngữ theo những cách chính xác. Nội dung cẩu thả có thể không được trợ giúp bởi bản cập nhật Google BERT.Dawn Anderson cho biết:Phần mềm đánh bật sự hiểu biết của con người ra khỏi nước trong vô số nhiệm vụ hiểu ngôn ngữ tự nhiên. BERT giống như một plugin WordPress là điểm khởi đầu và sau đó họ tùy chỉnh nó và cải thiện nó. Từ “rose” có nghĩa là một số vật(things) nhưng nó chính xác là cùng một từ. Bối cảnh phải đi kèm với từ nếu không từ này không có nghĩa (nothing).Dawn là chính xác. Trong quá trình nghiên cứu một bài thuyết trình mà tôi đã đưa ra tại PubCon Vegas 2019, tôi đã tìm kiếm một cụm từ phức tạp dựa vào ngữ cảnh để làm cho đúng.

Một ví dụ về bối cảnh và BERT

Cụm từ đó là “How to catch a cow fishing”? Ở New England, từ “cow” trong bối cảnh câu cá có nghĩa là cá vược sọc (striped bass).Cá vược sọc là loài cá nước mặn một trò chơi phổ biến mà hàng triệu người câu trên bờ biển Đại Tây Dương.Vì vậy, đầu tháng này, trong quá trình nghiên cứu cho một bài thuyết trình PubCon Vegas, tôi đã gõ cụm từ, “how to catch a cow fishing” và Google cung cấp kết quả liên quan đến chăn nuôi bò.Mặc dù tôi đã cố tình sử dụng từ “fishing” để cung cấp ngữ cảnh, Google đã bỏ qua bối cảnh đó và cung cấp kết quả liên quan đến bò. Đó là vào ngày 1 tháng 10 năm 2019.Hôm nay, ngày 25 tháng 10 năm 2019, cùng một kết quả truy vấn trong kết quả tìm kiếm có đầy đủ các kết quả liên quan đến cá vược và câu cá.Thuật toán BERT dường như đã hiểu ngữ cảnh của từ “fishing” là quan trọng và thay đổi kết quả tìm kiếm để tập trung vào các trang web liên quan đến câu cá.Dawn Anderson giải thích rằng kết quả tìm kiếm mới như thế này:Bass có nghĩa là những thứ khác nhau. Có những ý nghĩa khác nhau cho các từ đơn. Bối cảnh xung quanh từ này cung cấp nhiều ý nghĩa hơn.Cô ấy đúng. Đó chính xác là những gì Google đã làm trong truy vấn tìm kiếm, “how to catch a cow fishing”. Có vẻ như, BERT dường như đã sử dụng từ ngữ “fishing” để thêm ngữ cảnh vào truy vấn tìm kiếm đó.>> Tìm hiểu thêm về Tìm kiếm ngữ nghĩa ngữ cảnh và Entity tại đây

BERT có thể chỉ là sự khởi đầu

Dawn Anderson nói:Một nhà nghiên cứu mà tôi biết đã sử dụng BERT trong công việc của mình với các trợ lý, ví dụ như tương tự với Trợ lý Google, để kiểm tra việc sử dụng các câu hỏi làm rõ. Vì vậy, nó có nhiều công dụng. Nó chỉ là một điểm khởi đầu.Tôi hỏi:Vậy, bạn thấy đây là một bước trong một hành trình dài hơn?Và Dawn trả lời:Đúng, nhưng đó là một bước tiến lớn.  Lớn Nó giống như một bước nhảy lượng tử khổng lồ.Tôi đồng ý. Tôi sẽ không đi ra ngoài và tạo ra hàng ngàn cụm từ dài để cố gắng tận dụng khả năng của Google để hiểu ngữ cảnh tốt hơn.Tuy nhiên, giống như Dawn, tôi thấy đây là một cơ hội để mang lại nhiều lưu lượng truy cập hơn với nội dung được tập trung và tổ chức tốt hơn.>>Tìm hiểu thêm: Tổng hợp 9 thuật toán lõi của Google Roger Montti, SEL

Tin khác

Broad Core Update là gì? Cách khôi phục sau khi Google cập nhật Lõi Rộng

Hàng năm Google tung ra 1 vài lần bản cập nhật thuật toán cốt lõi rộng mới nhất của họ. Và cứ khi nào Google tung ra các bản cập nhật thuật toán cốt lõi rộng là các câu hỏi như “làm cách nào để biết nó update những gì” hoặc “tôi đã làm gì sai?”

by SeoTheTop | 22/06/2022

Google MUM: Tác động của Công nghệ AI này đối với SEO là gì?

Google MUM là một thuật toán được hỗ trợ bởi AI sẽ giúp tìm kiếm trực tuyến dễ dàng hơn. Nó có thể hiểu bất kỳ loại nội dung nào tốt hơn nhiều và kết nối các phần thông tin khác nhau để đưa ra câu trả lời chính xác cho các truy vấn tìm kiếm phức tạp.

by SeoTheTop | 23/12/2021

Google MUM là gì? Mọi thứ bạn cần biết về bản cập nhật MUM

Bản cập nhật Mô hình hợp nhất đa nhiệm (Multitask Unified Model - MUM) của Google, nhằm đáp ứng nhu cầu tìm kiếm hiện đại bằng cách sử dụng thuật toán do AI hỗ trợ để cải thiện khả năng tìm kiếm trực tuyến.

by SeoTheTop | 19/01/2022

Google Medic là gì? Những site nào bị ảnh hưởng và cách khắc phục bản cập nhật Medic

Bản cập nhật Medic của Google là giúp cải thiện việc xác định thẩm quyền và chuyên môn trực tuyến. Điều này được thực hiện thông qua các yếu tố xếp hạng cốt lõi của thuật toán để đảm bảo rằng nội dung chất lượng, có thẩm quyền và chuyên gia được xếp hạng trong kết quả tìm kiếm.

by SeoTheTop | 15/06/2021

Google BERT: Thuật toán hiểu ngữ nghĩa, ngữ cảnh và Entity

Thuật toán BERT là một thuật toán học sâu (deep-learning) liên quan đến xử lý ngôn ngữ tự nhiên. Nó giúp một cỗ máy hiểu được những từ trong câu có nghĩa gì, nhưng với tất cả các sắc thái của ngữ cảnh.

by SeoTheTop | 07/09/2021

Tổng hợp 10 Thuật toán Tìm kiếm Cốt lõi của Google

Google thường xuyên phát hành các thuật toán mới, nhiệm vụ của nó là cải thiện kết quả cho mỗi truy vấn nhằm đáp ứng được mục đích của người tìm kiếm. Bài viết sẽ tổng hợp 10 thuật toán tìm kiếm cốt lõi giúp bạn hiểu và tối ưu SEO tốt hơn

by SeoTheTop | 18/07/2023

Thuật toán Google Pigion: Chim bồ câu tác động tới tìm kiếm địa phương

Google Pigeon là thuật toán tìm kiếm địa phương của Google. Bản cập nhật này được phát hành vào ngày 24 tháng 7 năm 2014. Pigion tác động đến khả năng hiển thị tìm kiếm địa phương của các doanh nghiệp trên Google Search và Maps

by SeoTheTop | 26/05/2020

Thuật toán Google Panda: Cách khắc phục những trang có nội dung chất lượng thấp

Google Panda cho biết thuật toán này được thiết kế để giảm thứ hạng cho các trang web chất lượng thấp. Do vậy trang web của bạn cần phải đảm bảo được ít nhất 2 tiêu chí lớn: thông tin giá trị độc đáo và trải nghiệm người dùng tốt

by SeoTheTop | 01/06/2021

Thuật toán Google Possum: Tác động tới tìm kiếm địa phương Search Local

Cập nhập Thuật toán Google Pussum nhắm đến Tìm kiếm địa phương (Local Search) hoặc kết quả tìm kiếm Google Maps hoạt động tách biệt với tìm kiếm Organic Search bắt đầu từ ngày 1/9/2016

by SeoTheTop | 26/05/2020

Thuật toán Google FRED là gì? trang nào sẽ bị ảnh hưởng bởi Fred

Google Fred là một cập nhật thuật toán nhằm vào các chiến thuật mũ đen gắn liền với việc tập trung mục đích kiếm tiền quá nhiều. Bao gồm quá nhiều quảng cáo, nội dung có giá trị thấp và ít tiện ích người dùng.

by SeoTheTop | 26/05/2020