fbpx

Pandu Nayak của Google chia sẻ lộ trình của mình cho MUM và cách nó có thể giúp công ty xử lý các truy vấn phức tạp hơn

Back to Blog

Pandu Nayak của Google chia sẻ lộ trình của mình cho MUM và cách nó có thể giúp công ty xử lý các truy vấn phức tạp hơn

“Không có kỳ vọng rằng nó sẽ trở thành hệ thống trả lời câu hỏi này,” Nayak nói với Search Engine Land, đồng thời nói thêm rằng hệ thống như vậy “không hữu ích” cho những nhu cầu phức tạp.

Phần lớn, các công cụ tìm kiếm đã hoạt động theo cùng một cách trong hai thập kỷ qua. Họ đã cải thiện trong việc xác định mục đích, cung cấp các kết quả có liên quan và kết hợp các ngành dọc khác nhau (như hình ảnh, video hoặc tìm kiếm cục bộ), nhưng tiền đề vẫn như cũ: nhập truy vấn văn bản và công cụ tìm kiếm sẽ trả về kết hợp các liên kết không phải trả tiền, kết quả nhiều định dạng và quảng cáo.

Với những tiến bộ gần đây hơn, như BERT, các công cụ tìm kiếm đã tăng khả năng xử lý ngôn ngữ của chúng, cho phép chúng hiểu rõ hơn các truy vấn và trả về các kết quả phù hợp hơn. Thậm chí gần đây, Google đã công bố Mô hình Hợp nhất Đa nhiệm (MUM), một công nghệ mạnh hơn BERT gấp 1.000 lần, theo Google, và kết hợp sự hiểu biết ngôn ngữ với khả năng nhập liệu đa nhiệm và đa phương thức.

Trong cuộc trò chuyện với Search Engine Land, Pandu Nayak, Phó chủ tịch phụ trách tìm kiếm của Google, đã vạch ra cách MUM có thể thay đổi cơ bản cách người dùng tương tác với công cụ tìm kiếm của nó, lộ trình cho MUM cũng như những gì Google đang làm để đảm bảo rằng công nghệ được áp dụng có trách nhiệm.

MUM, cột mốc mới nhất của Google về hiểu ngôn ngữ

Thật dễ dàng để phân loại MUM là BERT phiên bản nâng cao hơn , đặc biệt là vì Google đang coi nó như một cột mốc quan trọng tương tự để hiểu ngôn ngữ và chào hàng nó là mạnh hơn nhiều so với BERT. Trong khi cả hai đều dựa trên công nghệ biến áp và MUM có khả năng hiểu ngôn ngữ BERT được tích hợp trong nó, MUM dựa trên một kiến ​​trúc khác ( kiến trúc T5 ) và về cơ bản có nhiều khả năng hơn.

Đào tạo trên nhiều ngôn ngữ hơn giúp quy mô học tập. “[MUM] được đào tạo đồng thời trên 75 ngôn ngữ,” Nayak nói, “Điều này thật tuyệt vì nó cho phép chúng tôi tổng quát hóa từ các ngôn ngữ giàu dữ liệu sang các ngôn ngữ có ít dữ liệu.” Điều này có thể có nghĩa là các ứng dụng của MUM có thể dễ dàng chuyển sang nhiều ngôn ngữ hơn. Nếu điều đó đúng, nó có thể giúp củng cố Google Tìm kiếm ở những thị trường đó.

MUM không giới hạn ở văn bản. Một điểm khác biệt nữa là MUM là đa phương thức, có nghĩa là khả năng của nó không giới hạn ở văn bản, nó cũng có thể sử dụng video và hình ảnh làm đầu vào. “Hãy tưởng tượng bạn chụp ảnh đôi ủng đi bộ đường dài và hỏi ‘Tôi có thể sử dụng chúng để đi bộ đường dài Mt. Fuji? ‘”Prabhakar Raghavan, SVP tại Google, cho biết như một ví dụ giả định trong buổi giới thiệu MUM tại Google I / O ,“ MUM sẽ có thể hiểu nội dung của hình ảnh và ý định đằng sau truy vấn của bạn. ”

Đa nhiệm cũng tạo điều kiện cho việc học tập được mở rộng. Nayak nói: “Về bản chất, MUM cũng đa nhiệm. Các tác vụ ngôn ngữ tự nhiên mà nó có thể xử lý bao gồm (nhưng không giới hạn) các trang xếp hạng cho một truy vấn cụ thể, xem xét tài liệu và trích xuất thông tin. MUM có thể xử lý nhiều nhiệm vụ theo hai cách: Về phía đào tạo và về phía sử dụng.

Nayak giải thích: “Bằng cách đào tạo nó trên nhiều nhiệm vụ, những khái niệm đó đang được học để trở nên mạnh mẽ và tổng quát hơn,“ Nghĩa là, chúng áp dụng trên nhiều nhiệm vụ thay vì chỉ được áp dụng cho một nhiệm vụ duy nhất và dễ hỏng khi áp dụng cho một nhiệm vụ khác bài tập.”

Về mặt sử dụng, Google không hình dung MUM ra mắt như một tính năng đơn lẻ hoặc khởi chạy trong tìm kiếm: “Chúng tôi nghĩ về nó như một nền tảng mà trên đó các nhóm khác nhau có thể tạo ra các trường hợp sử dụng khác nhau,” Nayak nói và nói thêm, “Ý tưởng là rằng trong vài tháng tới, chúng ta sẽ thấy nhiều, nhiều nhóm trong phạm vi tìm kiếm sử dụng MUM để cải thiện bất kỳ nhiệm vụ nào họ đang làm để giúp tìm kiếm và ví dụ vắc xin COVID là một ví dụ thực sự tốt về điều đó. “

Lộ trình của Google cho MUM

Hiện tại chúng ta đang ở đâu, trong ngắn hạn. Các mục tiêu ngắn hạn của Google cho MUM chủ yếu tập trung vào việc chuyển giao kiến ​​thức qua các ngôn ngữ. Ứng dụng công khai đầu tiên của MUM, trong đó nó đã xác định 800 biến thể của tên vắc xin trên 50 ngôn ngữ chỉ trong vài giây, là một đại diện tốt cho giai đoạn triển khai này. Điều quan trọng cần lưu ý là Google đã có một tập hợp con tên vắc-xin COVID sẽ kích hoạt trải nghiệm vắc-xin COVID trong kết quả tìm kiếm, nhưng MUM cho phép nó nhận được một bộ tên vắc-xin lớn hơn nhiều, điều này cho phép kết quả tìm kiếm kích hoạt trong nhiều tình huống hơn , khi thích hợp.

Và, là một phần của giai đoạn ngắn hạn này, các nhóm trong Google đã bắt đầu kết hợp MUM vào các dự án của họ, “Chúng tôi có hàng chục nhóm đang thử nghiệm với MUM ngay bây giờ, nhiều người trong số họ đang tìm thấy tiện ích tuyệt vời trong những gì họ đang thấy tại đây, ”Nayak nói và từ chối cung cấp thêm chi tiết cụ thể vào thời điểm này.

Các tính năng đa phương thức được lên kế hoạch cho tương lai trung hạn. “Về trung hạn, chúng tôi nghĩ rằng đa phương thức là nơi hành động – đó sẽ giống như một khả năng tìm kiếm mới mà chúng tôi chưa có trước đây,” Nayak nói, mở rộng về ví dụ tìm kiếm hình ảnh mà Prabhakar Raghavan lần đầu tiên sử dụng tại Google I. / O.

Trong tầm nhìn của Nayak về MUM trong tìm kiếm, anh ấy mô tả một giao diện trong đó người dùng có thể tải lên hình ảnh và đặt câu hỏi văn bản về những hình ảnh đó. Thay vì trả lại một câu trả lời đơn giản có thể dẫn đến tìm kiếm bằng không nhấp chuột , Nayak thấy Google trả về các kết quả có liên quan, thu hẹp khoảng cách giữa hình ảnh được tải lên và truy vấn của người dùng.

Mặc dù các thử nghiệm của Google với MUM đã truyền cảm hứng cho sự tự tin, Nayak muốn nhấn mạnh rằng việc thực hiện chính xác các mục tiêu “trung hạn” này, cùng với bất kỳ mốc thời gian cụ thể nào, là không chắc chắn.

Kết nối các dấu chấm cho người dùng về lâu dài. “Về lâu dài, chúng tôi nghĩ rằng lời hứa của MUM thực sự bắt nguồn từ khả năng hiểu ngôn ngữ ở mức độ sâu hơn nhiều,” Nayak nói và nói thêm, “Tôi nghĩ nó sẽ hỗ trợ hiểu biết thông tin sâu hơn và chúng tôi hy vọng có thể để chuyển đổi sự hiểu biết thông tin sâu sắc hơn đó thành trải nghiệm mạnh mẽ hơn cho người dùng của chúng tôi. ”

Ở trạng thái hiện tại, các công cụ tìm kiếm phải vật lộn để hiển thị các kết quả có liên quan cho một số truy vấn cụ thể và phức tạp, chẳng hạn như “Tôi đã đi bộ đường dài trên Núi Adams và tôi muốn đi bộ đường dài trên Núi Phú Sĩ vào mùa thu tới. Tôi nên làm gì khác đi để chuẩn bị? ” “Hôm nay, nếu [một người dùng] vừa đi vừa gõ truy vấn đó vào Google, thì rất có thể nó sẽ không đưa ra bất kỳ kết quả hữu ích nào. . . vì vậy những gì bạn sẽ phải làm là chia nó thành các truy vấn riêng lẻ mà bạn có thể sắp xếp thăm dò xung quanh và nhận được kết quả và ghép nó lại với nhau cho chính bạn – chúng tôi nghĩ MUM có thể giúp ở đây, ”Nayak nói.

Tiếp tục với ví dụ đi bộ đường dài ở trên, “Chúng tôi nghĩ MUM có thể lấy một đoạn văn bản [truy vấn tìm kiếm] như vậy, đó là nhu cầu thông tin phức tạp này và chia nó thành các loại nhu cầu thông tin riêng lẻ này,” ông nói, gợi ý rằng MUM’s khả năng hiểu ngôn ngữ có thể giúp Google cung cấp các kết quả liên quan đến đào tạo thể dục, Mt. Địa hình, khí hậu của Phú Sĩ, v.v.

“Hãy nhớ rằng chúng tôi không làm điều này vì đây là lâu dài, nhưng đây chính xác là loại điều bạn đang làm trong đầu khi bạn đưa ra các truy vấn riêng lẻ và chúng tôi nghĩ MUM có thể giúp chúng tôi tạo ra các truy vấn như này, ”anh ấy nói,“ Bạn có thể tưởng tượng chúng tôi có thể đưa ra nhiều truy vấn như thế này, cho bạn kết quả cho chúng, có thể đưa vào một số văn bản kết nối tất cả những điều này với câu hỏi ban đầu, phức tạp hơn mà bạn có – về cơ bản sắp xếp thông tin này. . . cho thấy kết nối là gì, vì vậy bây giờ bạn có thể truy cập và đọc bài viết về thiết bị tốt nhất cho Mt. Fuji hoặc các mẹo để đi bộ đường dài theo độ cao hoặc tương tự như vậy theo cách phong phú hơn này. “

Nayak giải thích, một trong những lý do tại sao đây là một mục tiêu dài hạn là vì nó đòi hỏi phải suy nghĩ lại về lý do tại sao mọi người đến với Google với nhu cầu phức tạp hơn là các truy vấn riêng lẻ. Google cũng sẽ phải chuyển đổi nhu cầu phức tạp, được thể hiện bằng cụm từ tìm kiếm của người dùng, thành một tập hợp con các truy vấn và kết quả cho những truy vấn đó sẽ phải được tổ chức một cách thích hợp.

Ai đang thúc đẩy sự phát triển? Khi được hỏi về việc ai sẽ chỉ đạo sự phát triển và triển khai của MUM, Nayak giải thích rằng Google đang hướng tới việc phát triển những trải nghiệm tìm kiếm mới lạ nhưng cũng cho phép các nhóm riêng lẻ sử dụng nó cho các dự án của riêng họ.

“Chúng tôi hoàn toàn mong đợi nhiều nhóm trong lĩnh vực tìm kiếm sử dụng MUM theo những cách mà chúng tôi thậm chí còn chưa hình dung ra,” ông nói, “Nhưng chúng tôi cũng nỗ lực để có những trải nghiệm tìm kiếm mới, mới lạ và chúng tôi có những người điều tra khả năng xây dựng những trải nghiệm mới này. ” “Điều rõ ràng đối với tất cả mọi người, cả những đội hiện tại và những đội đang nhìn vào những trải nghiệm mới lạ, là hệ thống cơ sở dường như cực kỳ mạnh mẽ và thể hiện rất nhiều hứa hẹn. Bây giờ, chúng tôi tùy thuộc vào việc chuyển đổi lời hứa đó thành trải nghiệm tìm kiếm tuyệt vời cho người dùng của chúng tôi – đó là thách thức hiện nay, ”ông nói thêm.

MUM sẽ không chỉ là một “hệ thống trả lời câu hỏi”. “Ý tưởng này cho rằng có thể MUM sẽ trở thành một hệ thống trả lời câu hỏi – nghĩa là bạn đến với Google với một câu hỏi và chúng tôi chỉ cung cấp cho bạn câu trả lời – Tôi ở đây để nói với bạn rằng đó hoàn toàn không phải là tầm nhìn của MUM, Nayak nói, “Và lý do rất đơn giản: một hệ thống trả lời câu hỏi cho những nhu cầu phức tạp mà con người có chỉ là không hữu ích.”

Nayak đã đối chiếu các truy vấn mục đích phức tạp mà MUM cuối cùng có thể giúp người dùng điều hướng bằng các tìm kiếm đơn giản hơn, khách quan hơn thường được giải quyết ngay trên trang kết quả tìm kiếm: “Tôi hoàn toàn hiểu nếu bạn hỏi một câu hỏi đơn giản, [ví dụ:]” Tốc độ ánh sáng là gì? ” rằng nó xứng đáng có một câu trả lời đơn giản, dễ hiểu, nhưng hầu hết các nhu cầu mà mọi người có – ví dụ đi bộ đường dài này hoặc bạn muốn tìm trường học cho con mình hoặc bạn đang tìm hiểu khu phố mình muốn sống – bất kỳ loại mục đích thậm chí phức tạp vừa phải chỉ là không hài lòng lắm bởi một câu trả lời ngắn gọn, rõ ràng, ”ông nói.

“Bạn có thể đã nghe thống kê rằng mỗi năm kể từ khi bắt đầu thành lập Google, chúng tôi đã gửi nhiều lưu lượng truy cập đến trang web mở hơn năm trước – chúng tôi hoàn toàn mong đợi MUM sẽ tiếp tục xu hướng này,” ông nhắc lại và nói thêm, “Có không có kỳ vọng rằng nó sẽ trở thành hệ thống trả lời câu hỏi này. ”

Giảm thiểu chi phí và rủi ro khi phát triển MUM

Việc phát triển các mô hình tìm kiếm có thể có tác động đến sinh thái và yêu cầu bộ dữ liệu lớn. Google cho biết họ nhận thức được những cân nhắc này và đang thực hiện các biện pháp phòng ngừa để áp dụng MUM một cách có trách nhiệm.

Hạn chế sự sai lệch tiềm ẩn trong dữ liệu đào tạo. Nayak cho biết: “Những mô hình này có thể học hỏi và duy trì những sai lệch trong dữ liệu đào tạo theo những cách không tốt nếu có những thành kiến ​​không mong muốn dưới bất kỳ hình thức nào,” Nayak nói và cho biết thêm rằng Google đang giải quyết vấn đề này bằng cách giám sát dữ liệu mà MUM được đào tạo.

“Chúng tôi không đào tạo MUM trên toàn bộ kho dữ liệu web, chúng tôi đào tạo nó trên một tập hợp con chất lượng cao của kho dữ liệu web để tất cả những thành kiến ​​không mong muốn trong nội dung chất lượng thấp, trong nội dung người lớn và nội dung tục tĩu, nó thậm chí không có một cơ hội để học những điều đó vì chúng tôi thậm chí không trình bày nội dung đó cho MUM, ”ông nói, thừa nhận rằng ngay cả nội dung chất lượng cao cũng có thể chứa những thành kiến ​​mà quy trình đánh giá của công ty cố gắng lọc ra.

Đánh giá nội bộ. “Khi chúng tôi ra mắt BERT cách đây một năm rưỡi, chúng tôi đã thực hiện một lượng đánh giá chưa từng có trong nhiều tháng trước khi ra mắt chỉ để đảm bảo rằng không có bất kỳ mô hình liên quan nào,” Nayak nói, “Và bất kỳ mô hình liên quan nào mà chúng tôi đã phát hiện ở đó, chúng tôi đã thực hiện các bước để giảm thiểu – tôi hoàn toàn mong đợi rằng, trước khi chúng tôi có một lần ra mắt MUM trong tìm kiếm đáng kể, chúng tôi sẽ thực hiện một lượng đánh giá đáng kể theo cách tương tự để tránh bất kỳ loại mô hình liên quan nào. ”

Giải quyết các chi phí sinh thái. Các mô hình lớn có thể tốn kém và tiêu tốn nhiều năng lượng để xây dựng , có thể dẫn đến tác động bất lợi đến môi trường.

“Nhóm nghiên cứu của chúng tôi gần đây đã đưa ra một bài báo khá toàn diện và thú vị về tác động khí hậu của nhiều mô hình lớn khác nhau do nhóm nghiên cứu của chúng tôi xây dựng, cũng như một số mô hình được xây dựng bên ngoài nó, chẳng hạn như GPT-3, và bài báo. . . chỉ ra rằng, dựa trên sự lựa chọn cụ thể về mô hình, bộ xử lý và trung tâm dữ liệu được sử dụng, tác động carbon có thể giảm đến một nghìn lần “, Nayak nói và nói thêm rằng Google đã trung lập carbon kể từ năm 2007,” Vì vậy, bất cứ điều gì năng lượng đang được sử dụng, tác động carbon đã được giảm thiểu chỉ nhờ Google. ”

MUM có tiềm năng, bây giờ chúng ta chờ xem Google sử dụng nó như thế nào

Bình luận của Nayak về tương lai của MUM và việc anh ta không lường trước được việc nó trở thành một “hệ thống trả lời câu hỏi” là rất quan trọng bởi vì Google đang thừa nhận mối quan tâm của nhiều nhà tiếp thị tìm kiếm – nhưng, đó cũng là mối lo ngại đối với các nhà quản lý tìm cách đảm bảo rằng Google không không ưu tiên một cách không công bằng các sản phẩm của chính mình hơn các sản phẩm của các đối thủ cạnh tranh.

Có thể các công cụ tìm kiếm khác cũng đang phát triển các công nghệ tương tự, như chúng ta đã thấy với Bing và việc triển khai BERT của nó gần sáu tháng trước Google . Hiện tại, Google dường như là công ty đầu tiên xuất hiện và với hiệu quả thể hiện trong chuyến đi chơi đầu tiên của MUM , đó có thể là một lợi thế giúp bảo toàn thị phần của công ty.

Lộ trình của Google cho MUM cung cấp cho các nhà tiếp thị bối cảnh và nhiều khả năng để xem xét, nhưng tại thời điểm này, không có gì là đủ chắc chắn để bắt đầu chuẩn bị. Tuy nhiên, điều chúng ta có thể mong đợi là nếu công nghệ được triển khai và giống với các ví dụ mà Google đã cho chúng ta thấy, thì cách người dùng tìm kiếm có thể thích ứng để tận dụng các tính năng đó. Sự thay đổi trong hành vi tìm kiếm cũng có nghĩa là các nhà tiếp thị sẽ phải xác định các cơ hội mới trong việc tìm kiếm và điều chỉnh các chiến lược của họ, điều này tương đương với tất nhiên trong ngành này.

Back to Blog
.
.
.
.