Chuyển tiêu đề gốc ‘Tiêu chuẩn USB-C của AI: Hiểu rõ về MCP’
Trong những năm làm việc tại Alliance, tôi đã chứng kiến vô số nhà sáng lập xây dựng các công cụ chuyên biệt của riêng họ và tích hợp dữ liệu vào các đại lý trí tuệ nhân tạo và quy trình làm việc của họ. Tuy nhiên, những thuật toán, hình thức hóa và bộ dữ liệu độc đáo này bị khóa lại sau các tích hợp tùy chỉnh mà ít người sẽ sử dụng.
Điều này đã thay đổi nhanh chóng với sự xuất hiện của Giao thức Ngữ cảnh Mô hình. MC được định nghĩa là một giao thức mở chuẩn hóa cách ứng dụng giao tiếp và cung cấp bối cảnh cho LLM. Một phép so sánh mà tôi thực sự thích là “MC cho các ứng dụng AI giống như USB-C cho phần cứng”; đó là chuẩn hóa, cắm và chạy, linh hoạt và đổi mới.
Các hệ thống dự đoán ngôn ngữ như Claude, OpenAI, LLAMA, v.v. rất mạnh mẽ, nhưng chúng bị hạn chế bởi thông tin mà chúng có thể truy cập vào lúc này. Điều đó có nghĩa là chúng thường có rào cản tri thức, không thể duyệt web độc lập và không có quyền truy cập trực tiếp vào các tập tin cá nhân của bạn hoặc các công cụ chuyên biệt mà không có hình thức tích hợp nào đó.
Đặc biệt, trước đây, các nhà phát triển đối mặt với ba thách thức lớn khi kết nối LLMs với dữ liệu và công cụ bên ngoài:
MC giải quyết những vấn đề này bằng cách cung cấp một cách tiêu chuẩn cho bất kỳ LLM nào để truy cập an toàn vào các công cụ bên ngoài và nguồn dữ liệu thông qua một giao thức chung. Bây giờ chúng ta hiểu MCP hoạt động như thế nào, hãy xem những gì mà mọi người đang xây dựng với nó.
Hệ sinh thái MCP hiện đang phát triển mạnh mẽ với sự đổi mới. Dưới đây là một số ví dụ gần đây mà tôi tìm thấy trên Twitter, các nhà phát triển đang giới thiệu công việc của họ.
Điều làm cho những ví dụ này đặc biệt hấp dẫn là sự đa dạng của chúng. Trong một thời gian ngắn kể từ khi được giới thiệu, các nhà phát triển đã tạo ra các tích hợp bao gồm sản xuất truyền thông sáng tạo, nền tảng giao tiếp, kiểm soát phần cứng, dịch vụ vị trí và công nghệ blockchain. Tất cả những ứng dụng đa dạng này đều tuân theo cùng một giao thức chuẩn, chứng minh tính linh hoạt và tiềm năng của MCP để trở thành tiêu chuẩn phổ quát cho tích hợp công cụ AI.
Để có một bộ sưu tập toàn diện các máy chủ MC, hãy kiểm trakho lưu trữ chính thức của máy chủ MCP trên GitHub. Với một lời từ chối cẩn thận, trước khi sử dụng bất kỳ máy chủ MC nào, hãy cẩn thận với những gì bạn đang chạy và cấp quyền cho.
Với bất kỳ công nghệ mới nào, việc đặt câu hỏi: Liệu MCP có thực sự mang tính chuyển đổi, hay chỉ là một công cụ được quảng bá quá mức sẽ phai nhạt?
Sau khi xem xét nhiều startup trong lĩnh vực này, tôi tin rằng MCP đại diện cho một điểm phát triển thực sự cho sự phát triển của trí tuệ nhân tạo. Khác với nhiều xu hướng hứa hẹn cách mạng nhưng chỉ mang lại sự thay đổi gia tăng, MCP là một đòn bẩy sản xuất giúp giải quyết một vấn đề cơ sở hạ tầng căn bản đã ngăn chặn toàn bộ hệ sinh thái.
Điều làm cho nó đặc biệt có giá trị là nó không cố gắng thay thế các mô hình AI hiện có hoặc cạnh tranh với chúng, thay vào đó, nó làm cho chúng trở nên hữu ích hơn bằng cách kết nối chúng với các công cụ bên ngoài và dữ liệu mà chúng cần.
Tuy nói vậy, vẫn có những lo ngại hợp lệ về bảo mật và tiêu chuẩn. Như bất kỳ giao thức nào ở giai đoạn đầu của mình, chúng ta có thể thấy những khó khăn khi cộng đồng làm việc để xác định các quy tắc tốt nhất về kiểm toán, quyền hạn, xác thực và xác minh máy chủ. Nhà phát triển cần tin tưởng vào tính năng của các máy chủ MCP này và không nên tin tưởng mù quáng vào chúng, đặc biệt khi chúng trở nên phong phú.Bài viết này thảo luận về một số lỗ hổng gần đây bị phơi bày bởi mù bằng cách sử dụng các máy chủ MCP chưa được kiểm tra cẩn thận, ngay cả khi bạn đang chạy nó cục bộ.
Các ứng dụng trí tuệ nhân tạo mạnh nhất sẽ không đứng một mình mà là các hệ sinh thái của các khả năng chuyên biệt kết nối thông qua các giao thức chuẩn hóa như MCP. Đối với các công ty khởi nghiệp, MCP đại diện cho cơ hội để xây dựng các thành phần chuyên biệt phù hợp với các hệ sinh thái đang phát triển này. Đó là cơ hội để tận dụng kiến thức và khả năng độc đáo của bạn trong khi hưởng lợi từ các khoản đầu tư lớn vào các mô hình nền tảng.
Nhìn về tương lai, chúng ta có thể mong đợi MCP sẽ trở thành một phần cốt lõi của cơ sở hạ tầng AI, giống như HTTP đã trở thành cho web. Khi giao thức trở nên chín muồi và việc áp dụng tăng lên, chúng ta có thể thấy xuất hiện toàn bộ các thị trường của các máy chủ MCP chuyên biệt, cho phép các hệ thống AI tiếp cận bất kỳ khả năng hoặc nguồn dữ liệu nào một cách tưởng tượng.
Đối với những người quan tâm đến việc hiểu cách MC thực sự hoạt động dưới bề mặt, phần phụ lục sau cung cấp một phân tích kỹ thuật về kiến trúc, quy trình làm việc và triển khai của nó.
Tương tự như cách HTTP chuẩn hóa cách mà web truy cập nguồn dữ liệu và thông tin bên ngoài, MCP làm điều đó đối với các khung công cụ AI, tạo ra một ngôn ngữ chung cho phép các hệ thống AI khác nhau giao tiếp một cách liền mạch. Vì vậy, hãy khám phá cách nó làm điều đó.
Kiến trúc và Luồng MCP
Kiến trúc chính tuân theo mô hình máy khách-máy chủ với bốn thành phần chính hoạt động cùng nhau:
Vì vậy bây giờ chúng ta đã thảo luận về các thành phần, hãy xem cách chúng tương tác trong một quy trình làm việc điển hình:
Điều khiến kiến trúc này mạnh mẽ là mỗi Máy chủ MCP chuyên về một lĩnh vực cụ thể nhưng sử dụng một giao thức truyền thông chuẩn. Vì vậy thay vì phải xây dựng lại tích hợp cho từng nền tảng, các nhà phát triển chỉ cần tập trung vào việc phát triển công cụ một lần cho toàn bộ hệ sinh thái trí tuệ nhân tạo của họ.
Bây giờ hãy xem cách triển khai một máy chủ MCP đơn giản trong vài dòng mã bằng cách sử dụng SDK MCP.
Trong ví dụ đơn giản này, chúng tôi muốn mở rộng khả năng của Claude Desktop để có thể trả lời câu hỏi như “Có những quán cà phê nào gần Central Park không?” từ Google Maps. Bạn có thể dễ dàng mở rộng điều này để lấy đánh giá hoặc xếp hạng. Nhưng hiện tại, hãy tập trung vào công cụ MCP tool find_nearby_places sẽ cho phép Claude lấy thông tin này trực tiếp từ Google Maps và trình bày kết quả một cách trò chuyện.
Như bạn có thể thấy, mã này thực sự đơn giản. 1) Nó chuyển đổi truy vấn thành tìm kiếm API bản đồ Google và 2) trả về kết quả hàng đầu dưới dạng cấu trúc. Do đó, thông tin được truyền lại cho LLM để đưa ra quyết định tiếp theo.
Bây giờ chúng ta cần phải cho phép Claude Desktop biết về công cụ này, vì vậy chúng ta đăng ký nó trong tệp cấu hình của nó như sau.
Và đây, bạn đã hoàn thành. Bây giờ bạn chỉ cần mở rộng Claude để tìm vị trí thời gian thực từ Google maps.
Chuyển tiêu đề gốc ‘Tiêu chuẩn USB-C của AI: Hiểu rõ về MCP’
Trong những năm làm việc tại Alliance, tôi đã chứng kiến vô số nhà sáng lập xây dựng các công cụ chuyên biệt của riêng họ và tích hợp dữ liệu vào các đại lý trí tuệ nhân tạo và quy trình làm việc của họ. Tuy nhiên, những thuật toán, hình thức hóa và bộ dữ liệu độc đáo này bị khóa lại sau các tích hợp tùy chỉnh mà ít người sẽ sử dụng.
Điều này đã thay đổi nhanh chóng với sự xuất hiện của Giao thức Ngữ cảnh Mô hình. MC được định nghĩa là một giao thức mở chuẩn hóa cách ứng dụng giao tiếp và cung cấp bối cảnh cho LLM. Một phép so sánh mà tôi thực sự thích là “MC cho các ứng dụng AI giống như USB-C cho phần cứng”; đó là chuẩn hóa, cắm và chạy, linh hoạt và đổi mới.
Các hệ thống dự đoán ngôn ngữ như Claude, OpenAI, LLAMA, v.v. rất mạnh mẽ, nhưng chúng bị hạn chế bởi thông tin mà chúng có thể truy cập vào lúc này. Điều đó có nghĩa là chúng thường có rào cản tri thức, không thể duyệt web độc lập và không có quyền truy cập trực tiếp vào các tập tin cá nhân của bạn hoặc các công cụ chuyên biệt mà không có hình thức tích hợp nào đó.
Đặc biệt, trước đây, các nhà phát triển đối mặt với ba thách thức lớn khi kết nối LLMs với dữ liệu và công cụ bên ngoài:
MC giải quyết những vấn đề này bằng cách cung cấp một cách tiêu chuẩn cho bất kỳ LLM nào để truy cập an toàn vào các công cụ bên ngoài và nguồn dữ liệu thông qua một giao thức chung. Bây giờ chúng ta hiểu MCP hoạt động như thế nào, hãy xem những gì mà mọi người đang xây dựng với nó.
Hệ sinh thái MCP hiện đang phát triển mạnh mẽ với sự đổi mới. Dưới đây là một số ví dụ gần đây mà tôi tìm thấy trên Twitter, các nhà phát triển đang giới thiệu công việc của họ.
Điều làm cho những ví dụ này đặc biệt hấp dẫn là sự đa dạng của chúng. Trong một thời gian ngắn kể từ khi được giới thiệu, các nhà phát triển đã tạo ra các tích hợp bao gồm sản xuất truyền thông sáng tạo, nền tảng giao tiếp, kiểm soát phần cứng, dịch vụ vị trí và công nghệ blockchain. Tất cả những ứng dụng đa dạng này đều tuân theo cùng một giao thức chuẩn, chứng minh tính linh hoạt và tiềm năng của MCP để trở thành tiêu chuẩn phổ quát cho tích hợp công cụ AI.
Để có một bộ sưu tập toàn diện các máy chủ MC, hãy kiểm trakho lưu trữ chính thức của máy chủ MCP trên GitHub. Với một lời từ chối cẩn thận, trước khi sử dụng bất kỳ máy chủ MC nào, hãy cẩn thận với những gì bạn đang chạy và cấp quyền cho.
Với bất kỳ công nghệ mới nào, việc đặt câu hỏi: Liệu MCP có thực sự mang tính chuyển đổi, hay chỉ là một công cụ được quảng bá quá mức sẽ phai nhạt?
Sau khi xem xét nhiều startup trong lĩnh vực này, tôi tin rằng MCP đại diện cho một điểm phát triển thực sự cho sự phát triển của trí tuệ nhân tạo. Khác với nhiều xu hướng hứa hẹn cách mạng nhưng chỉ mang lại sự thay đổi gia tăng, MCP là một đòn bẩy sản xuất giúp giải quyết một vấn đề cơ sở hạ tầng căn bản đã ngăn chặn toàn bộ hệ sinh thái.
Điều làm cho nó đặc biệt có giá trị là nó không cố gắng thay thế các mô hình AI hiện có hoặc cạnh tranh với chúng, thay vào đó, nó làm cho chúng trở nên hữu ích hơn bằng cách kết nối chúng với các công cụ bên ngoài và dữ liệu mà chúng cần.
Tuy nói vậy, vẫn có những lo ngại hợp lệ về bảo mật và tiêu chuẩn. Như bất kỳ giao thức nào ở giai đoạn đầu của mình, chúng ta có thể thấy những khó khăn khi cộng đồng làm việc để xác định các quy tắc tốt nhất về kiểm toán, quyền hạn, xác thực và xác minh máy chủ. Nhà phát triển cần tin tưởng vào tính năng của các máy chủ MCP này và không nên tin tưởng mù quáng vào chúng, đặc biệt khi chúng trở nên phong phú.Bài viết này thảo luận về một số lỗ hổng gần đây bị phơi bày bởi mù bằng cách sử dụng các máy chủ MCP chưa được kiểm tra cẩn thận, ngay cả khi bạn đang chạy nó cục bộ.
Các ứng dụng trí tuệ nhân tạo mạnh nhất sẽ không đứng một mình mà là các hệ sinh thái của các khả năng chuyên biệt kết nối thông qua các giao thức chuẩn hóa như MCP. Đối với các công ty khởi nghiệp, MCP đại diện cho cơ hội để xây dựng các thành phần chuyên biệt phù hợp với các hệ sinh thái đang phát triển này. Đó là cơ hội để tận dụng kiến thức và khả năng độc đáo của bạn trong khi hưởng lợi từ các khoản đầu tư lớn vào các mô hình nền tảng.
Nhìn về tương lai, chúng ta có thể mong đợi MCP sẽ trở thành một phần cốt lõi của cơ sở hạ tầng AI, giống như HTTP đã trở thành cho web. Khi giao thức trở nên chín muồi và việc áp dụng tăng lên, chúng ta có thể thấy xuất hiện toàn bộ các thị trường của các máy chủ MCP chuyên biệt, cho phép các hệ thống AI tiếp cận bất kỳ khả năng hoặc nguồn dữ liệu nào một cách tưởng tượng.
Đối với những người quan tâm đến việc hiểu cách MC thực sự hoạt động dưới bề mặt, phần phụ lục sau cung cấp một phân tích kỹ thuật về kiến trúc, quy trình làm việc và triển khai của nó.
Tương tự như cách HTTP chuẩn hóa cách mà web truy cập nguồn dữ liệu và thông tin bên ngoài, MCP làm điều đó đối với các khung công cụ AI, tạo ra một ngôn ngữ chung cho phép các hệ thống AI khác nhau giao tiếp một cách liền mạch. Vì vậy, hãy khám phá cách nó làm điều đó.
Kiến trúc và Luồng MCP
Kiến trúc chính tuân theo mô hình máy khách-máy chủ với bốn thành phần chính hoạt động cùng nhau:
Vì vậy bây giờ chúng ta đã thảo luận về các thành phần, hãy xem cách chúng tương tác trong một quy trình làm việc điển hình:
Điều khiến kiến trúc này mạnh mẽ là mỗi Máy chủ MCP chuyên về một lĩnh vực cụ thể nhưng sử dụng một giao thức truyền thông chuẩn. Vì vậy thay vì phải xây dựng lại tích hợp cho từng nền tảng, các nhà phát triển chỉ cần tập trung vào việc phát triển công cụ một lần cho toàn bộ hệ sinh thái trí tuệ nhân tạo của họ.
Bây giờ hãy xem cách triển khai một máy chủ MCP đơn giản trong vài dòng mã bằng cách sử dụng SDK MCP.
Trong ví dụ đơn giản này, chúng tôi muốn mở rộng khả năng của Claude Desktop để có thể trả lời câu hỏi như “Có những quán cà phê nào gần Central Park không?” từ Google Maps. Bạn có thể dễ dàng mở rộng điều này để lấy đánh giá hoặc xếp hạng. Nhưng hiện tại, hãy tập trung vào công cụ MCP tool find_nearby_places sẽ cho phép Claude lấy thông tin này trực tiếp từ Google Maps và trình bày kết quả một cách trò chuyện.
Như bạn có thể thấy, mã này thực sự đơn giản. 1) Nó chuyển đổi truy vấn thành tìm kiếm API bản đồ Google và 2) trả về kết quả hàng đầu dưới dạng cấu trúc. Do đó, thông tin được truyền lại cho LLM để đưa ra quyết định tiếp theo.
Bây giờ chúng ta cần phải cho phép Claude Desktop biết về công cụ này, vì vậy chúng ta đăng ký nó trong tệp cấu hình của nó như sau.
Và đây, bạn đã hoàn thành. Bây giờ bạn chỉ cần mở rộng Claude để tìm vị trí thời gian thực từ Google maps.