Microsoft hôm thứ Hai công bố bản cập nhật lớn cho Microsoft 365 Copilot, đồng loạt ra mắt hai tính năng đột phá: khung nghiên cứu đa mô hình tích hợp GPT và Claude, và tác nhân thông minh Copilot Cowork có khả năng tự động theo dõi các tác vụ kéo dài thời gian. Cả hai đều được mở cho người dùng đặc biệt thông qua Chương trình Trải nghiệm sớm Frontier.
Cạnh tranh AI nghiên cứu chuyên sâu đang rất gay gắt, Microsoft tung ra chiến lược xuyên mô hình
Trong một năm qua, nghiên cứu chuyên sâu (Deep research) đã trở thành một trong những “chiến trường” cạnh tranh khốc liệt nhất trong lĩnh vực AI. Google đi đầu khi ra mắt tính năng tác nhân nghiên cứu cho Gemini, OpenAI sau đó phát hành phiên bản của riêng mình, xAI và Perplexity cũng lần lượt theo sau; Claude của Anthropic thậm chí còn tích lũy được danh tiếng trong nhóm người dùng chuyên nghiệp.
Không công ty nào không nỗ lực thuyết phục người dùng rằng mô hình đơn lẻ của họ mới là nhà nghiên cứu AI thông minh nhất. Thế nhưng Microsoft lại đi ngược lại, đặt câu hỏi ngược: “Tại sao phải chỉ chọn một mô hình?”
Hầu hết mọi công cụ nghiên cứu AI hiện nay gần như đều có quy trình “người dùng đặt câu hỏi → một mô hình đơn lẻ chịu trách nhiệm lập kế hoạch tìm kiếm → rà soát nguồn dữ liệu → viết báo cáo”. Vì quy trình do một mô hình duy nhất thực hiện từ đầu đến cuối, nên dễ dẫn đến ảo giác (hallucination), trích dẫn sai, các tuyên bố giả mạo hoặc không chính xác.
Hai tính năng nghiên cứu mới của Microsoft chính là giải pháp được thiết kế để khắc phục điểm yếu đó.
Critique: cơ chế rà soát, nơi GPT tạo ra còn Claude kiểm chứng
Tính năng đầu tiên có tên Critique. Ý tưởng cốt lõi của nó là tách quy trình nghiên cứu thành hai phần: khâu tạo ra và khâu đánh giá do các mô hình khác nhau phụ trách, đồng thời đưa vào một cơ chế tương tự “phản biện đồng cấp” (peer review).
Cụ thể, GPT đảm nhận việc lên hướng nghiên cứu, tìm kiếm dữ liệu, tổng hợp nguồn và viết bản nháp; sau khi hoàn thành, Claude sẽ lần lượt kiểm tra báo cáo theo nhiều khía cạnh như độ tin cậy của nguồn, mức độ đầy đủ của báo cáo, căn cứ sự thật… và nâng cao chất lượng báo cáo. Cuối cùng, phiên bản đã được chỉnh sửa mới được giao cho người dùng. Microsoft cho biết trong tương lai họ cũng lên kế hoạch hỗ trợ cấu hình ngược lại, tức là Claude tạo còn GPT thẩm định.
Về hiệu suất thử nghiệm, Critique cho thấy kết quả rất ấn tượng. Chẳng hạn, với bài kiểm tra chuẩn DRACO bao phủ mười lĩnh vực như y tế, pháp lý, công nghệ và tổng cộng 100 tác vụ nghiên cứu phức tạp, Copilot Researcher tích hợp Critique đạt 57.4 điểm, trong khi Claude Opus 4.6 làm độc lập đạt 42.7 điểm—mức chênh lệch gần 14%.
Council: so sánh đối chiếu GPT và Claude, mô hình “phán quyết” đánh giá
Tính năng thứ hai, Council, lại áp dụng một chiến lược hoàn toàn khác. Khi bật, GPT và Claude sẽ đồng thời, mỗi bên độc lập hoàn thành một báo cáo nghiên cứu hoàn chỉnh. Hai báo cáo được hiển thị song song cho người dùng, giúp người dùng thấy rõ sự khác biệt về trích dẫn sự kiện, góc nhìn phân tích và cách diễn giải dữ liệu giữa các mô hình khác nhau.
Sau khi hoàn tất, một “mô hình trọng tài” thứ ba sẽ đọc hai báo cáo, tổng hợp thành một bản tóm tắt hợp nhất, nêu rõ điểm hai bên đồng thuận, bất đồng và những chỗ có thể bổ sung cho nhau.
Copilot Cowork: bạn giao nhiệm vụ, AI tự chạy xong
Cùng lúc đó, Microsoft cũng công bố việc ra mắt tính năng Copilot Cowork được kỳ vọng từ lâu. Với vai trò là một tác nhân thông minh có thể tự vận hành trong hệ sinh thái Microsoft 365, Cowork được thiết kế dành riêng cho các quy trình làm việc doanh nghiệp mang tính “thực thi dài thời gian, nhiều bước”.
Người dùng chỉ cần nêu mục tiêu nhiệm vụ, Cowork sẽ chủ động theo dõi tiến độ, lên kế hoạch cho bước tiếp theo và tiếp tục triển khai, không cần người dùng phải theo sát toàn bộ. Đối với các dự án phức tạp cần hàng giờ thậm chí vài ngày để hoàn thành, Cowork giúp người dùng yên tâm “giao là làm”, biến nó thành một người bạn đồng hành đáng tin cậy trong công việc.
Ai có thể sử dụng Copilot Cowork, Critique và Council?
Hiện tại, Critique, Council và Copilot Cowork đều được mở thông qua Chương trình Trải nghiệm sớm của Microsoft Frontier. Frontier là kênh trải nghiệm sớm mà Microsoft dành cho khách hàng doanh nghiệp. Người dùng cần đăng ký trả phí Microsoft 365 Copilot và đồng thời tham gia chương trình Frontier.
Critique tự động bật ở chế độ “Auto”; còn Council cần thủ công chuyển sang “Model Council” trong bộ chọn mô hình.
Microsoft đặt cược không phải vào mô hình, mà vào điều phối AI và năng lực tự chủ
Dù Microsoft và OpenAI có quan hệ hợp tác lâu dài, nhưng Microsoft vẫn chọn đưa Claude vào, phản ánh một phán đoán chiến lược sâu hơn: không có bất kỳ mô hình AI đơn lẻ nào có thể duy trì vị trí dẫn đầu mãi mãi.
Đối với các công ty đang đánh giá các công cụ AI cấp doanh nghiệp, việc Microsoft tung ra hàng loạt tính năng lần này có lẽ đang đồng thời định nghĩa lại vai trò của “người bạn đồng hành AI”: người đồng nghiệp AI mạnh nhất không bao giờ chỉ là một mô hình đơn lẻ, mà là một hệ thống có thể để các mô hình tốt nhất đảm nhận đúng phần việc của mình và tiếp tục làm việc khi bạn không có mặt.
Bài viết này về việc Copilot Cowork của Microsoft ra mắt, tính năng mới giúp GPT và Claude cùng thẩm tra lẫn nhau, lần đầu tiên xuất hiện trên Chuỗi tin ABMedia.